近日Google搜索质量组发布文章详细介绍了Google搜索引擎,动态、静态、伪静态网址的区别及利与弊。Google发布的文章可能是因为翻译的原因,加上很多问题不便言明,感觉是很模糊的。
动态、静态、伪静态
动态网址:内容存于数据库中,根据要求显示内容,URL中以 ? # & 显示不同的参数。
静态网址:纯静态HTML文档,能使用filetype:htm 查询到的网页。
伪静态网址:使用 Rewrite 将动态网址进行重写,使动态网址看起来像静态网址。
动态、静态、伪静态之间的利与弊
Google新的算法、机制出发,解说之间的利与弊,解释了一些错误的认识。
动态网址
第一,动态网址对于Google来说,“不能被抓取”的说法是错误的,Google能够很好的处理动态网址并顺利抓取;其次“参数不能超过3个”的说法也错误的,Google能够抓取参数超过3个的动态网址,但是为了避免URL太长应尽量减少参数。
第二,动态网址具有一定的优势,网址中的参数准确的告诉Google,此URL内容语言为cn、隶属于分类1、内容ID为2,更便于Google对内容的识别处理。
第三,动态网址尽量精简,特别是会话标识和查询参数,很容易造成大量相同页面。
静态网址
第一,静态网址具有绝对优势,/about.html可以很容易被理解,在搜索结果中获得的点击量较高。
第二,静态网址不一定是最好的网址,动态网址能够告诉Google可识别的参数,如果静态网址布置不够好或是过于扁平化,反而不如静态网址为Google提供的参考信息丰富。
第三,“更新此种类型网址的页面会耗费时间,特别是信息量增长迅速。因为每一个单独的页面必须要更改编译代码。”
伪静态网址
第一,伪静态网址不能让动态网址“静态化”,伪静态是对动态网址的一个重写,Google不会认为伪静态就是HTML文档。
第二,伪静态可取,但应把重心放在去除冗余参数、规范URL、尽可能的避免重复页上。
第三,伪静态有很大潜大危险,最好在对网站系统、网站结构、内容分布、参数意义熟悉的情况下使用。
在写伪静态规则时最好要保留有价值的参数,切忌不能把有价值的参数全部精简掉。
伪静态中一定不能包含会话标识和查询参数,,/product.asp?sid=98971298178906&id=1234 这样的动态网址,其中的sid本来Google能够识别并屏蔽,如果重写为 /product/98971298178906/1234,Google就无法识别,会造成无限重复页面。
新闻热点
疑难解答