百度收录你的网页,是百度派出蜘蛛,把你的页面抓取到它的服务器里面。对了论坛,除了派出蜘蛛,百度还有一个《互联网论坛收录开放协议》:
《互联网论坛收录开放协议》是百度网页搜索制定的论坛内容收录标准,论坛网站可将论坛内发布的帖子制作成遵循此开放协议的 XML 格式的网页供搜索引擎索引,将论坛发布的帖子主动、及时地告知百度搜索引擎。采用了《互联网论坛收录开放协议》,就相当于论坛中的帖子被搜索引擎订阅,通过百度全球最大的中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到您网站论坛中的帖子,进而为您的网站带来潜在的流量。
还是举个例子吧,seo优化网(www.cuoXin.com),看看它的收录,site: www.cuoXin.com), 到 2010 年 3 月 5 号早上,收录了 6 万 8 千 9 百个页面,百度每天可以带来 4000 多个 IP。它的 sitemap 在这里(http://www.zz1.com.cn/sitemap_baidu.xml)。完全遵循了开放协议的内容:
下图为遵照《互联网论坛收录开放协议》制作的 XML 格式的网页,网页上按照标准格式列出了网站论坛发布的帖子的相关信息。 XML 标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
* <document>——标记整个 XML 文件内容的开始和结束。后面的" xmlns:bbs =" http://www.baidu.com/search/bbs_sitemap.xsd"是该 xml 文件遵守百度《互联网论坛收录开放协议》的声明,如没有该段声明,xml 文件不支持下面的<bbs:reply> 等语法。
*<webSite>——站点地址。
* <webMaster>——负责人员的 Email。当有必要时,我们通过这个地址与您联系。
* <updatePeri>——sitemap 更新周期,以小时为单位。搜索引擎将遵照此周期访问该页面,使页面上的内容更及时地被百度 spider 发现。
*<updatetime>——该 xml 文件最近一次的更新时间 。
* <version>——论坛所使用程序的版本。
* <item>——标记每个帖子信息的开始和结束,标记内为单个帖子信息。
* <link>——帖子的 url 地址,即帖子第一页的地址,请尽量去除 url 中不必要的参数。
<title>——帖子标题。
<pubDate>——帖子主贴的发布时间 。
<bbs:lastDate>——帖子最后一条回复的发布时间 。
<bbs:reply>——帖子总的回复数,不包括主贴。
<bbs:hit>——帖子总的查看次数。
<bbs:mainLen>——帖子主贴的长度,单位字节 。
<bbs:boardid>——帖子所在版面,提供版面的 id 。
<bbs:pick>——是否设为精华,精华标为 1 ,非精华标为 0 。
推荐时间格式:年月日小时分钟秒如:20051109 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 | 2005 年 11 月 09 日 10 时 37 分 00 秒 | Fri, 09 Nov 2005 10:37:00 GMT 。我们做好网站后,要到搜索引擎去提交网站,而这个协议的原理,等于提交每个帖子!
现在你明白了吧!我现在现在要做的,就是提交我们的帖子地址。当然,手工填写这个 sitemap,也是可以的,但是太费劲了。我就见过一个哥们手工填写,佩服啊。
seo优化网的sitemap是这样的,自动生成的,方便哦!http://www.cuoXin.com/data/sitemap.html
新闻热点
疑难解答