网站中出现大量重复内容是百度被K的主要原因,但有的人并不知道什么是重复内容,也不知道怎样才能解决重复问题。重复内容不仅是网站本身出现相同的文章,其中还包括很多方面。
第一:网站内容重复
1、同样一篇文章出现多个URL。
2、网站内容很多都是采集,百度新绿萝算法就是专门打击采集站点的。
3、没有设置404错误页面,删除某一个页面时一定要使用404状态码给予用户和蜘蛛一定的提示,如果代码设置出现错误,那么蜘蛛就会多收录一次。
4、网站的固定版块出现太多次,网站的右侧总是固定放一些板块和栏目,而这些栏目也从来不更新或者每个页面都是前一篇内容,这样就会造成很多页面重复。
5、网站以图片为主缺少文字,大量图片使用同一个URL地址,这样就会造成蜘蛛在索引的时候被重复收录。
6、动态页面和静态页面共存,百度爬去目录时收录了大量动态页面。
第二:如何检查重复内容
1、title:+文章标题即可找出相同的文章
2、在文章中随机抽取一段,搜索一下如出现大量红色,就表明文章重复率高。
3、利用页面相似度检查工具,判断相邻页面的相似度。
第三:怎样删除重复内容
1、增加原创内容,对于很多采集的站点来说,最好是增加原创文章,宁愿让百度少收录一些,也能让百度K掉。
2、网站固定栏目内容随机展示,根据正文的网站关键词,可以随机调用右侧栏目的文章,让每个页面都有不同的内容这样可以避免重复。
3、设置网站404页面,提醒用户和搜索引擎哪些页面不存在了,并防止搜索引擎收录死链。
新闻热点
疑难解答