首页 > 网站 > 优化推广 > 正文

蜘蛛日志分析你能做到多少

2024-04-26 13:52:44
字体:
来源:转载
供稿:网友

蜘蛛日志分析,蜘蛛抓取动态优化,那么网站日志分析能为SEOer带来什么?

日志是SEOer每天需要分析的基本技能,通过每日的日志分析从而了解蜘蛛动态,从而有效分辨蜘蛛爬行的页面有效性,通过日常分析蜘蛛返回状态吗,从而发现网站中是否存在错误,从而具有蜘蛛无法爬行到的页面,排除服务器错误、页面错误、噪音页面(重复页面,低质量页面,空内容页面,404页面,不排名页面等)此类页面,SEO从而针对其进行优化!

网站日志又称蜘蛛日志,它是成千上万个“蜘蛛”小爬虫程序每天爬行数千万个网站,这个小爬虫程序就是“蜘蛛”,它在网站爬行后留下的轨迹或痕迹就是“日志”。

常见的蜘蛛名称:

Baiduspider;Baiduspider-Image;Googlebot;Googlebot-Image;360Spider;sogou spider。

网站蜘蛛日志分析解读,SEO站长自查诊断

作为一名SEO爱好者,分析网站蜘蛛日志是必不可少的,通过网站日志中的数据记录,站长们就可以很好的诊断我们的网站是否处在健康状态。比如博主的网站最近就受到不少挂黑链的攻击,无论是网站权重还是流量都带来很大损失,所以网站蜘蛛日志分析势在必行,通过网站调整正确引导搜索引擎蜘蛛的抓取。

蜘蛛日志分析你能做到多少_www.cuoXin.com

蜘蛛日志分析​

什么是网站日志

通过百科我们也可以了解到,所谓的网站日志指的就是记录web服务器接收处理请求以及运行时错误等各种原始信息的以log结尾的文件。这里站长们要注意的是文件以log为后缀,只需将其下载下来使用工具分析即可。

网站日志怎么获取

不同的服务器和虚拟主机存放的log文件位置还是有一定差别的,但一般获取方法还是比较简单的,如博主服务器安装的是宝塔面板,网站日志文件存放在文件-wwwlogs文件夹中,找到对应网站的log文件然后下载下来。

网站日志分析工具

网站日志分析工具是有很多的,比如在线的网站日志工具拉格好另外博主常用的是光年网站日志分析工具。这些工具大同小异,文件和工具都有了,下面我们就深入探究下如何分析这些网站数据。

蜘蛛日志分析你能做到多少_www.cuoXin.com

常见网站蜘蛛有哪些

BaiDu Spider:即是代表百度搜索引擎蜘蛛,从上图可以看到尹华峰SEO博客的搜索引擎爬虫来自百度,占比52%

Sogou Spide:代表搜狗搜索引擎蜘蛛,访问次数虽少,但是抓取总量却很大,这让博主发现了其中的猫腻,原因就是本站某个栏目被人攻击,挂了大量给搜狗搜索引擎蜘蛛抓取的黑链。

谷歌蜘蛛:表示Google搜索引擎蜘蛛,做谷歌SEO的站长需要多加注意。

Alexa Spider:代表网站全球排名搜索引擎蜘蛛,该爬虫主要分析网站的访问流量,并统计网站全球排名,当前本站在全球排名610481位。

除此之外,其实还是有其他搜索引擎爬虫的,如Yahoo蜘蛛、360Spider等,以上只是本站的搜索引擎蜘蛛概要分析,因为刚换服务器的原因,目前蜘蛛抓爬的数据体量是比较小的,仅供参考。通过日志工具主动与搜索引擎蜘蛛沟通,我们还可以进一步分析网站抓取情况和状态码分析。

蜘蛛日志分析你能做到多少_www.cuoXin.com

网站蜘蛛日志分析解读

目录抓取:可以分析网站目录的抓取量,了解搜索引擎蜘蛛的爱好。通过上图可以看到Sogou Spide主要抓取了我的/kjzx/目录,同其他目录对比抓取量比较大,出现异常。于是我进入网站根目录进行查看,发现了挂黑链的脚本文件,这也印证了博主前面的判断。

页面抓取:页面抓取量是比较稳定的,没有哪个页面抓取量大而出现异常,这里博主就不再截图,但博主发现抓取量最大的页面就是robots.txt文件,所以站长们设置好robots规则也是很重要的。

蜘蛛日志分析你能做到多少_www.cuoXin.com

状态码返回分析解读

200代表搜索引擎蜘蛛访问成功;

404代表页面无法访问;

301代表页面跳转;

304代表客户端已经执行了GET,但文件未变化;

500状态码表示服务器遇到错误,无法完成请求;

403状态码表示服务器拒绝请求。

以上是本站遇到的一些蜘蛛状态码(更多状态码请参考:网站日志常见HTTP状态码分析),站长尤其是查看非200值的状态码,分析这些异常的URL路径,很容易就找到网站症结之所在。

网站日志的作用

网站日志分析对SEO站长来说应该是必备技能,无论是新站还是老站,网站日志分析都有很大的作用。通过日志分析了解网站蜘蛛抓取频次、是否被关进沙盒、网站是否被K、查找异常抓取等。

结语:通过网站蜘蛛日志分析,SEO站长可以很好自查诊断网站是否出现问题,不仅可以了解网站的健康状况,通过抓取量还可以进一步了解搜索引擎蜘蛛的爱好,清楚网站内容运营的重心之所在,也可以起到很好的指导作用。

总结:

所以不管是新站还是老网站,不管你做百度还是Google我们都能通过网站日志分析出来搜索引擎蜘蛛抓取的情况;如果网站长时间收录有问题,那么我们也可以对比网站日志中的搜索引擎蜘蛛行为,来了解网站是哪方面出了问题;如果网站被封,或者被K,我们都可以通过观察网站日志的情况来了解原因出在什么地方。我们要看的网站日志的分析和诊断就像给网站看病一样,我们通过网站日志的分析,可以简单明了的就知道网站的健康状况,可以利于我们更好的做网站优化,所以对于真正的SEO高手而言,分析蜘蛛日志是最直观,最有效的额。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表