首页 > 网站 > 优化推广 > 正文

网络蜘蛛：深度优先还是广度优先

2024-04-26 13:42:19

字体：大中小

来源：转载

供稿：网友

"网络蜘蛛" 学名Spider,又叫"网络爬虫"! 关于网络蜘蛛的概述这里就不多讲了，今天我主要想说的是关于蜘蛛的爬行设计的方式与方法。

我们可以分为2种：

那么什么是深度优先? 什么是广度优先?有什么用? 上海SEO (SWJ) 下面为大家讲解！本人学知浅薄只会用通俗的话与道理与大家分析，如有错误请及时联系我所以还请大家多多见谅包含！

一种是深度优先策略，一种是广度优先策略! 以下我们就围绕这2点进行分析SWJ非常欢迎大家一起交流、学习与探讨!

深度优先顾名思义就是让网络蜘蛛尽量的在抓取网页时往网页更深层次的挖掘进去讲究的是深度!也泛指: 网络蜘蛛将会从起始页开始，一个链接一个链接跟踪下去，处理完这条线路之后再转入下一个起始页，继续跟踪链接!

以下我发张图大家看下: (下面这张是简单化的网页连接模型图其中A为起点也就是蜘蛛索引的起点!)

总共分了5条路径供蜘蛛爬行! 讲究的是深度!

点此在新窗口中查看原始图片

(下面这张是经过优化的网页连接模型图! 也就是改进过的蜘蛛深度爬行策略图!)

点此在新窗口中查看原始图片

根据以上2个表格我们可以得出以下结论:

图1:路径1 ==> A --> B --> E --> H 路径2 ==> A --> B --> E --> i

路径3 ==> A --> C 路径4 ==> A --> D --> F --> K --> L

路径5 ==> A --> D --> G --> K --> L

经过优化后

图2: (图片已经帮大家标上方向了!)

路径1 ==> A --> B --> E --> H 路径2 ==> i

路径3 ==> C 路径4 ==> D --> F --> K --> L 路径5 ==> G

深度爬行的优点是:网络蜘蛛程序在设计的时候相对比较轻易些把其他我也没发觉有什么优点... 还有就是蜘蛛的这种 "勇往直前"的精神值得学习下! ^_^

深度爬行的缺点是：缺点么多了一点点呵呵! 每次爬行一层总要向"蜘蛛老家" 数据库访问一下。问问老总有必要还要爬下一层吗! 爬一层问一次.... 引用一句高人的话假如一个蜘蛛不管3721不断往下爬很可能迷路更有可能爬到国外的网站去.. 本来目标是中文网站因为IP的问题国外IP做了中文站的话.... 就轻易去别人"老家"了..这样不仅增加了系统数据的复杂度更是增加的服务器的负担我想没有一家搜索公司会愿意则样的把,...除非脑子"秀"了 .. ^_^

接下来我们介绍下普遍使用的广度优先策略大家休息下喝杯咖啡看的也累把我写的也累.... ^^

广度优先在这里的定义就是层爬行。什么叫蜘蛛层爬行?就是一层一层的爬行按照层的分布与布局去索引处理与抓取网页! 当然SE不会派一个蜘蛛去的每层会派一个或多个蜘蛛Spider去抓取内容!

共2页上一页12 下一页

上一篇：王通：站内搜索引擎的SEO策略

下一篇：何时使用tag进行SEO

学习交流

硬盘分区如何设置准确的分区空间

硬盘分区如何设置准确的分区空间...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

英伟达市值一夜大涨9246亿创2023年5月以来最大单周涨幅

2024-04-27 13:35:46

雷军：小米正在申请3万件专利，以提升自身的竞争力

2024-04-27 13:33:47

人参泡酒15年后竟“复活”？网友：这酒还能喝不？

2024-04-24 22:53:44

芯片股普涨！英伟达市值一夜大涨6000亿元

2024-04-23 19:32:50

面馆老板1天卖100碗刚够交房租要卖到150碗才能实现盈利

2024-04-23 19:25:50

跌近30%！茶百道上市一小时跌没3年净利润

2024-04-23 19:13:19

疑难解答

图片精选

网友关注