首页 > 编程 > PHP > 正文

使用phpspider爬虫的使用方法

2020-03-22 18:42:51

字体：大中小

来源：转载

供稿：网友

本文主要和大家分享使用phpspider爬虫的使用方法，使用python爬虫固然很方便，但是发现php在这方便也不弱；使用框架爬虫真的要高效许多。

1,先看下phpspider的结构

2，举例子：比如我爬取南昌新闻网的一个分类

这个注释要加上，不然报错，可以看看源码，源码里面有很多方法；

3,然后是配置下爬虫:

4,然后将配置文件放入框架类文件，实例化：

这里的 on_scan_page 是爬取的入口url，这些URL跟我配置的 content_url_regxes 正则规则匹配，所以在后面的爬取过程中，会爬取到这几个页面的数据

5,对匹配后的字段field进行回调处理：

6,进行爬取数据入库处理，跑起来

以上只是一个简单的例子，还可以进行多进程爬取，代理爬虫，很多好玩的。

相关推荐：

PHP网络爬虫之CURL详解

PHP如何实现爬虫

NodeJS爬虫详解

以上就是使用phpspider爬虫的使用方法的详细内容，更多请关注其它相关文章！

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

上一篇：详解php中匿名函数和闭包函数

下一篇：PHP实现微信PC端二维码登录

学习交流

MBR怎么转换为GPT？硬盘MBR格式转换成GPT格

MBR怎么转换为GPT？硬盘MBR格式转换成GPT格式教程...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

美团云5月31日起停止对用户服务

2020-03-22 13:00:36

中国移动2019年净利润1066亿元超出预期

2020-03-19 18:53:05

国内油价重回“5元时代” 92号汽油每升下调0.80元

2020-03-18 19:35:57

腾讯在天津成立新公司斥资2亿元人民币

2020-03-18 19:32:46

软银集团或放弃收购WeWork 30亿美元收购要约计划告吹

2020-03-18 19:30:20

全球十大IC设计公司最新排名

2020-03-18 13:04:38

疑难解答

图片精选

网友关注