首页 > 编程 > PHP > 正文

php抓取百度页面及对应字符串的方法

2020-03-22 20:01:23
字体:
来源:转载
供稿:网友
这篇文章主要介绍了php获取百度收录、百度热词及百度快照的方法,实例分析了php抓取百度页面及对应字符串分析的技巧,非常具有实用价值,需要的朋友可以参考下

本文实例讲述了php获取百度收录、百度热词及百度快照的方法。具体如下:

获取百度收录:

 ?php抓取百度收录代码function baidu($s){ $baidu= http://www.baidu.com/s?wd=site%3A .$s; $site=file_get_contents($baidu); //$site=iconv( gb2312 , UTF-8 , $site); ereg( 找到相关网页(.*)篇, , $site,$count); $count=str_replace( 找到相关网页 , ,$count); $count=str_replace( 篇, , ,$count); $count=str_replace( 约 , ,$count); $count=str_replace( , , ,$count); return $count[0];echo baidu(www.jb51.net); //获取脚本之家在百度中的收录数量? 

获取百度的热词

 ?php * @return array 返回百度的热词数据(数组返回) function getBaiduHotKeyWord()$templateRss = file_get_contents( http://top.baidu.com/rss_xml.php?p=top10 if (preg_match( / table (.*) //table /is , $templateRss, $_description)) {$templateRss = $_description [0];$templateRss = str_replace( , , $templateRss);$templateRss = ?xml version=1.0 encoding=GBK? . $templateRss;$xml = @simplexml_load_String($templateRss);foreach ($xml- tbody- tr as $temp) {if (!empty ($temp- td- a)) {$keyArray [] = trim(($temp- td- return $keyArray;print_r(getBaiduHotKeyWord());

这是在网上找的 稍微修改了下 将下面代码写入php文件
百度收录和百度快照时间

 ?php $domain = //www.jb51.net/ *欲查询的域名*/ $site_url = http://www.baidu.com/s?wd=site%3A  $all = $site_url.$domain; /*域名所有收录的网址*/ $today = $all. lm=1 /*域名今日收录的网址*/ $utf_pattern = /找到相关结果数(.*)个/  $kz_pattern = / span >

总结:以上就是本篇文的全部内容,希望能对大家的学习有所帮助。

相关推荐:

php实现多维数组的遍历及unset删除的方法

php实现针对文件的复制及移动的技巧

php基于采集类Snoopy实现抓取迅雷VIP账号的方法

以上就是php抓取百度页面及对应字符串的方法的详细内容,PHP教程

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表