thinkphp抓取网站内容保存本地

2024-09-09 15:20:25

字体：大中小

来源：转载

供稿：网友

thinkphp抓取网站内容保存到本地可以很大程度的方便我们借鉴一些内容或是图片的收集。那么thinkphp怎么抓取网站内容保存到本地呢？有什么具体操作方法？下面我们具体来看看。

thinkphp 抓取网站的内容并且保存到本地的实例详解

我需要写这么一个例子，到电子课本网下载一本电子书。

电子课本网的电子书，是把书的每一页当成一个图片，然后一本书就是有很多张图片，我需要批量的进行下载图片操作。

下面是代码部分：

public function download() {

   $http = new /Org/Net/Http();

   $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";

   $localUrl = "Public/bookcover/";

   $reg="|showImg/('(.+)'/);|";

   $i=1;



   do {

     $filename = substr("000".$i,-3).".htm";

     $ch = curl_init();

     curl_setopt($ch, CURLOPT_URL, $url_pref.$filename);

     curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

     curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);

     curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

     $html = curl_exec($ch);

     curl_close($ch);



     $result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER);

     if($result==1) {

       $picUrl = $out[1][0];

       $picFilename = substr("000".$i,-3).".jpg";

       $http->curlDownload($picUrl, $localUrl.$picFilename);

     }

     $i = $i+1;

   } while ($result==1);



   echo "下载完成";

}