php网页抓取工具(以人教版地理七年级地理上册为例子网页是从001.htm开始)

优采云发布时间: 2022-01-07 17:00

　　本文文章主要介绍thinkphp的相关信息，用于抓取网站的内容并保存到本地。有需要的朋友可以参考

　　Thinkphp 捕获网站的内容并保存到本地实例。

　　我需要写一个这样的例子并从电子教科书网站下载一本电子书。

　　的电子书把书的每一页看成一幅图，然后一本书就有很多图。我需要批量下载图片。

　　这是代码部分：

　　 public function download() { $http = new \Org\Net\Http(); $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/"; $localUrl = "Public/bookcover/"; $reg="|showImg$'(.+)'$;|"; $i=1; do { $filename = substr("000".$i,-3).".htm"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url_pref.$filename); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $html = curl_exec($ch); curl_close($ch); $result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER); if($result==1) { $picUrl = $out[1][0]; $picFilename = substr("000".$i,-3).".jpg-600"; $http->curlDownload($picUrl, $localUrl.$picFilename); } $i = $i+1; } while ($result==1); echo "下载完成"; }

　　这里我以人民教育出版社出版的七年级地理第一册为例。

　　网页从001.htm开始，然后不断增加

　　每个网页都有一张图片，与课本的内容相对应。课本内容以图片的形式展示。

　　我的代码是做一个循环，从第一页开始，直到在网页中找不到图片。

　　抓取网页内容后，抓取网页中的图片到本地服务器

　　爬取后的实际效果：

　　以上就是thinkphp抓取网站的内容并保存到本地的例子的详细说明。如有疑问，请留言或到本站社区讨论。感谢您的阅读，希望对大家有所帮助。感谢您对本站的支持！

　　以上就是thinkphp抓取网站的内容并保存到本地的例子的详细内容。更多详情请关注其他相关html中文网站文章！

0

2022-01-07

php网页抓取工具

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

php网页抓取工具(以人教版地理七年级地理上册为例子网页是从001.htm开始)

0 个评论

发起人