php 抓取网页内容(thinkphp抓取网站的内容并且保存到本地的实例详解的相关内容)

优采云发布时间: 2021-10-02 05:22

　　你想知道thinkphp抓取网站的内容并保存到本地的例子的详细解释吗？在本文中，我将为您讲解thinkphp抓取网站的相关知识和一些代码示例。欢迎阅读指正，先关注一下：thinkphp，抓取网站的内容保存到本地，php，抓取网站的内容保存，一起学习

　　Thinkphp 捕获网站的内容并保存到本地实例。

　　我需要写一个这样的例子并从电子教科书网站下载一本电子书

　　的电子书把书的每一页都看成一幅图，然后一本书就有很多图。我需要批量下载图片。

　　这是代码部分：

public function download() {

$http = new \Org\Net\Http();

$url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";

$localUrl = "Public/bookcover/";

$reg="|showImg$'(.+)'$;|";

$i=1;

do {

$filename = substr("000".$i,-3).".htm";

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url_pref.$filename);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

$html = curl_exec($ch);

curl_close($ch);

$result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER);

if($result==1) {

$picUrl = $out[1][0];

$picFilename = substr("000".$i,-3).".jpg";

$http->curlDownload($picUrl, $localUrl.$picFilename);

}

$i = $i+1;

} while ($result==1);

echo "下载完成";

}

　　这里我以人民教育出版社出版的七年级地理第一册为例。

　　网页从001.htm开始，然后不断增加

　　每个网页都有一张图片，与教材的内容相对应，以图片的形式展示教材的内容

　　我的代码是做一个循环，从第一页开始，直到在网页中找不到图片。

　　抓取网页内容后，抓取网页中的图片到本地服务器

　　爬取后的实际效果：

　　以上就是thinkphp抓取网站的内容并保存到本地的例子的详细说明。如果您有任何问题，请留言或访问本站社区进行讨论。感谢您的阅读，希望对大家有所帮助。感谢您对本站的支持！

2021-10-02

php 抓取网页内容

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

php 抓取网页内容(thinkphp抓取网站的内容并且保存到本地的实例详解的相关内容)

0 个评论

发起人

AI时代内容工厂

php 抓取网页内容(thinkphp抓取网站的内容并且保存到本地的实例详解的相关内容)

0 个评论

发起人

相关问题