php抓取网页snoopy(【技巧】php防盗链的使用方法及使用技巧! )
优采云 发布时间: 2021-09-23 17:21php抓取网页snoopy(【技巧】php防盗链的使用方法及使用技巧!
)
一.方法:
1、首次下载snoopy类,下载地址:
2、首先实例化一个对象,然后调用相应的方法来获取抓取的Web信息
示例:
include 'snoopy/Snoopy.class.php';$snoopy = new Snoopy();$sourceURL = "http://xxxxxxxxx";$snoopy->fetchlinks($sourceURL);$a = $snoopy->results;
它不提供获取网页中的所有图像地址的方法,要求在页面中的所有文章列表中获取页面地址。然后我写了一个,主要是那里重要。
//匹配图片的正则表达式 $reTag = "/[^s]+src=\"(http:\/\/[^\"]+).(jpg|png|gif|jpeg)\"[^\/]*\/>/i";
由于需要特殊的需求,只需捕获死亡的图片HTP://(外部站的图片可能会使防盗链,我想捕获本地)
实现:
1、抓住了指定的网页并过滤掉所有文章地址;
2、cycy抓住文章地址在第一步中,然后使用匹配图片的正则表达式匹配,获取页面中的排序规则的所有排序规则;
3、图库(这里只有gif,jpg)保存图片 - 如果存在此图像文件,请先删除它并保存
<p>