php抓取网页snoopy(PHP类Snoopy的一些特点:*方便网页的文本内容)
优采云 发布时间: 2021-10-07 02:28php抓取网页snoopy(PHP类Snoopy的一些特点:*方便网页的文本内容)
我们都知道PHP类中的Snoopy是什么
Snoopy是一个PHP类,用于模拟web浏览器的功能。它可以完成获取网页内容和发送表单的任务
PHP类Snoopy的一些功能:
*易于抓取网页内容
*易于抓取网页的文本内容(删除HTML标记)
*易于获取网页链接
*支持代理主机
*支持基本用户名/密码身份验证
*支持设置用户代理、引用、cookie和标题内容
*支持浏览器转向和控制转向深度
*可以将网页中的链接扩展为高质量URL(默认)
*提交数据和获取返回值很方便
*支持跟踪HTML框架(添加了V0.92)
*重新转向时支持Cookie的交付(添加了V0.92)
PHP Snoopy的正确操作要求您的服务器的PHP版本超过4,并且支持PCRE(Perl兼容的正则表达式),基本lamp服务支持PCRE
它提供以下接口或方法:
获取($URI)
此方法用于获取网页的内容,$URI是要捕获的网页的URL,捕获的结果存储在$This->results中。如果抓取一帧,将抓取每个帧,并将结果保存到数组中
fetchtext($URI)
此方法与fetch()大致相同,只是其结果是文本,不包括HTML标记和其他无关信息
fetchform($URI)
此方法仅返回捕获的网页上的表单元素
获取链接($URI)
此方法仅返回捕获的网页上的链接。默认情况下,返回的链接是收录域名的链接
提交($URI,$formvars)
此方法将表单提交到指定的$URI$Formvars是要传递的表单变量数组
submittext($URI,$formvars)
此方法基本上与submit()相同,但它返回文本,不包括HTML标记和其他不相关的数据
提交链接($URI)
此方法返回一个链接
这些都是PHP类Snoopy的内容。我希望这对你有帮助
Truetecharticle每个人都知道PHP类中的Snoopy是什么?Snoopy是一个PHP类,用于模拟web浏览器的功能。它可以完成获取网页内容和发送表单的任务。PHP类Snoopy的一些特性