php抓取网页snoopy(PHP类Snoopy的一些特点:*方便网页的文本内容)

优采云 发布时间: 2021-10-07 02:28

  php抓取网页snoopy(PHP类Snoopy的一些特点:*方便网页的文本内容)

  我们都知道PHP类中的Snoopy是什么

  Snoopy是一个PHP类,用于模拟web浏览器的功能。它可以完成获取网页内容和发送表单的任务

  PHP类Snoopy的一些功能:

  *易于抓取网页内容

  *易于抓取网页的文本内容(删除HTML标记)

  *易于获取网页链接

  *支持代理主机

  *支持基本用户名/密码身份验证

  *支持设置用户代理、引用、cookie和标题内容

  *支持浏览器转向和控制转向深度

  *可以将网页中的链接扩展为高质量URL(默认)

  *提交数据和获取返回值很方便

  *支持跟踪HTML框架(添加了V0.92)

  *重新转向时支持Cookie的交付(添加了V0.92)

  PHP Snoopy的正确操作要求您的服务器的PHP版本超过4,并且支持PCRE(Perl兼容的正则表达式),基本lamp服务支持PCRE

  它提供以下接口或方法:

  获取($URI)

  此方法用于获取网页的内容,$URI是要捕获的网页的URL,捕获的结果存储在$This->results中。如果抓取一帧,将抓取每个帧,并将结果保存到数组中

  fetchtext($URI)

  此方法与fetch()大致相同,只是其结果是文本,不包括HTML标记和其他无关信息

  fetchform($URI)

  此方法仅返回捕获的网页上的表单元素

  获取链接($URI)

  此方法仅返回捕获的网页上的链接。默认情况下,返回的链接是收录域名的链接

  提交($URI,$formvars)

  此方法将表单提交到指定的$URI$Formvars是要传递的表单变量数组

  submittext($URI,$formvars)

  此方法基本上与submit()相同,但它返回文本,不包括HTML标记和其他不相关的数据

  提交链接($URI)

  此方法返回一个链接

  这些都是PHP类Snoopy的内容。我希望这对你有帮助

  Truetecharticle每个人都知道PHP类中的Snoopy是什么?Snoopy是一个PHP类,用于模拟web浏览器的功能。它可以完成获取网页内容和发送表单的任务。PHP类Snoopy的一些特性

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线