php抓取网页内容(PHP采集头条先看一实例,现在我要采集新浪网国内新闻的头条)
优采云 发布时间: 2021-09-19 22:22php抓取网页内容(PHP采集头条先看一实例,现在我要采集新浪网国内新闻的头条)
Phpquery是一个基于PHP的开源服务器项目,它允许PHP开发人员轻松处理DOM文档内容,例如获取新闻的标题网站. 更有趣的是,它采用了jQuery的思想。您可以像使用jQuery一样处理页面内容并获取所需的页面信息
采集标题
让我们看一个例子。现在我想看一下采集的国内新闻头条。代码如下:
简单的三行代码,就可以得到标题内容。首先,程序中收录phpQuery.php核心程序,然后调用目标页面,最后输出与标记对应的内容。p>
PQ()是一个强大的方法,就像jQuery的$()。基本上,只要将“.”更改为“-“>”,jQuery选择器就可以在phpquery上使用。在上面的示例中,PQ(.Blktop H1:EQ(0)))获取class属性为Blktop的div元素,在div中找到第一个H1标记,然后使用HTML()方法获取H1标记中的内容(带有HTML标记)当然,如果text()要很好地使用phpquery,关键是要找到文档中内容对应的节点
采集文章list
让我们再举一个例子来获取网站.请参阅代码:
浏览循环列表中的div,找出文章标题并输出它。就这么简单
解析XML文档
假设有一个test.xml文档,如下所示:
现在我想知道联系人张三的年龄,代码如下:
结果输出:22
与jQuery一样,精确查找文档节点、输出节点下的内容并解析XML文档非常简单。现在您不必为采集网站content使用麻烦的常规算法、内容替换和其他繁琐的代码。有了phpquery,一切都变得简单多了