全网文章 采集( 如何实现PHP语言开发的建站程序平台的自动采集功能)
优采云 发布时间: 2021-09-01 22:19全网文章 采集(
如何实现PHP语言开发的建站程序平台的自动采集功能)
WordPress 是一个使用 PHP 语言开发的建站程序平台。现在很多博主都用wp。很多网站制作培训使用wp,尤其是在做采集站的时候。总能量非常强大。下面是如何实现wp的自动采集功能。
推荐教程:wordpressa教程
1、Install网站采集plugin: WP-AutoPost
2、 点击“新建任务”后,输入任务名称即可新建任务。创建新任务后,您可以在任务列表中查看该任务,并且可以为该任务配置更多设置。 (这部分不需要修改设置,唯一需要修改的就是采集的时间。)
3、文章source 设置。在这个选项卡下,我们需要设置文章源的文章list URL和具体的文章匹配规则。以采集“新浪网”为例,文章列表网址是,所以在手动指定文章列表网址中输入网址,如下图:
4、文章 URL 匹配规则。 文章网址匹配规则的设置非常简单,不需要复杂的设置。提供两种匹配模式。您可以使用 URL 通配符匹配或 CSS 选择器进行匹配。通常 URL 通配符匹配比较简单,但有时会使用 CSS 选择器。更精确。
5、 使用 URL 通配符匹配。通过点击列表网址上的文章,我们可以发现文章的每个网址的结构如下:,所以将网址中变化的数字或字母替换为通配符(*),如:(*)/( *).shtml。重复的网址可以使用 301 重定向。
6、使用 CSS 选择器进行匹配。使用CSS选择器进行匹配,我们只需要设置文章URL的CSS选择器即可,查看列表URL源码即可轻松设置,在列表URL下找到文章超LINK的代码,如下图:
7、可以看到文章的超链接A标签在class为“contList”的标签里面,所以文章网站的CSS选择器只需要设置为.contList a即可,如下图:
8、设置好后,如果不知道设置是否正确,可以点击上图中的测试按钮。如果设置正确,会列出列表URL下的所有文章名称和对应的网址,如下图:
9、其他设置不需要修改。
10、以上采集方式适用于WordPress多站点功能。
如果这个文章不能解决你的问题,可以查看这个文章:wordpress自动采集插件使用方法
以上是wordpress采集的详细介绍。更多详情请关注php中文网其他相关文章!
免责声明:本文原创发布于php中文网,转载请注明出处,感谢您的尊重!如果您有任何问题,请联系我们