自动采集文章网站(如何实现wp的自动采集功能--WordPress培训机构)
优采云 发布时间: 2022-01-01 22:19自动采集文章网站(如何实现wp的自动采集功能--WordPress培训机构)
WordPress 是一个使用 PHP 语言开发的建站程序平台。现在很多博主都用wp。许多网站制作培训使用wp,尤其是采集站。那个时候wordpress的整体能量非常强大。下面介绍如何实现wp的自动采集功能。
安装网站采集插件:WP-AutoPost(插件下载链接:)
点击“新建任务”后,输入任务名称创建一个新任务。创建新任务后,您可以在任务列表中查看该任务,并且可以为该任务配置更多设置。 (这部分不需要修改设置,唯一需要修改的就是采集的时间。)
文章源设置。在这个选项卡下,我们需要设置文章的来源的文章列表URL和文章的具体匹配规则。我们以采集《新浪网》为例,文章的列表网址为,所以在手动指定的文章列表网址中输入网址,如下图:
文章 URL 匹配规则。 文章 URL匹配规则的设置很简单。不需要复杂的设置。提供两种匹配模式。您可以使用 URL 通配符匹配或 CSS 选择器进行匹配。通常 URL 通配符匹配更简单,但有时会使用 CSS。选择器更精确。
使用 URL 通配符匹配。通过点击列表URL上的文章,我们可以发现每个文章的URL具有如下结构:所以将URL中变化的数字或字母替换为通配符(*),如: (*)/(*).shtml。重复的 URL 可以使用 301 重定向。
使用 CSS 选择器进行匹配。要使用CSS选择器进行匹配,我们只需要设置文章 URL的CSS选择器即可,查看列表URL源码即可轻松设置,找到文章@的代码> 列表 URL 下的超链接。如下图:
可以看到文章的超链接A标签在类为"contList"的标签内,所以文章 URL的CSS选择器只需要设置为.contList a,如下图所示:
设置完成后,如果不知道设置是否正确,可以点击上图中的测试按钮。如果设置正确,将列出列表URL下的所有文章名称和对应的网址,如下图:
其他设置不需要修改。
以上采集方法适用于WordPress多站点功能。