如何实现PHP语言开发的建站程序平台的自动采集功能

优采云 发布时间: 2021-06-21 04:01

  

如何实现PHP语言开发的建站程序平台的自动采集功能

  

  

  如果你想了解更多关于wordpress的内容,可以点击:wordpress教程

  WordPress 是一个使用 PHP 语言开发的建站程序平台。现在很多博主都用wp。很多网站制作培训使用wp,尤其是在做采集站的时候。总能量非常强大。下面是如何实现wp的自动采集功能。

  1、Install网站采集plug-in:WP-AutoPost(插件下载地址:)

  

  2、 点击“新建任务”后,输入任务名称即可新建任务。创建新任务后,您可以在任务列表中查看该任务,并且可以为该任务配置更多设置。 (这部分不需要修改设置,唯一需要修改的就是采集的时间。)

  3、文章source 设置。在这个选项卡下,我们需要设置文章源的文章list URL和具体的文章匹配规则。以采集“新浪网”为例,文章列表网址是,所以在手动指定文章列表网址中输入网址,如下图:

  

  4、文章 URL 匹配规则。 文章URL 匹配规则的设置非常简单,不需要复杂的设置。提供两种匹配模式。您可以使用 URL 通配符匹配或 CSS 选择器进行匹配。通常 URL 通配符匹配比较简单,但有时会使用 CSS 选择器。更精确。

  5、 使用 URL 通配符匹配。通过点击列表URL上的文章,我们可以发现每个文章的URL都具有如下结构:,所以将URL中变化的数字或字母替换为通配符(*),如:(*)/ (*).shtml。重复的网址可以使用 301 重定向。

  6、 使用 CSS 选择器进行匹配。使用CSS选择器进行匹配,我们只需要设置文章URL的CSS选择器即可,查看列表URL的源码即可轻松设置,在列表URL下找到文章超LINK的代码,如下图:

  

  7、可以看到文章的超链接A标签在class为“contList”的标签里面,所以文章网站的CSS选择器只需要设置为.contList a即可,如下图:

  

  8、设置好后,如果不知道设置是否正确,可以点击上图中的测试按钮。如果设置正确,会列出列表URL下的所有文章名称和对应的网址,如下图:

  

  9、其他设置不需要修改。以上采集方法适用于WordPress多站点功能。

  以上是wordpress采集器的详细介绍。更多详情请关注立业格其他相关文章!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线