WordPress使用优采云采集器采集文章教程博主的教程

优采云 发布时间: 2021-03-20 21:20

  WordPress使用优采云采集器采集文章教程博主的教程

  教程总目录:

  如何在WordPress中使用优采云 采集器 采集 文章

  博客作者共享的教程使用优采云 V9(也称为优采云)版本,博客程序为wordpress 5. x版本。 网站服务器环境中使用的宝塔面板,服务器系统是centos7,windows系统和lin ...

  

  在上一个教程中,我们基本上可以完成网站内容中的采集工作。但是,如果我们想让网站长时间运行,我们绝对不能仅靠采集来做到这一点。

  优采云带有计划任务功能,我们可以使用此功能来执行计划任务采集。

  此外,我们还需要对采集的地址进行一些更改,以提高采集的效率。

  教程开始

  1. 采集地址设置

  在上一教程中,我们的目的是将另一方整个网站的内容发送到采集,因此采集列表中有更多URL。稍后,如果我们继续采集新内容,则无法扫描整个网站。上。

  我们只需要监视第一页,然后定期检查第一页上是否有新内容。如果有新内容,优采云将自动采集下载数据。如果没有,它将在扫描后自动停止。

  以静安的文章为例

  这是他的文章列表的第一页。静安更新新内容时,肯定会在第一页上显示该内容。我们只将第一页的地址填写到采集列表中。在这里我不会重复如何填写。我在本教程中写了前几篇文章文章

  还有一点需要注意,因为当我们定期运行文章时,他需要检查文章是否通过了采集,因此我们不想清除优采云的采集数据。否则,优采云会检测到文章之前不是文章,它们都被视为新的文章 采集。

  

  2.计划任务设置

  如果您长时间运行一项任务,则本教程仅创建一项任务网站。对于采集的每个部分,您的网站可能具有不同的文章来源,甚至一个部分也只有几个网站 文章。有很多任务

  我们可以批量添加计划任务

  点击以安排任务

  

  首先创建一个预定的任务组

  

  然后将预定任务添加到组中,这更易于管理

  然后,根据采集的网站更新频率设置内部间隔时间。如果更新速度更快,则应缩短间隔。如果更新缓慢,请花更长的时间。例如,在静安网站中,可能几天和几个月都不会更新,只需将间隔设置为每天。

  有限的时间段

  这也应该理解,即计划任务将在哪个时间段生效,默认值为上午6点至23:00。我通常会整天改给他

  

  扩展知识

  由于采集任务运行了很长时间,因此我们最好将优采云放在服务器上并运行它。如果家里有比较省电的机器,也可以用来挂起采集任务。

  采集如果还有更多任务,它仍然会消耗CPU。通常,建议将其挂在家里。家庭带宽外部网络IP的频繁更改有益于采集,并且硬件配置基本上高于购买的服务器。不必担心优采云跑步时会卡住。

  查看您的博客原创 文章,作者:转至您的博客,应转载,请注明出处:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线