分享:优采云采集器采集发布文章作者、时间、标签等内容

优采云 发布时间: 2021-01-13 08:07

  分享:优采云采集器采集发布文章作者、时间、标签等内容

  教程总目录:

  如何在WordPress中使用优采云采集器采集文章

  博客作者共享的教程使用优采云V9(也称为优采云)版本,博客程序为wordpress5.x版本。网站服务器环境中使用的宝塔面板,服务器系统是centos7,windows系统和lin ...

  

  为什么采集这些东西,这不是胡说八道。

  以下是一个接一个的设置方法

  1.作者

  作者在界面文件中设置。该界面文件不支持随机作者等。只能设置一个固定值。

  关于接口文件的第30行。我们会根据自己的情况填写一个值。

  

  请注意,它不是作者的姓名,也不是作者的用户名。是作者帐户的ID号。

  例如,当我们创建wordpress网站时,创建的默认管理员帐户ID为1,随后的用户按顺序增加。2、3、4、5等。这应该很容易理解。

  内容采集规则不必是作者的采集

  2.时间

  我们在content 采集规则中单击加号以添加一组标签

  只需填写名称时间

  

  然后开始设置数据提取规则。

  我们也以静安的文章为例:

  

  他文章有发布时间,我们检查了网页的源代码,搜索:发布日期

  

  然后填写优采云采集规则中日期前后的内容

  

  您可以单击下面的测试,以查看食肉动物采集的时间是否正确,没有截图。

  3.标签

  The

  标签对于网站的SEO仍然非常重要,它可以增加网站中文章的内部链,而百度也喜欢采集标签中的内容。

  标签与时间采集的概念相同。比较采集中文章中标记之前和之后的源代码。创建一个采集项目,然后设置采集规则。就这样

  

  

  测试一下,看看上面采集的效果

  

  扩展知识

  为什么两个项目名称加上时间和标签时都用“时间”填充,而另两个名称中都用“标签”填充?

  

  这两个名字不是随便写的,它们是根据发布模块中的设置写的。让我们看一下发布模块的具体内容

  点击以修改内容发布规则中的配置

  

  选择相应的模块,点击下面的修改

  

  有发布参数。参数前面的表单名称与数据库中的项目相对应,后面的表单值由我们自己编写。

  

  换句话说,您只能采集在其中发布表单项。如果您没有项目,则可以自己编写。

  查看您的博客原创文章,作者:转至您的博客,应转载,请注明出处:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线