文章采集发布( 教程总目录:优采云采集器使用教程为什么采集这些东西,这里就不废话了)

优采云 发布时间: 2022-01-28 18:20

  文章采集发布(

教程总目录:优采云采集器使用教程为什么采集这些东西,这里就不废话了)

  优采云采集器采集发布文章作者、时间、标签等

  教程总目录:优采云采集器使用教程

  为什么是采集这些东西,这里不废话。

  下面一一介绍如何设置

  1.作者

  接口文件中设置作者,不支持随机作者等,只能设置一个固定的。

  在接口文件的第 30 行左右。里面有一个值,我们根据自己的具体情况填写。

  

  请注意,这不是作者的名字,也不是作者的用户名。是作者账号的ID号。

  比如我们创建一个wordpress站点时,默认创建的管理员账号ID为1,后续用户依次递增。2、3、4、5 等等。这应该很好理解。

  内容采集规则中不需要作者采集

  2.时间

  我们点击内容采集规则中的加号来添加一组标签

  只需填写姓名

  

  

  然后开始设置数据的提取规则。

  我们也以静安的文章为例:

  

  他的文章有发布时间,我们查看网页源码,搜索:发布日期

  

  然后将日期前后的内容填入优采云采集规则

  

  大家可以点击下面的测试看看肉采集到时候我就不截图了。

  3. 标签

  标签对于网站的SEO还是很重要的,它可以增加我们网站中文章的内链,百度真的很喜欢采集标签中的内容。

  标签与时间采集的思路相同,对比采集的文章中标签前后的源码。创建一个 采集 项目,然后设置一个 采集 规则。正好

  

  

  我们来测试一下上面的采集的效果

  

  扩展知识

  为什么时间和标签这两个项目名称,一个填写“时间”,一个填写“标签”?

  

  这两个名字不是随便写的,而是按照我们发布模块中的设置写的。下面我们来看看发布模块的具体内容

  单击内容发布规则中的修改配置

  

  选择对应的模块,点击编辑

  

  这里有发布参数。参数前面的表单名对应数据库中的item,后面的表单值是我们自己写的。

  

  也就是说,你只能采集发布其中的表单项。如果没有项目,有能力的可以自己写。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线