文章采集发布( 教程总目录:优采云 采集器使用教程为什么采集这些东西,这里就不废话了)

优采云 发布时间: 2021-12-30 12:06

  文章采集发布(

教程总目录:优采云

采集器使用教程为什么采集这些东西,这里就不废话了)

  优采云

采集器

采集

已发表文章的作者、时间、标签等内容

  教程目录:优采云

采集器

教程

  为什么要采集

这些东西,这里不是废话。

  下面我们来一一说下如何设置

  1.作者

  作者在接口文件中设置,此接口文件不支持随机作者等,只能设置一个fixed。

  在大约 30 行的接口文件中。有一个值我们根据自己的情况填写。

  

  请注意,这不是作者的名字,也不是作者的用户名。是作者账号的ID号。

  比如我们创建wordpress站点时,默认管理员账号ID为1,后续用户依次递增。2、3、4、5 等等。这应该很容易理解。

  内容采集规则中无需采集作者

  2.时间

  我们点击内容采集

规则中的加号添加一组标签

  只需填写名称的时间

  

  

  然后开始设置数据提取规则。

  我们也以静安的这篇文章为例:

  

  他的文章有发表时间。我们查看网页源代码,搜索:发布日期

  

  然后在优采云

采集规则中填写日期前后的内容

  

  您可以单击下面的测试以查看何时采集

肉。此处不会发布任何屏幕截图。

  3. 标签

  标签对于网站搜索引擎优化仍然非常重要。他们可以增加我们网站文章的内部链接,百度也喜欢采集

标签中的内容。

  打标签和时间采集

的思路是一样的。比较要采集

的文章中标签前后的源码。创建采集

项,然后设置采集

规则。而已

  

  

  我们来测试一下,看看上面的采集

效果

  

  扩展知识

  为什么加了时间和标签的两个项目名称填“时间”,另一个填“标签”?

  

  这两个名字不是随便写的,而是根据我们发布模块中的设置写的。下面我们来看看release模块的具体内容

  点击修改内容发布规则中的配置

  

  选择对应的模块,点击编辑

  

  有发布参数。参数前面的表格名称对应数据库中的item,后面表格的值是我们自己写的。

  

  换句话说,您只能采集

和发布其中的表单项。如果没有项目,有动手能力的可以自己写。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线