文章采集发布( 教程总目录:优采云 采集器使用教程为什么采集这些东西,这里就不废话了)
优采云 发布时间: 2021-12-30 12:06文章采集发布(
教程总目录:优采云
采集器使用教程为什么采集这些东西,这里就不废话了)
优采云
采集器
采集
已发表文章的作者、时间、标签等内容
教程目录:优采云
采集器
教程
为什么要采集
这些东西,这里不是废话。
下面我们来一一说下如何设置
1.作者
作者在接口文件中设置,此接口文件不支持随机作者等,只能设置一个fixed。
在大约 30 行的接口文件中。有一个值我们根据自己的情况填写。
请注意,这不是作者的名字,也不是作者的用户名。是作者账号的ID号。
比如我们创建wordpress站点时,默认管理员账号ID为1,后续用户依次递增。2、3、4、5 等等。这应该很容易理解。
内容采集规则中无需采集作者
2.时间
我们点击内容采集
规则中的加号添加一组标签
只需填写名称的时间
然后开始设置数据提取规则。
我们也以静安的这篇文章为例:
他的文章有发表时间。我们查看网页源代码,搜索:发布日期
然后在优采云
采集规则中填写日期前后的内容
您可以单击下面的测试以查看何时采集
肉。此处不会发布任何屏幕截图。
3. 标签
标签对于网站搜索引擎优化仍然非常重要。他们可以增加我们网站文章的内部链接,百度也喜欢采集
标签中的内容。
打标签和时间采集
的思路是一样的。比较要采集
的文章中标签前后的源码。创建采集
项,然后设置采集
规则。而已
我们来测试一下,看看上面的采集
效果
扩展知识
为什么加了时间和标签的两个项目名称填“时间”,另一个填“标签”?
这两个名字不是随便写的,而是根据我们发布模块中的设置写的。下面我们来看看release模块的具体内容
点击修改内容发布规则中的配置
选择对应的模块,点击编辑
有发布参数。参数前面的表格名称对应数据库中的item,后面表格的值是我们自己写的。
换句话说,您只能采集
和发布其中的表单项。如果没有项目,有动手能力的可以自己写。