文章采集发布( 教程总目录:优采云采集器使用教程为什么采集这些东西,这里就不废话了)
优采云 发布时间: 2022-01-28 18:20文章采集发布(
教程总目录:优采云采集器使用教程为什么采集这些东西,这里就不废话了)
优采云采集器采集发布文章作者、时间、标签等
教程总目录:优采云采集器使用教程
为什么是采集这些东西,这里不废话。
下面一一介绍如何设置
1.作者
接口文件中设置作者,不支持随机作者等,只能设置一个固定的。
在接口文件的第 30 行左右。里面有一个值,我们根据自己的具体情况填写。
请注意,这不是作者的名字,也不是作者的用户名。是作者账号的ID号。
比如我们创建一个wordpress站点时,默认创建的管理员账号ID为1,后续用户依次递增。2、3、4、5 等等。这应该很好理解。
内容采集规则中不需要作者采集
2.时间
我们点击内容采集规则中的加号来添加一组标签
只需填写姓名
然后开始设置数据的提取规则。
我们也以静安的文章为例:
他的文章有发布时间,我们查看网页源码,搜索:发布日期
然后将日期前后的内容填入优采云采集规则
大家可以点击下面的测试看看肉采集到时候我就不截图了。
3. 标签
标签对于网站的SEO还是很重要的,它可以增加我们网站中文章的内链,百度真的很喜欢采集标签中的内容。
标签与时间采集的思路相同,对比采集的文章中标签前后的源码。创建一个 采集 项目,然后设置一个 采集 规则。正好
我们来测试一下上面的采集的效果
扩展知识
为什么时间和标签这两个项目名称,一个填写“时间”,一个填写“标签”?
这两个名字不是随便写的,而是按照我们发布模块中的设置写的。下面我们来看看发布模块的具体内容
单击内容发布规则中的修改配置
选择对应的模块,点击编辑
这里有发布参数。参数前面的表单名对应数据库中的item,后面的表单值是我们自己写的。
也就是说,你只能采集发布其中的表单项。如果没有项目,有能力的可以自己写。