wordpress文章采集软件(为什么采集这些东西,这里就不废话了?|SEO)
优采云 发布时间: 2021-11-23 14:12wordpress文章采集软件(为什么采集这些东西,这里就不废话了?|SEO)
为什么采集这些东西,这里就不废话了。
下面我们来一一说下如何设置
1.作者
作者在接口文件中设置,此接口文件不支持随机作者等,只能设置一个fixed。
在大约 30 行的接口文件中。有一个值我们根据自己的情况填写。
请注意,这不是作者的名字,也不是作者的用户名。是作者账号的ID号。
比如我们创建wordpress站点时,创建的默认管理员账号ID为1,后续用户依次递增。2、3、4、5 等等。这应该很容易理解。
内容采集在规则中不需要是作者的采集
2.时间
我们点击内容采集规则中的加号,添加一组标签
只需填写名称的时间
然后开始设置数据提取规则。
我们以静安的文章为例:
他的文章有发表时间。我们查看网页源代码,搜索:发布日期
然后在优采云采集规则中填写日期前后的内容
大家可以点击下面的测试看看吃肉采集时间到了就不截图了。
3. 标签
标签对于网站的SEO来说还是很重要的。他们可以在网站中增加我们内部的文章链,百度也喜欢采集标签中的内容。
标签与时间采集的思想相同。比较需要采集的文章中标签前后的源码。创建采集 项,然后设置采集 规则。就是这样
我们来测试一下,看看上面采集的效果
扩展知识
为什么添加的时间和标签两个项目名称填“时间”,另一个填“标签”?
这两个名字不是随便写的,而是根据我们发布模块中的设置写的。我们来看看release模块的具体内容
点击修改内容发布规则中的配置
选择对应的模块,点击编辑
有发布参数。参数前面的表单名对应数据库中的item,后面的表单值是我们自己写的。
换句话说,您只能采集 发布其中的部分表单项。如果没有项目,有动手能力的可以自己写。