SEO网站站长如何批量采集文章?优采云采集器操作教程
优采云 发布时间: 2020-08-07 17:12第2步: 多级URL获取,单击[添加],选择URL获取选项,添加提取URL的规则,熟练掌握后,建议使用结果URL过滤功能,并编写URL需要收录的内容和不需要收录的内容. 您可以测试规则是否正确填写,然后保存. 此步骤的目的是在每个列下建立指向文章页面的链接.
多级URL获取技能描述: 我们要获取的是此列下的文章页面链接,转到原创网页以查看该列页面的源代码,找到第一个文章页面链接的位置在源页面上,然后在其上选择一小段常规代码,它必须是将出现在每个列页面上的代码,并且通常的表达形式将收录列表或文章的代码.
优采云采集器内容规则设置
第二步是设置采集内容的规则. 您可以在典型页面上填写文章页面链接进行测试,并分别设置标题采集规则和内容采集规则,这也分为两个步骤.
步骤a: 双击[Title]标签. 通常,网页标题是标签,因此可以默认此步骤. 如有必要,您可以设置内容过滤和内容替换.
步骤b: 双击[内容]选项卡. 内容提取规则与第一步中的步骤2多级URL获取方法相同. 这里是获取内容的方法,因此它是查看内容页面的源代码,在此页面上找到主体内容,并在主体的第一段上方截取一小段常规代码的步骤. 该代码也将出现在所有文章页面上. 通常的表达是商品标签. 开始,结束. 您还可以设置内容过滤,内容替换和标签过滤,以过滤掉不需要的信息. 如果不需要图片,可以检查以过滤掉img图片标签.
优采云采集器发布内容设置
第三步,发布内容设置,检查需要启用的发布方法,将其保存,然后右键单击任务列表中的任务名称,单击[开始任务],等待采集完成
请注意,优采云采集器可以通过两种方式发布内容. 第一种方法是从Web在线发布到网站,并需要添加发布配置. 不建议新手直接发布到网站. 建议检查第二个并另存为本地. 至于文件模板,您可以查看默认模板,然后选择TXT格式.