个人站长如何批量采集文章?优采云采集器使用详细教程
优采云 发布时间: 2021-07-02 18:09个人站长如何批量采集文章?优采云采集器长期使用详细教程。 优采云采集器 好久没用了。我记得我第一次学习优采云采集 或者我刚毕业做外推。经常登录优采云采集器去采集related网站查看相关内容。而且那个时候采集之风盛行,到处都是各种采集站,特别是小说站,文章站等等,采集tens万的文章,网站做权重4 这很容易。虽然现在大部分网站很少采集,但采集还是无处不在,因为一些所谓的原创网站,文章的内容很可能是经过采集的处理的。所以掌握一个采集技巧对个人站长还是很有帮助的。以下冷木软件库分享优采云采集器教程,供新手个人站长参考。 优采云采集器URL规则设置第一步,打开优采云采集器,点击【新建】新建任务,填写任务名称,设置采集URL规则,设置列表页采集规则分别和列表页面所在的文章page规则,分为以下两步。第一步:添加起始地址,点击【添加】,选择批量/多页,地址格式设置采集的网页链接,点击【添加】和【完成】。这一步的目的是建立有多少个栏目页面链接。 采集网页链接技巧说明:首先确定你想要采集的网页栏目页,分别查看栏目页1、分页2和第3页的链接规则。经过对比,你会发现第2页和第3页的链接非常相似,只有2和3发生了变化(分页1也是如此,因为SEO格式一般是隐藏的,所以分页1与栏目首页一致链接)可以按照等差数列来分析,其实网站专栏页面分页大部分都是等按数字顺序排列的,包括尹华峰的博客。
因此,在填充规则中,选择算术数栏,地址格式填写第2页的链接,用(*)代替改变的数字,根据栏页数设置项数第二步:多级网址获取,点击【添加】,选择网址获取选项,添加提取网址的规则。熟练后,建议使用结果网址过滤功能。写出需要收录和不需要收录的URL。可以测试一下规则是否填写正确,然后保存。这一步的目的是在每一栏下建立文章页面链接。多级网址获取技巧说明:我们要获取的是本栏目下的文章页面链接,到原网页查看栏目页面源码,找到第一个文章页面的位置源页面上的链接,然后点击上面选择一小段通用代码,它必须是每个栏目页面都会出现的代码,通常的表达形式会收录列表或文章的代码。 优采云采集器Content 规则设置 第二步是设置采集content 规则,可以在典型页面填写一个文章页面链接进行测试,并设置title采集rule 和content采集rule 分别,也分为两步。步骤a:双击【标题】标签。一般网页的标题是一个标签,所以这一步可以默认。如有必要,您可以设置内容过滤和内容替换。步骤 b:双击 [内容] 选项卡。内容抽取规则与第一步中的第2步多级URL获取方法相同。这里是获取内容,所以就是查看内容页的源码,找到这个页面的body内容,截取body第一段上面的一小段通用代码。此代码也将出现在所有文章 页面上。通常的表达形式是 article 标签是开头和结尾。
您还可以设置内容过滤、内容替换和标签过滤来过滤掉不需要的信息。如果不需要图片,可以勾选过滤掉img图片标签。 优采云采集器发布内容设置第三步,发布内容设置,勾选需要启用的发布方式,保存,然后在任务列表中右键任务名称,点击【启动任务】等待采集 完成。注意,优采云采集器分为两种发布内容的方式。第一种方式是在线发布到网络网站,需要添加发布配置。新手不建议直接发帖网站,建议查看第二个并保存为本地。至于文件模板,可以【查看默认模板】,然后选择TXT格式。结论:优采云采集器很强大,除了采集文章你还可以采集视频等,优采云采集器不难用规则,你不需要完全了解编程语言。你只需要了解一些常用的简单代码,基本掌握一两次即可。这是一款出色的 SEO 工具。