seo文章采集器( 广州SEO分享的便是优采云 采集器使用教程供新手SEO参考)

优采云 发布时间: 2021-12-25 15:21

  seo文章采集器(

广州SEO分享的便是优采云

采集器使用教程供新手SEO参考)

  优采云

什么是采集器

?优采云

采集

器文字教程

  

  好久没用优采云

采集

器了。想起自己做站群SEO的时候,经常会登录优采云

采集

器采集

各大相关网站的信息内容。而那个时候,采集

之风盛行,到处都是各种采集

站,尤其是小说站、文章站等,动辄采集

数十万篇文章。一个网站的权重达到4是很容易的。虽然现在大部分网站已经很少采集

了,但是采集

还是无处不在,因为一些所谓的原创网站,文章的内容很可能是在采集

后进行处理的。所以掌握一个采集

技巧对SEO站长还是很有帮助的。以下广州SEO分享的是优采云

  第一步打开优采云

采集

器,点击【新建】新建一个任务,填写任务名称,设置采集

URL规则,设置列表页采集

规则和列表所在的文章页规则页面定位,分为以下两步。

  第一步:添加起始地址,点击【添加】,选择批量/多页,地址格式设置要采集的网页链接,点击【添加】和【完成】。这一步的目的是建立有多少个栏目页面链接。

  采集

网页链接的技巧:首先确定要采集

的网页栏目页,分别查看栏目页1、第2页和第3页的链接规则。对比之后,你会发现第2页和第3页的链接很相似,只有2和3变化(其实分页1也是一样,因为SEO格式一般是隐藏的,所以分页1和栏目首页链接都是一样的)可以按照等差数列来分析,其实大部分网站栏目页面都是等差数列排列的,包括殷华峰的博客也是一样。因此,填写规则是选择算术数栏,地址格式中填写第2页的链接,用(*)代替改变的数字,根据栏页数设置项数。

  第二步:多级网址获取,点击【添加】,选择网址获取选项,添加提取网址的规则。熟练后,建议使用结果网址过滤功能。写出需要收录

和不需要收录

的URL。可以测试一下规则是否填写正确,然后保存。这一步的目的是在每个栏目下建立一个到文章页面的链接。

  多级网址获取技巧说明:我们要获取的是该栏目下的文章页面链接,到原网页查看栏目页面源码,找到上一篇文章页面的链接位置源页面,然后选择上面的一小段。通用代码必须是每个栏目页面都会出现的代码,通常的表达形式会收录

列表或文章的代码。

  第二步是设置采集

内容的规则。可以在典型页面填写文章页面链接进行测试,分别设置标题采集规则和内容采集规则,也分为两个步骤。

  步骤a:双击【标题】标签。一般网页的标题是一个标签,所以这一步可以默认。如有必要,您可以设置内容过滤和内容替换。

  步骤 b:双击 [内容] 选项卡。内容抽取规则与第一步中的第2步多级URL获取方法相同。这里是获取内容,所以是查看内容页面的源码。找到这个页面的正文内容,截取正文第一段上方的一小段通用代码。此代码也将出现在所有文章页面上。通常的表达形式是文章标签。开始,

  为了结束。您还可以设置内容过滤、内容替换和标签过滤来过滤掉不需要的信息。如果不需要图片,可以勾选过滤掉img图片标签。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线