WordPress手动采集发布文章01-使用优采云采集目标网站
优采云 发布时间: 2020-08-03 16:01优采云采集目标网站有哪些用处
优采云采集目标网站有哪些益处呢?
它会依据我们指定的网站进行采集,采集到的内容和我们网站的内容相关性高。
为什么不用站群软件采集呢?站群软件和优采云采集的形式不一样,站群软件用的是泛采集,而优采云是定向采集。泛采集是指:根据我们所设计的关键词,搜索相关内容进行采集,比如说,站群软件外置了几千个网站,然后从那些网站中来采集内容,这些内容是依据你设置的关键词来搜索的。然后索引几千个网站来采集相关内容,这些网站一般都是门户站,或者是通过搜索引擎来索引一些百度知道相关内容,这会导致用站群软件采集的文章质量不高,并且采集的文章重复率会很高,因为你采集的文章别人也可能采集了,因为用站群软件的人不只你一个。
所以说,优采云采集的益处就是:我想采集哪个网站就采集哪个,网站内容的相关性更高。文章质量也会愈加高一些。
如何自主学习优采云采集
可以访问这个网站:优采云论坛使用教程
实战采集步骤
我这儿来演示优采云如何采集:
比如说,我来采集虚幻私塾的文章:
1.打开优采云,新建任务
首先任务名取为:“虚幻私塾”
.png - wordpress手动发布文章01-使用优采云采集目标网站
这里分三步:
这一节,我们讲解前2步:
首先,我们先添加采集的网址,
那在这里,虚幻私塾有很多列表,我们就以批量多页来做示范:如下图所示,完成后文章采集发布,点击“添加“ 和 ”完成”
You must be logged in to view the hidden contents.
这样,我们就定义好了规则。
点击“测试网址采集”:
就可以看见:所有的分页都被采集到了:
02 - wordpress手动发布文章01-使用优采云采集目标网站
点击“返回更改设置”。接着再点击保存。
然后右键任务名称“虚幻私塾”,点击“编辑任务”:
03 - wordpress手动发布文章01-使用优采云采集目标网站
从第一步随便找到一篇文章,双击,即可以这篇文章为典型文章采集了。
05 - wordpress手动发布文章01-使用优采云采集目标网站
我们会听到采集到的文章内容有很多html标记,所以我们须要对内容定义一个“规则”。
这里先把“作者”“时间”“出处”删除。
然后对标题和内容进行筛选:
标题:
内容:
这里可以不断的测试,采集出来的数据是否正确,如果没有问题
保存设置,然后勾选采网址,采内容。
06 - wordpress手动发布文章01-使用优采云采集目标网站
接着开始采集即可。
采集完成后,我们可以查看下采集的数据是否正确:
07 - wordpress手动发布文章01-使用优采云采集目标网站
如果都有文章采集发布,说明采集的数据符合我们的要求。