解决方案:优采云采集器使用教程
优采云 发布时间: 2022-10-04 21:25解决方案:优采云采集器使用教程
优采云采集器教程
小白操作的内心独白
Lw131494252
我
想和你一起成长,一起工作,一起休息,一起享受大自然的生活,如果其中一个跟不上,恐怕我会作弊。
张贴在
收录系列中
对于SEO来说,优采云是一种常用的采集工具,学会熟练地使用优采云采集器也会让SEO人员更有效地工作。让我详细演示如何使用优采云采集器。
工具/原材料方法/步骤
1
下载并安装优采云采集器,有付费和免费版本,百度找到下载地址。(我不会在这里详细说明)。
阿拉伯数字
安装完成后,双击打开并进入程序的主页以创建新组。
2
选择刚创建的新分组,然后右键单击以创建任务。
4
编辑任务名称,然后添加指向要采集的目标页面的链接。
5
选择批量/多页采集
6
网址采集的规则设置:
注意:采集量会根据您自己的需要而变化
6
7
添加采集规则
10
转到
采集的目标页,然后单击鼠标右键以查看源代码。找到要文章采集的标题,然后查找 div,逐个查找,找到页面上唯一的 div,然后复制它。
查找最后一个 div 也是如此。
这样做的目的是缩小采集目标的范围。
11
然后从第一个 div 开始,到最后一个 div 结束。
将代码复制到相应的选择,然后可以保存并测试一次
12
测试成功。所以选择了采集的一般范围,让我们修改规则采集,使采集的内容达到我们想要的。
首先查找内容页链接的规则,然后删除不需要的其他代码。
然后,让我们继续采集的第二部分:内容规则的设置
设置标题替换
设置标题替换后,测试效果
设置内容部分的替换
转到页面的背景代码,找到文章内容上方的唯一 div,然后
只有在div之后的文本结束,然后复制代码并将其放入与程序对应的设置框中。
然后设置html代码的过滤,留下你需要的内容,并删除你不需要的内容。然后单击“确定”,保存并开始测试它。
上述测试成功后,继续执行上一步中释放的设置。
在 Web 版本配置管理中,对其进行配置
主要配置网站后台的登录信息和待发布的列,然后保存配置,全部保存,就可以了,可以正式批量采集文章。
最后检查文章标题,文章内容采集成功。
预览时标签不带点
微信扫一扫
这是一个免费的在线词云生成网站,并且支持图片下载,非常方便
3、采集资料网站联家二手房官网:
这是我过滤后的网址,直接打开即可
三进正题~~~微词云操作
1.打开微词云,点击“开始创建”
2.选择形状、内容
步骤1。点击形状,选择你想要的形状;
第2步。点击内容,打开导入下拉框,选择大文本分词导入
三进正题~~~优采云采集器采集资料
说说微词云上的内容是从哪里来的,又是怎么来的。(PS:再次提醒我们今天的目标:采集上海徐汇区二手房各区单价及房屋特点。然后根据用于视觉显示的区域信息。)
1.打开优采云采集器,启动采集
2.输入链家二手房地址,搜索“徐汇区”网站,点击立即创建
(上图中红框内的按钮可以过滤字段,清除内容,添加任何你想要的字段到采集,这里就不赘述了,大家可以自己研究)
3. 开始采集
这里我们有采集150条数据,点击停止,然后导出数据
以下是导出数据的截图:
至此,优采云采集器采集的数据基本完成。
顺便补充一下,自动采集时可能出现广告、红包等,可以采取以下方法:
4.采集结果数据处理
步骤1。接下来,我们将处理要在微词云中显示的字段。我们选择 positionInfo 列并将其复制到另一个工作表页面
第2步。选择数据”列,下一步
第三步。根据内容选择分隔符来分隔数据
第4步。选择C列并复制到word中,然后从word复制到微词云的文章输入。去完成。这是我制作的一张图片:
你可以试试,今天就到这里。这是最基本的数据采集和显示。如果想采集更多数据,需要用到python,学完python后再更新。