解决方案:优采云采集器使用教程

优采云 发布时间: 2022-10-04 21:25

  解决方案:优采云采集器使用教程

  优采云采集器教程

  小白操作的内心独白

  Lw131494252

  我

  想和你一起成长,一起工作,一起休息,一起享受大自然的生活,如果其中一个跟不上,恐怕我会作弊。

  张贴在

  收录系列中

  对于SEO来说,优采云是一种常用的采集工具,学会熟练地使用优采云采集器也会让SEO人员更有效地工作。让我详细演示如何使用优采云采集器。

  工具/原材料方法/步骤

  1

  下载并安装优采云采集器,有付费和免费版本,百度找到下载地址。(我不会在这里详细说明)。

  阿拉伯数字

  安装完成后,双击打开并进入程序的主页以创建新组。

  2

  选择刚创建的新分组,然后右键单击以创建任务。

  4

  编辑任务名称,然后添加指向要采集的目标页面的链接。

  5

  选择批量/多页采集

  6

  

  网址采集的规则设置:

  注意:采集量会根据您自己的需要而变化

  6

  7

  添加采集规则

  10

  转到

  采集的目标页,然后单击鼠标右键以查看源代码。找到要文章采集的标题,然后查找 div,逐个查找,找到页面上唯一的 div,然后复制它。

  查找最后一个 div 也是如此。

  这样做的目的是缩小采集目标的范围。

  11

  然后从第一个 div 开始,到最后一个 div 结束。

  将代码复制到相应的选择,然后可以保存并测试一次

  12

  测试成功。所以选择了采集的一般范围,让我们修改规则采集,使采集的内容达到我们想要的。

  首先查找内容页链接的规则,然后删除不需要的其他代码。

  

  然后,让我们继续采集的第二部分:内容规则的设置

  设置标题替换

  设置标题替换后,测试效果

  设置内容部分的替换

  转到页面的背景代码,找到文章内容上方的唯一 div,然后

  只有在div之后的文本结束,然后复制代码并将其放入与程序对应的设置框中。

  然后设置html代码的过滤,留下你需要的内容,并删除你不需要的内容。然后单击“确定”,保存并开始测试它。

  上述测试成功后,继续执行上一步中释放的设置。

  在 Web 版本配置管理中,对其进行配置

  主要配置网站后台的登录信息和待发布的列,然后保存配置,全部保存,就可以了,可以正式批量采集文章。

  最后检查文章标题,文章内容采集成功。

  预览时标签不带点

  微信扫一扫

  官方数据:数据分析(一)数据采集(优采云采集器

  这是一个免费的在线词云生成网站,并且支持图片下载,非常方便

  3、采集资料网站联家二手房官网:

  这是我过滤后的网址,直接打开即可

  三进正题~~~微词云操作

  1.打开微词云,点击“开始创建”

  2.选择形状、内容

  步骤1。点击形状,选择你想要的形状;

  第2步。点击内容,打开导入下拉框,选择大文本分词导入

  三进正题~~~优采云采集器采集资料

  说说微词云上的内容是从哪里来的,又是怎么来的。(PS:再次提醒我们今天的目标:采集上海徐汇区二手房各区单价及房屋特点。然后根据用于视觉显示的区域信息。)

  1.打开优采云采集器,启动采集

  

  2.输入链家二手房地址,搜索“徐汇区”网站,点击立即创建

  (上图中红框内的按钮可以过滤字段,清除内容,添加任何你想要的字段到采集,这里就不赘述了,大家可以自己研究)

  3. 开始采集

  这里我们有采集150条数据,点击停止,然后导出数据

  以下是导出数据的截图:

  至此,优采云采集器采集的数据基本完成。

  

  顺便补充一下,自动采集时可能出现广告、红包等,可以采取以下方法:

  4.采集结果数据处理

  步骤1。接下来,我们将处理要在微词云中显示的字段。我们选择 positionInfo 列并将其复制到另一个工作表页面

  第2步。选择数据”列,下一步

  第三步。根据内容选择分隔符来分隔数据

  第4步。选择C列并复制到word中,然后从word复制到微词云的文章输入。去完成。这是我制作的一张图片:

  你可以试试,今天就到这里。这是最基本的数据采集和显示。如果想采集更多数据,需要用到python,学完python后再更新。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线