免费的大数据采集工具: 优采云采集器如何一键采集QQ音乐播放列表数据
优采云 发布时间: 2020-08-07 18:55单击此处了解有关如何正确输入URL的信息.
2. 创建一个新的智能模式采集任务
您可以直接在软件上创建新的采集任务,也可以通过导入规则来创建任务.
单击此处以了解如何导入和导出采集规则.
第3步: 配置采集规则
1. 设置提取数据字段
在智能模式下,输入URL后,软件可以自动识别页面上的数据并生成采集结果. 每种数据类型都对应一个采集字段. 我们可以右键单击该字段以进行相关设置,包括修改字段名称,添加或删除字段,过程数据等.
单击此处以了解如何配置采集字段.
在列表页面上,我们需要采集诸如QQ经典音乐播放列表的名称,播放列表的链接,播放列表的作者以及播放量之类的信息. 字段设置如下:
2. 使用深度采集功能提取详细页面数据
在列表页面上,仅显示经典QQ音乐播放列表的全部信息. 如果需要采集播放列表的特定歌曲内容,则需要右键单击播放列表链接,然后使用“深度采集”功能跳转到详细信息页面“执行采集”.
点击此处了解如何采集列表+详细页面类型的网页.
在详细信息页面上,默认页面是单页类型的网页,但是我们正在播放列表类型的单首歌曲. 此时,我们可以手动设置提取字段并修改字段名称.
单击此处了解什么是网页的单页类型.
单击此处以了解列表类型的页面.
设置详细信息页面字段的效果如下:
第4步: 设置并启动采集任务
1. 设置采集任务
在详细信息页面上完成采集数据添加之后,我们跳回到列表页面,然后启动采集任务. 开始之前,我们需要设置一些采集任务以提高采集的稳定性和成功率.
单击“设置”按钮,在弹出的运行设置页面中我们可以设置运行设置和防阻塞设置,这里我们选中“跳过继续采集”,设置为“ 2”秒请求等待时间,选中“不加载网页图片”,则防阻塞设置将遵循系统默认设置,然后单击“保存”.
单击此处以了解有关如何配置采集任务的更多信息.
2,开始采集任务
单击“保存并开始”按钮,在弹出页面中进行一些高级设置,包括定时开始,自动存储和下载图片. 在本示例中未使用这些功能,只需单击“开始”以运行采集器工具.
单击此处以了解有关定时获取的更多信息.
单击此处以了解有关自动存储的更多信息.
单击此处以了解有关如何下载图片的更多信息.
[温馨提示]免费版可以使用非定期定时采集功能,而下载图片功能是免费的. 个人专业版及更高版本可以使用高级计时功能和自动存储功能.
3. 运行任务以提取数据
任务开始后,将自动采集数据. 我们可以从界面直观地看到程序的运行过程和采集结果,采集结束后会有提醒.
第5步: 导出和查看数据
数据采集完成后,我们可以查看和导出数据. 优采云采集器支持多种导出方法(手动导出到本地,手动导出到数据库,自动发布到数据库,自动发布到网站)和导出文件格式(EXCEL,CSV,HTML和TXT),我们选择方法和文件类型需要,然后单击“确认导出”.
单击此处以了解有关如何查看和清除采集的数据的更多信息.
单击此处以了解有关如何导出采集的结果的更多信息.
[提醒]: 所有手动导出功能都是免费的. 个人专业版及更高版本可以使用“发布到网站”功能.