智能标签采集器(一下采集器智能模式的基本操作采集案例)
优采云 发布时间: 2022-01-24 10:08如果你看过优采云采集器智能模式的第一个采集案例,一定对它有一个初步的了解,这里我们将详细介绍智能模式的基本操作流程。
1、输入正确的网址
输入正确的 URL 是完成这个 采集 任务的一半。
优采云采集器支持单URL和多URL采集,支持从本地TXT文件导入URL,支持批量生成参数URL。
更多详情,请参考以下教程:
2、选择页面类型并设置分页
在智能模式下,优采云采集器 会自动识别网页。如果识别不准确,可以先手动识别。如果手动自动识别不起作用,您可以手动识别。单击列表可帮助软件识别正确的结果。
更多详情,请参考以下教程:
对于上述页面类型,您可以单击以下链接获取具体信息:
3、预登录
在编辑任务的过程中,我们有时会遇到需要登录才能查看内容的网页。这时候,我们就需要用到预登录功能了。登录成功后,我们就可以进行正常的data采集了。
更多详情,请参考以下教程:
4、预执行动作
在编辑任务的过程中,如果用户需要进行点击操作,可以通过预执行操作来满足用户的需求。
更多详情,请参考以下教程:
5、输入验证码
用户在编辑任务的过程中,如果遇到验证码,可以点击右上角的验证码输入功能,手动输入验证码。
更多详情,请参考以下教程:
6、切换代理
在编辑任务过程中,如果用户遇到无法显示的页面或者验证码提示,也可以点击右上角的切换代理功能进行操作。
更多详情,请参考以下教程:
7、网络安全设置
用户在编辑任务过程中,如果遇到网页异常,可以尝试使用该功能,但需要注意的是,开启该选项可能会导致页面部分内容失效采集(如内容在 iframe 中)。
8、切换浏览器模式
在编辑任务的过程中,可以使用不同的浏览器模式来优化采集的效果,具体使用场景需要根据实际情况来判断。
更多详情,请参考以下教程:
9、设置提取字段
在智能模式下,软件会自动识别网页中的数据并显示在采集结果预览窗口中。用户可以根据需要设置字段。
更多详情,请参考以下教程:
10、深入采集
如果用户需要采集详情页的信息,可以点击左上角的深入采集按钮,或者直接点击链接打开详情页和数据采集详情页面。
更多详情,请参考以下教程:
11、设置数据过滤器/采集范围
在编辑任务的过程中,如果用户需要设置一些过滤条件或者设置采集的范围,可以点击页面上相应的按钮来设置功能。
更多详情,请参考以下教程:
12、采集任务设置
在启动采集任务之前,我们需要配置采集任务,包括定时启动、智能策略、自动导出、文件下载、加速引擎、重复数据删除和开发者设置。
更多详情,请参考以下教程:
13、运行数据接口
启动任务后,会跳转到数据运行界面,用户可以看到数据采集的情况。
更多详情,请参考以下教程:
14、查看采集结果和导出数据
采集任务完成后,用户可以查看采集结果并导出数据。
更多详情,请参考以下教程: