优采云采集器智能模式的基本操作流程【图文教程】
优采云 发布时间: 2021-04-03 01:20优采云采集器智能模式的基本操作流程【图文教程】
如果您已阅读优采云 采集器智能模式的第一个采集案例,则必须对其有初步的了解。这里我们将详细介绍智能模式的基本操作过程。
1、输入正确的网址
输入正确的URL后,此采集任务成功完成一半。
优采云 采集器支持单个URL和多个URL 采集,支持从本地TXT文件导入URL,还支持批量生成参数URL。
有关更多详细信息,请参阅以下教程:
2、选择页面类型并设置分页
在智能模式下,优采云 采集器将自动识别网页。如果识别不正确,则可以先手动自动识别。如果手动自动识别无效,则可以手动单击“选择列表”,以帮助软件识别正确的结果。
有关更多详细信息,请参阅以下教程:
对于上述页面类型,您可以单击以下链接以了解有关特定信息的更多信息:
3、预登录
在编辑任务的过程中,有时我们会遇到需要登录才能查看内容的网页。此时,我们需要使用预登录功能,登录成功后才能执行正常数据采集。
有关更多详细信息,请参阅以下教程:
4、预执行动作
在编辑任务的过程中,如果用户需要执行单击操作,则可以使用预先执行的操作来满足用户的需求。
有关更多详细信息,请参阅以下教程:
5、输入验证码
在编辑任务期间,如果用户遇到验证码,则可以单击右上角的验证码输入功能以手动输入。
有关更多详细信息,请参阅以下教程:
6、切换代理
在编辑任务期间,如果用户遇到无法显示页面或提示输入验证码的情况,还可以单击右上角的切换代理功能进行操作。
有关更多详细信息,请参阅以下教程:
7、网络安全设置
在编辑任务期间,如果用户遇到异常的网页,则可以尝试使用此功能,但是请注意,启用此选项可能会导致页面上的某些内容失败采集(例如iframe)。
8、切换浏览器模式
在编辑任务过程中,可以使用不同的浏览器模式来优化采集的效果,具体使用场景需要根据实际情况进行判断。
有关更多详细信息,请参阅以下教程:
9、设置提取字段
在智能模式下,该软件将自动识别网页中的数据并将其显示在采集结果预览窗口中,用户可以根据需要设置字段。
有关更多详细信息,请参阅以下教程:
1 0、深采集
如果用户需要采集详细信息页面的信息,则可以单击左上角的深采集按钮,或直接单击链接以打开详细信息页面,即采集的数据。详细信息页面。
有关更多详细信息,请参阅以下教程:
1 1、设置数据过滤器/ 采集范围
在编辑任务的过程中,如果用户需要设置一些过滤条件或设置采集范围,则可以单击页面上的相应按钮来设置功能。
有关更多详细信息,请参阅以下教程:
1 2、 采集任务设置
在启动采集任务之前,我们需要配置采集任务,包括定时启动,智能策略,自动导出,文件下载,加速引擎,重复数据删除和开发人员设置。
有关更多详细信息,请参阅以下教程:
1 3、操作数据接口
启动任务后,将跳至数据运行界面,用户可以在该界面上看到数据采集的情况。
有关更多详细信息,请参阅以下教程:
1 4、查看采集结果并导出数据
采集任务结束后,用户可以查看采集的结果并导出数据。
有关更多详细信息,请参阅以下教程: