优采云采集器智能模式的基本操作流程【图文教程】

优采云 发布时间: 2021-04-03 01:20

  优采云采集器智能模式的基本操作流程【图文教程】

  如果您已阅读优采云 采集器智能模式的第一个采集案例,则必须对其有初步的了解。这里我们将详细介绍智能模式的基本操作过程。

  1、输入正确的网址

  输入正确的URL后,此采集任务成功完成一半。

  优采云 采集器支持单个URL和多个URL 采集,支持从本地TXT文件导入URL,还支持批量生成参数URL。

  有关更多详细信息,请参阅以下教程:

  2、选择页面类型并设置分页

  在智能模式下,优采云 采集器将自动识别网页。如果识别不正确,则可以先手动自动识别。如果手动自动识别无效,则可以手动单击“选择列表”,以帮助软件识别正确的结果。

  有关更多详细信息,请参阅以下教程:

  对于上述页面类型,您可以单击以下链接以了解有关特定信息的更多信息:

  3、预登录

  在编辑任务的过程中,有时我们会遇到需要登录才能查看内容的网页。此时,我们需要使用预登录功能,登录成功后才能执行正常数据采集。

  有关更多详细信息,请参阅以下教程:

  4、预执行动作

  在编辑任务的过程中,如果用户需要执行单击操作,则可以使用预先执行的操作来满足用户的需求。

  有关更多详细信息,请参阅以下教程:

  5、输入验证码

  在编辑任务期间,如果用户遇到验证码,则可以单击右上角的验证码输入功能以手动输入。

  有关更多详细信息,请参阅以下教程:

  6、切换代理

  在编辑任务期间,如果用户遇到无法显示页面或提示输入验证码的情况,还可以单击右上角的切换代理功能进行操作。

  有关更多详细信息,请参阅以下教程:

  7、网络安全设置

  在编辑任务期间,如果用户遇到异常的网页,则可以尝试使用此功能,但是请注意,启用此选项可能会导致页面上的某些内容失败采集(例如iframe)。

  8、切换浏览器模式

  在编辑任务过程中,可以使用不同的浏览器模式来优化采集的效果,具体使用场景需要根据实际情况进行判断。

  有关更多详细信息,请参阅以下教程:

  9、设置提取字​​段

  在智能模式下,该软件将自动识别网页中的数据并将其显示在采集结果预览窗口中,用户可以根据需要设置字段。

  有关更多详细信息,请参阅以下教程:

  1 0、深采集

  如果用户需要采集详细信息页面的信息,则可以单击左上角的深采集按钮,或直接单击链接以打开详细信息页面,即采集的数据。详细信息页面。

  有关更多详细信息,请参阅以下教程:

  1 1、设置数据过滤器/ 采集范围

  在编辑任务的过程中,如果用户需要设置一些过滤条件或设置采集范围,则​​可以单击页面上的相应按钮来设置功能。

  有关更多详细信息,请参阅以下教程:

  1 2、 采集任务设置

  在启动采集任务之前,我们需要配置采集任务,包括定时启动,智能策略,自动导出,文件下载,加速引擎,重复数据删除和开发人员设置。

  有关更多详细信息,请参阅以下教程:

  1 3、操作数据接口

  启动任务后,将跳至数据运行界面,用户可以在该界面上看到数据采集的情况。

  有关更多详细信息,请参阅以下教程:

  1 4、查看采集结果并导出数据

  采集任务结束后,用户可以查看采集的结果并导出数据。

  有关更多详细信息,请参阅以下教程:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线