智能采集平台(如何在新建智能模式的任务编辑页面进行任务设置? )

优采云 发布时间: 2021-09-15 15:09

  智能采集平台(如何在新建智能模式的任务编辑页面进行任务设置?

)

  创建新的智能模式任务后,软件将打开任务编辑界面。本教程介绍如何在智能模式的任务编辑页面上设置任务

  

  1、刷新页面

  如果无法加载网页,可以点击刷新按钮刷新网页,软件将刷新当前网页,重新进行智能识别

  

  2、modify任务URL

  你可以在这里编辑网址。如果超过200个,请直接修改本地文件

  注意:如果URL是从本地文件导入的,此处的修改不会影响本地文件

  有关详细信息,请参阅以下教程:

  如何修改网址

  

  

  3、预登录功能

  如果遇到需要登录的网页,可以单击此位置使用预登录功能

  有关详细信息,请参阅以下教程:

  我采集需要如何登录才能查看我的网页

  

  4、预执行操作功能

  在进行页面操作(如单击)时,您可以单击此位置以使用预执行功能

  预执行操作中的操作方法类似于流程图的设置。您可以参考流程图教程

  有关详细信息,请参阅以下教程:

  如何设置预执行

  

  5、验证码输入功能

  如果在编辑任务时遇到验证码,可以点击此位置,使用手工录入验证码功能

  

  6、开关代理功能

  当您遇到验证代码或编辑任务时无法显示网页内容时,也可以使用switch agent功能

  

  7、web安全选项功能

  当遇到网页显示异常时,可以尝试使用此功能,但请注意,打开此选项可能会导致页面上的某些内容采集失败(例如iframe中的内容)

  

  8、切换计算机浏览器功能

  有些网页在电脑和手机上显示不同的内容。软件通常默认为网页的采集计算机版本。如果您想要采集移动版的网页,可以将浏览器模式切换到采集

  有关详细信息,请参阅以下教程:

  切换浏览器模式有什么用

  

  9、设置页面类型功能

  创建任务时,软件将自动识别页面类型。如果遇到无法自动识别的网页,可以手动识别或修改XPath。默认情况下,软件根据列表类型对其进行标识。如果是单页类型的网页,则需要手动修改

  有关详细信息,请参阅以下教程:

  如何设置页面类型

  

  10、Set分页功能

  创建任务时,软件会自动识别分页类型。对于无法自动识别的页面,可以手动单击分页按钮或修改XPath,也可以选择不启动分页

  有关详细信息,请参阅以下教程:

  如何设置分页

  

  11、Set采集range函数

  在采集范围内,您可以设置采集起始页和结束页,以及每页采集条目数和提前停止采集的条件

  有关详细信息,请参阅以下教程:

  如何设置采集范围

  

  12、数据过滤功能

  在采集过程中,我们可以使用数据过滤功能过滤所需的数据

  有关详细信息,请参阅以下教程:

  如何过滤数据

  

  13、清除所有功能

  单击“全部清除”将清除所有当前字段

  

  14、Deep采集功能

  如果您需要采集详细页面的数据,您可以使用深入的采集函数来采集

  有关详细信息,请参阅以下教程:

  如何设置深度采集

  

  15、addfield函数

  如果需要添加新字段,可以使用此函数

  

  16、Start采集

  设置任务后,您可以单击start采集按钮打开启动设置页面

  

  17、保存

  单击“保存”保存当前任务的设置。默认情况下,单击start采集保存当前任务

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线