智能采集平台(如何在新建智能模式的任务编辑页面进行任务设置? )
优采云 发布时间: 2021-09-15 15:09智能采集平台(如何在新建智能模式的任务编辑页面进行任务设置?
)
创建新的智能模式任务后,软件将打开任务编辑界面。本教程介绍如何在智能模式的任务编辑页面上设置任务
1、刷新页面
如果无法加载网页,可以点击刷新按钮刷新网页,软件将刷新当前网页,重新进行智能识别
2、modify任务URL
你可以在这里编辑网址。如果超过200个,请直接修改本地文件
注意:如果URL是从本地文件导入的,此处的修改不会影响本地文件
有关详细信息,请参阅以下教程:
如何修改网址
3、预登录功能
如果遇到需要登录的网页,可以单击此位置使用预登录功能
有关详细信息,请参阅以下教程:
我采集需要如何登录才能查看我的网页
4、预执行操作功能
在进行页面操作(如单击)时,您可以单击此位置以使用预执行功能
预执行操作中的操作方法类似于流程图的设置。您可以参考流程图教程
有关详细信息,请参阅以下教程:
如何设置预执行
5、验证码输入功能
如果在编辑任务时遇到验证码,可以点击此位置,使用手工录入验证码功能
6、开关代理功能
当您遇到验证代码或编辑任务时无法显示网页内容时,也可以使用switch agent功能
7、web安全选项功能
当遇到网页显示异常时,可以尝试使用此功能,但请注意,打开此选项可能会导致页面上的某些内容采集失败(例如iframe中的内容)
8、切换计算机浏览器功能
有些网页在电脑和手机上显示不同的内容。软件通常默认为网页的采集计算机版本。如果您想要采集移动版的网页,可以将浏览器模式切换到采集
有关详细信息,请参阅以下教程:
切换浏览器模式有什么用
9、设置页面类型功能
创建任务时,软件将自动识别页面类型。如果遇到无法自动识别的网页,可以手动识别或修改XPath。默认情况下,软件根据列表类型对其进行标识。如果是单页类型的网页,则需要手动修改
有关详细信息,请参阅以下教程:
如何设置页面类型
10、Set分页功能
创建任务时,软件会自动识别分页类型。对于无法自动识别的页面,可以手动单击分页按钮或修改XPath,也可以选择不启动分页
有关详细信息,请参阅以下教程:
如何设置分页
11、Set采集range函数
在采集范围内,您可以设置采集起始页和结束页,以及每页采集条目数和提前停止采集的条件
有关详细信息,请参阅以下教程:
如何设置采集范围
12、数据过滤功能
在采集过程中,我们可以使用数据过滤功能过滤所需的数据
有关详细信息,请参阅以下教程:
如何过滤数据
13、清除所有功能
单击“全部清除”将清除所有当前字段
14、Deep采集功能
如果您需要采集详细页面的数据,您可以使用深入的采集函数来采集
有关详细信息,请参阅以下教程:
如何设置深度采集
15、addfield函数
如果需要添加新字段,可以使用此函数
16、Start采集
设置任务后,您可以单击start采集按钮打开启动设置页面
17、保存
单击“保存”保存当前任务的设置。默认情况下,单击start采集保存当前任务