智能采集器(如何在新建智能模式的任务编辑页面进行任务设置? )

优采云 发布时间: 2021-12-25 04:10

  智能采集器(如何在新建智能模式的任务编辑页面进行任务设置?

)

  在智能模式下创建任务后,软件会打开任务编辑界面。本教程介绍了如何在智能模式的任务编辑页面设置任务。

  

  1、刷新网页

  如果遇到无法加载网页的情况,可以点击刷新按钮刷新网页,软件会刷新当前网页,重新进行智能识别。

  

  2、修改任务地址

  URL 可以在这里编辑,如果超过 200,请直接修改本地文件。

  注意:如果URL是从本地文件导入的,这里的修改不会影响本地文件。

  更多详情,请参考以下教程:

  修改网址的方法

  

  

  3、预登录功能

  当遇到需要登录的网页时,可以点击该位置使用预登录功能

  更多详情,请参考以下教程:

  如何采集需要登录才能查看的网页

  

  4、预执行操作功能

  当您需要进行点击等页面操作时,可以点击该位置使用预执行操作功能。

  预执行操作中的操作方法与流程图的设置类似。可以参考教程的流程图。

  更多详情,请参考以下教程:

  如何设置预执行操作

  

  5、验证码输入功能

  当您在编辑任务时遇到验证码,可以点击该位置使用手动输入验证码功能。

  

  6、切换代理功能

  您也可以在编辑任务时遇到验证码或网页内容无法显示时使用切换代理功能。

  

  7、网络安全选项功能

  遇到网页显示异常可以尝试使用这个功能,但是要注意开启这个选项可能会导致页面上的某些内容失败采集(比如iframe中的内容)

  

  8、切换电脑浏览器功能

  有些网页在电脑和手机上显示的内容不同。软件一般默认为网页的电脑版。如果想要移动版的网页,可以将浏览器模式切换为采集。

  更多详情,请参考以下教程:

  切换浏览器模式有什么作用

  

  9、设置页面类型功能

  创建任务时,软件会自动识别页面类型。如果遇到无法自动识别的网页,可以手动识别或者修改xpath。软件默认识别列表类型。如果是单页类型,则需要手动修改。

  更多详情,请参考以下教程:

  如何设置页面类型

  

  10、 设置分页功能

  创建任务时,软件会自动识别分页类型。如果遇到无法自动识别的页面,可以手动点击分页按钮或者修改xpath,也可以选择不启动分页。

  更多详情,请参考以下教程:

  如何设置分页

  

  11、设置采集作用域功能

  在采集范围内,可以设置采集的起始页和结束页,以及每页采集的数量和提前停止采集的条件.

  更多详情,请参考以下教程:

  如何设置采集的范围

  

  12、数据过滤功能

  在采集的过程中,我们可以通过数据过滤功能来过滤需要的数据。

  更多详情,请参考以下教程:

  如何过滤数据

  

  13、清除所有功能

  单击全部清除以清除所有当前字段。

  

  14、深入采集功能

  如果需要采集详情页的数据,可以使用采集深入功能采集。

  更多详情,请参考以下教程:

  如何设置深度采集

  

  15、添加字段功能

  如果您需要添加新字段,可以使用此功能。

  

  16、开始采集

  任务设置好后,可以点击启动采集按钮,打开启动设置页面。

  

  17、保存

  单击“保存”按钮保存当前任务的设置。点击开始采集,默认保存当前任务。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线