智能标签采集器(一下采集器智能模式的基本操作采集案例)

优采云 发布时间: 2022-01-24 10:08

  智能标签采集器(一下采集器智能模式的基本操作采集案例)

  如果你看过优采云采集器智能模式的第一个采集案例,一定对它有一个初步的了解,这里我们将详细介绍智能模式的基本操作流程。

  1、输入正确的网址

  输入正确的 URL 是完成这个 采集 任务的一半。

  优采云采集器支持单URL和多URL采集,支持从本地TXT文件导入URL,支持批量生成参数URL。

  更多详情,请参考以下教程:

  2、选择页面类型并设置分页

  在智能模式下,优采云采集器 会自动识别网页。如果识别不准确,可以先手动识别。如果手动自动识别不起作用,您可以手动识别。单击列表可帮助软件识别正确的结果。

  更多详情,请参考以下教程:

  对于上述页面类型,您可以单击以下链接获取具体信息:

  3、预登录

  在编辑任务的过程中,我们有时会遇到需要登录才能查看内容的网页。这时候,我们就需要用到预登录功能了。登录成功后,我们就可以进行正常的data采集了。

  更多详情,请参考以下教程:

  4、预执行动作

  在编辑任务的过程中,如果用户需要进行点击操作,可以通过预执行操作来满足用户的需求。

  更多详情,请参考以下教程:

  5、输入验证码

  用户在编辑任务的过程中,如果遇到验证码,可以点击右上角的验证码输入功能,手动输入验证码。

  更多详情,请参考以下教程:

  6、切换代理

  在编辑任务过程中,如果用户遇到无法显示的页面或者验证码提示,也可以点击右上角的切换代理功能进行操作。

  更多详情,请参考以下教程:

  7、网络安全设置

  用户在编辑任务过程中,如果遇到网页异常,可以尝试使用该功能,但需要注意的是,开启该选项可能会导致页面部分内容失效采集(如内容在 iframe 中)。

  8、切换浏览器模式

  在编辑任务的过程中,可以使用不同的浏览器模式来优化采集的效果,具体使用场景需要根据实际情况来判断。

  更多详情,请参考以下教程:

  9、设置提取字​​段

  在智能模式下,软件会自动识别网页中的数据并显示在采集结果预览窗口中。用户可以根据需要设置字段。

  更多详情,请参考以下教程:

  10、深入采集

  如果用户需要采集详情页的信息,可以点击左上角的深入采集按钮,或者直接点击链接打开详情页和数据采集详情页面。

  更多详情,请参考以下教程:

  11、设置数据过滤器/采集范围

  在编辑任务的过程中,如果用户需要设置一些过滤条件或者设置采集的范围,可以点击页面上相应的按钮来设置功能。

  更多详情,请参考以下教程:

  12、采集任务设置

  在启动采集任务之前,我们需要配置采集任务,包括定时启动、智能策略、自动导出、文件下载、加速引擎、重复数据删除和开发者设置。

  更多详情,请参考以下教程:

  13、运行数据接口

  启动任务后,会跳转到数据运行界面,用户可以看到数据采集的情况。

  更多详情,请参考以下教程:

  14、查看采集结果和导出数据

  采集任务完成后,用户可以查看采集结果并导出数据。

  更多详情,请参考以下教程:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线