测评:优采云采集器使用教程
优采云 发布时间: 2020-08-31 23:05优采云 采集器使用教程
单击[热采集模板]中的模板,或单击[更多>>]进入采集模板显示页面. 您可以通过[模板类型]和[搜索模板]等各种方法找到目标模板.
③不需要模板
如果找不到所需的模板,请进入模板显示页面,然后单击右上角的[我想要新模板]提交新的模板生产要求.
官员将评估需求并安排新模板.
2,[采集模板]使用方法
步骤1: 进入[模板详细信息页面]后,请仔细阅读[模板简介],[采集字段预览],[采集参数预览]和[样本数据],以确认由此采集的数据模板符合要求.
注意: 模板中的字段是固定的,您不能自己添加字段. 如果要在模板中添加字段,请联系官方客户服务.
第2步: 确认模板符合要求后,请自行单击[立即使用]和[配置参数]. 常用参数包括关键字,页数,城市,URL等.
请仔细阅读[模板简介]中的使用说明和参数说明,并以正确的格式输入参数,否则会影响模板的使用.
第3步: 然后单击[保存并开始],选择开始[本地采集]. 优采云自动启动1个采集任务和采集数据.
第4步: 完成数据采集后,可以以所需的格式将其导出. 以导出为[Excel]为例.
数据示例:
通过[采集模板]创建和保存的任务将放置在[我的任务]中. 在[我的任务]界面中,您可以对任务执行各种操作,并查看任务采集的历史数据.
如何自定义采集?
使用[智能识别]
[智能识别],您只需输入URL即可自动智能识别网络数据. 支持自动识别列表类型的网页数据,滚动和翻页.
在主页输入框中,输入目标URL,然后单击[开始采集]. 优采云自动打开网页并开始智能识别.
花一些时间,等待智能识别完成.
如果智能识别成功,则一个网页可能收录多组数据,优采云将识别所有数据,然后智能地推荐最常用的一组数据. 如果建议不是您想要的,则可以自己[切换识别结果]. 同时,它可以自动识别网页的滚动和翻转. 该示例URL无需滚动,仅需翻页,因此仅可识别并检查[翻页和采集多页数据].
自动识别完成后,单击[Generate 采集 Settings]以自动生成相应的采集进程,方便用户编辑和修改.
然后,单击左上角的[采集],选择[启动本地采集],然后优采云将启动全自动采集数据.
采集完成后,以所需的方式导出数据.
通过[智能识别]创建和保存的任务将放置在[我的任务]中. 在[我的任务]界面中,您可以对任务执行各种操作,并查看任务采集的历史数据.
值得注意的是,当前的自动识别仅支持列表页面的识别,滚动和翻页