优采云采集器使用教程
优采云 发布时间: 2022-06-04 10:31优采云采集器使用教程
点击【热门采集模板】中的模板,或者【更多>>】,进入采集模板展示页面。可通过【模板类型】、【搜索模板】多种方法,寻找目标模板。
③ 没有所需的模板
如果没有找到想要的模板,请进入模板展示页面后,点击右上角【我想要新模板】,提交新模板制作需求。
官方会评估需求,排期制作新的模板。
2、【采集模板】如何使用
Step1:进入【模板详情页】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【示例数据】,确认此模板采的数据符合需求。
注意:模板中的字段是固定的,无法自行增加字段。如果想要增加模板中的字段,请联系官方客服。
Step2:确定模板符合需求以后,点击【立即使用】,自行【配置参数】。常见的参数有关键词、页数、城市、URL等。
请认真查看【模板介绍】中的使用方法说明和参数说明,输入格式正确的参数,否则将影响模板的使用。
Step3:然后点击【保存并启动】,选择启动【本地采集】。优采云自动启动1个采集任务并采集数据。
Step4:数据采集完成以后,可以需要的格式导出。这里以导出为【Excel】为例。
数据示例:
通过【采集模板】创建并保存的任务,会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作并查看任务采集到的历史数据。
怎么自定义采集?
使用【智能识别】
【智能识别】,只需输入网址,自动智能识别网页数据。支持自动识别列表型网页数据、滚动和翻页。
在首页输入框中,输入目标网址,点击【开始采集】。优采云自动打开网页并开始智能识别。
给它一点时间,等待智能识别完成。
智能识别成功,一个网页可能有多组数据,优采云会将所有数据识别出来,然后智能推荐最常用的那组。如果推荐的不是想要的,可自行【切换识别结果】。同时,可自动识别出网页的滚动和翻页。此示例网址,无需滚动,只需翻页,故只识别并勾选【翻页并采集多页数据】。
自动识别完成后,点击【生成采集设置】,可自动生成相应的采集流程,方便用户编辑修改。
然后,点击左上角的【采集】,选择【启动本地采集】,优采云就会开始全自动采集数据。
采集完成后,以所需的方式导出数据即可。
通过【智能识别】创建并保存的任务,会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作并查看任务采集到的历史数据。
值得注意的是,目前自动识别,仅支持识别列表型网页、滚动和翻页
支持一下
生活不易,文中的小卡片希望大家可以【点击一下】,你的顺手点击将是我坚持的动力,点击一下即可,感谢万分!