好用的文章采集工具(排期制作新的模板(二):采集模板的使用)
优采云 发布时间: 2021-09-06 04:00好用的文章采集工具(排期制作新的模板(二):采集模板的使用)
点击【热门采集模板】中的模板,或【更多>>】进入采集模板展示页面。可以通过【模板类型】、【搜索模板】等多种方式找到目标模板。
③ 无需模板
如果没有找到您想要的模板,请进入模板展示页面,点击右上角的【我要新模板】提交新模板制作需求。
官方将评估需求并安排新模板。
2、【采集template】如何使用
Step1:进入【模板详情页】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【样本数据】,确认本模板采集的数据符合要求。
注意:模板中的字段是固定的,不能自行添加字段。如需在模板中添加字段,请联系官方客服。
Step2:确认模板符合要求后,自行点击【立即使用】和【配置参数】。常用参数有关键词、页码、城市、网址等
请仔细查看【模板介绍】中的使用说明和参数说明,并以正确的格式输入参数,否则会影响模板的使用。
Step3:然后点击【保存并启动】,选择启动【local采集】。 优采云自动启动1个采集任务和采集数据。
Step4:数据采集完成后,就可以导出需要的格式了。这是导出到 [Excel] 的示例。
数据示例:
通过[采集template]创建和保存的任务会放在[我的任务]中。在【我的任务】界面可以对任务进行各种操作,查看任务采集的历史数据。
如何自定义采集?
使用【智能识别】
【智能识别】,只需输入网址,即可自动智能识别网页数据。支持自动识别列表型网页数据、滚动和翻页。
在首页输入框中输入目标网址,点击【开始采集】。 优采云自动打开网页并启动智能识别。
给它一些时间,等待智能识别完成。
智能识别成功。一个网页可能有多组数据。 优采云 会识别所有数据,然后智能推荐最常用的集合。如果推荐的不是你想要的,你可以自己【切换识别结果】。同时,它可以自动识别网页的滚动和翻转。对于这个示例网址,不需要滚动,翻页就行,所以只识别和检查【翻页和采集多页数据】。
自动识别完成后,点击【生成采集设置】,自动生成对应的采集进程,方便用户编辑修改。
然后点击左上角的[采集],选择[Start Local采集],优采云会自动开始采集数据。
采集完成后,按照需要的方式导出数据即可。
通过【智能识别】创建和保存的任务会放置在【我的任务】中。在【我的任务】界面可以对任务进行各种操作,查看任务采集的历史数据。
值得注意的是,目前自动识别仅支持列表页、滚动和翻页的识别