好用的文章采集工具(排期制作新的模板(二):采集模板的使用)

优采云 发布时间: 2021-09-06 04:00

  好用的文章采集工具(排期制作新的模板(二):采集模板的使用)

  点击【热门采集模板】中的模板,或【更多>>】进入采集模板展示页面。可以通过【模板类型】、【搜索模板】等多种方式找到目标模板。

  ③ 无需模板

  如果没有找到您想要的模板,请进入模板展示页面,点击右上角的【我要新模板】提交新模板制作需求。

  官方将评估需求并安排新模板。

  

  2、【采集template】如何使用

  Step1:进入【模板详情页】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【样本数据】,确认本模板采集的数据符合要求。

  注意:模板中的字段是固定的,不能自行添加字段。如需在模板中添加字段,请联系官方客服。

  Step2:确认模板符合要求后,自行点击【立即使用】和【配置参数】。常用参数有关键词、页码、城市、网址等

  请仔细查看【模板介绍】中的使用说明和参数说明,并以正确的格式输入参数,否则会影响模板的使用。

  Step3:然后点击【保存并启动】,选择启动【local采集】。 优采云自动启动1个采集任务和采集数据。

  

  Step4:数据采集完成后,就可以导出需要的格式了。这是导出到 [Excel] 的示例。

  

  数据示例:

  

  通过[采集template]创建和保存的任务会放在[我的任务]中。在【我的任务】界面可以对任务进行各种操作,查看任务采集的历史数据。

  如何自定义采集?

  使用【智能识别】

  【智能识别】,只需输入网址,即可自动智能识别网页数据。支持自动识别列表型网页数据、滚动和翻页。

  在首页输入框中输入目标网址,点击【开始采集】。 优采云自动打开网页并启动智能识别。

  给它一些时间,等待智能识别完成。

  智能识别成功。一个网页可能有多组数据。 优采云 会识别所有数据,然后智能推荐最常用的集合。如果推荐的不是你想要的,你可以自己【切换识别结果】。同时,它可以自动识别网页的滚动和翻转。对于这个示例网址,不需要滚动,翻页就行,所以只识别和检查【翻页和采集多页数据】。

  自动识别完成后,点击【生成采集设置】,自动生成对应的采集进程,方便用户编辑修改。

  然后点击左上角的[采集],选择[Start Local采集],优采云会自动开始采集数据。

  采集完成后,按照需要的方式导出数据即可。

  通过【智能识别】创建和保存的任务会放置在【我的任务】中。在【我的任务】界面可以对任务进行各种操作,查看任务采集的历史数据。

  值得注意的是,目前自动识别仅支持列表页、滚动和翻页的识别

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线