自动采集器怎么用(优采云采集器采集的数据不需要怎么办?处理方法介绍)

优采云 发布时间: 2021-11-28 13:36

  自动采集器怎么用(优采云采集器采集的数据不需要怎么办?处理方法介绍)

  优采云采集器是目前使用最广泛的互联网数据采集、处理、分析、挖掘软件。拥有独一无二的十年经验,已成为行业领先品牌。该软件以其灵活的配置和强大的性能领先国内数据采集产品,采集/发布如同复制/粘贴一样准确,获得了众多用户的一致认可,优采云采集器可自动采集高质量内容定期发布;并配置了多种数据处理选项。

  

  优采云采集器采集内容过滤教学图一

  优采云采集器使用帮助

  有时候采集的一些数据不需要做?优采云采集器的内容过滤功能可以完成这个任务。

  第二步:采集内容规则---数据处理---内容过滤

  有几种方法可以处理内容过滤:

  1.内容不得收录且内容必须收录:

  可以设置多个单词,支持选择一个。必须满足所有条件或 b. 可以满足其中一个条件

  2.采集 结果不能为空:该功能可以防止字段内容为空。

  3.采集 结果不能重复:该功能可以防止一个字段中的重复内容。设置此项前请确保您没有采集数据,或者请先清除采集数据。

  4.内容长度小于(大于、等于、不等于)时过滤 N:符号或字母或数字或汉字算一个。

  

  优采云采集器采集内容过滤教学图2

  服务器远程管理

  这是企业版的功能。您可以通过http接口获取软件运行信息,控制软件运行,实现软件的远程管理。

  可用:平台版本和采集器扩展安装信息,获取任务规则列表,定时任务列表,任务采集数据信息。

  可控:启动、暂停和停止任务,编辑和删除任务,添加和修改计划任务等。

  (1)设置端口号点击开始

  

  优采云采集器采集内容过滤教学图3

  (2)注:启动服务器远程管理后,可以直接访问本地局域网中的http接口,如果想访问和控制广域网中的http接口,有两种情况:

  ①如果有固定的外网IP,可以直接使用外网IP加上端口号直接访问。

  ②如果是公网,则需要在路由器中设置端口转发(即内网穿透),然后通过公网IP加端口号访问。

  设置后,可以在任意广域网中访问和控制http接口。电脑和手机都可以访问和控制采集器的任务。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线