自动采集器怎么用(优采云采集器采集的数据不需要怎么办?处理方法介绍)
优采云 发布时间: 2021-11-28 13:36自动采集器怎么用(优采云采集器采集的数据不需要怎么办?处理方法介绍)
优采云采集器是目前使用最广泛的互联网数据采集、处理、分析、挖掘软件。拥有独一无二的十年经验,已成为行业领先品牌。该软件以其灵活的配置和强大的性能领先国内数据采集产品,采集/发布如同复制/粘贴一样准确,获得了众多用户的一致认可,优采云采集器可自动采集高质量内容定期发布;并配置了多种数据处理选项。
优采云采集器采集内容过滤教学图一
优采云采集器使用帮助
有时候采集的一些数据不需要做?优采云采集器的内容过滤功能可以完成这个任务。
第二步:采集内容规则---数据处理---内容过滤
有几种方法可以处理内容过滤:
1.内容不得收录且内容必须收录:
可以设置多个单词,支持选择一个。必须满足所有条件或 b. 可以满足其中一个条件
2.采集 结果不能为空:该功能可以防止字段内容为空。
3.采集 结果不能重复:该功能可以防止一个字段中的重复内容。设置此项前请确保您没有采集数据,或者请先清除采集数据。
4.内容长度小于(大于、等于、不等于)时过滤 N:符号或字母或数字或汉字算一个。
优采云采集器采集内容过滤教学图2
服务器远程管理
这是企业版的功能。您可以通过http接口获取软件运行信息,控制软件运行,实现软件的远程管理。
可用:平台版本和采集器扩展安装信息,获取任务规则列表,定时任务列表,任务采集数据信息。
可控:启动、暂停和停止任务,编辑和删除任务,添加和修改计划任务等。
(1)设置端口号点击开始
优采云采集器采集内容过滤教学图3
(2)注:启动服务器远程管理后,可以直接访问本地局域网中的http接口,如果想访问和控制广域网中的http接口,有两种情况:
①如果有固定的外网IP,可以直接使用外网IP加上端口号直接访问。
②如果是公网,则需要在路由器中设置端口转发(即内网穿透),然后通过公网IP加端口号访问。
设置后,可以在任意广域网中访问和控制http接口。电脑和手机都可以访问和控制采集器的任务。