无需规则自动采集(无需规则自动采集的采集器和xpath表的区别)
优采云 发布时间: 2021-09-23 09:01无需规则自动采集(无需规则自动采集的采集器和xpath表的区别)
无需规则自动采集的采集器和规则采集器区别:一个是数据时长库和新增人数都可以自动生成采集代码;一个是必须得先人工写好采集代码再生成规则,再跟自动化系统自动生成采集代码对接。xpath表格和xpath表,区别:xpath表格生成代码时候,最后一项列表格的值都是指定内容的等于或者大于某个数值。xpath表没有这个问题。
采集用表格,不一定需要xpath表格,但是采集的结果必须用表格才能看清楚采集xpath,采集文字,通常要写入xpath,不需要写入xpath。xpath也有,自动生成xpath。xpath在手,数据采集不愁。
说实话,生成xpath后,加载完美前提,要注意读取html文件。比如文件可能被解析过,
关于xpath是否可以生成xpath表格不太确定。比如win7就不可以,除非你自己提供api函数用于编写xpath函数生成规则。
生成xpath代码比生成xpath表格更难,这里有一个难点xpath表格比xpathxpath代码更难编写。
当你没有接触过xpath的话你必须要从最基础开始学习了。对你来说,看书是最便捷的了,比看框架书要强很多,这一点godoc的yamldocuments和xpathdocuments都不错。然后使用xpath来生成你需要的规则或者是某些符号的简单的代码。