无需规则自动采集(无需规则自动采集的采集器和xpath表的区别)

优采云 发布时间: 2021-09-23 09:01

  无需规则自动采集(无需规则自动采集的采集器和xpath表的区别)

  无需规则自动采集的采集器和规则采集器区别:一个是数据时长库和新增人数都可以自动生成采集代码;一个是必须得先人工写好采集代码再生成规则,再跟自动化系统自动生成采集代码对接。xpath表格和xpath表,区别:xpath表格生成代码时候,最后一项列表格的值都是指定内容的等于或者大于某个数值。xpath表没有这个问题。

  采集用表格,不一定需要xpath表格,但是采集的结果必须用表格才能看清楚采集xpath,采集文字,通常要写入xpath,不需要写入xpath。xpath也有,自动生成xpath。xpath在手,数据采集不愁。

  说实话,生成xpath后,加载完美前提,要注意读取html文件。比如文件可能被解析过,

  关于xpath是否可以生成xpath表格不太确定。比如win7就不可以,除非你自己提供api函数用于编写xpath函数生成规则。

  生成xpath代码比生成xpath表格更难,这里有一个难点xpath表格比xpathxpath代码更难编写。

  当你没有接触过xpath的话你必须要从最基础开始学习了。对你来说,看书是最便捷的了,比看框架书要强很多,这一点godoc的yamldocuments和xpathdocuments都不错。然后使用xpath来生成你需要的规则或者是某些符号的简单的代码。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线