免规则采集器列表算法(免规则采集器列表算法提升搜索体验的思路和做法)
优采云 发布时间: 2021-11-12 07:04免规则采集器列表算法(免规则采集器列表算法提升搜索体验的思路和做法)
免规则采集器列表算法一般而言,它只会对数据列做规则提取,不会对其它列进行类似判断。上述任何一个规则,都是基于全新的数据库逻辑来实现的。如果对于某个规则产生了多条相关联的数据列,对于数据库其它列的规则也将会被强制解释为一条,不管其它列的表达式如何。要在大量数据列中对数据进行规则提取,处理复杂的搜索操作,就需要设置多份用户规则,分别放在不同的地方。
由于每个用户规则代码量较大,而且会存在版本、参数更改等问题,无法像对于每一个列是可以通过标准匹配引擎对其进行规则定制那样快速集成。这种情况下,将规则放在用户规则列表中是最快捷的做法。提升搜索体验这种情况下,不如采用标准规则定制的方式,通过将标准规则和用户规则提交系统对接,用户可以在自己的机器上创建多份规则,这些规则通过系统规则和用户规则进行编码对等,规则一个分支下产生的数据也是完全统一的。
因此这种方式可以在无需在数据库加入规则提取器的情况下,提升规则引擎的搜索体验。去除索引限制这个方式同样可以提升规则引擎的搜索体验,去除标准规则,让搜索机器只能搜索被搜索的最后一条数据。因为索引限制是一个系统发展过程中很常见的限制,一般会以某种机制来解决,例如采用搜索机器的隐式哈希(redis)映射的特性,或者提供关联结构化的数据,或者对未定义规则进行特殊处理等等。
去除上下文限制这个方式同样是一个常见的思路,以主关键字(主键或者唯一或者字符串)作为关键字,在这个关键字的字符串中填写默认关键字即可。为了尽量地去除索引限制,可以将搜索引擎建成一个组,然后将关键字放在组里面进行搜索,并且在每个组后面都加入一个可搜索的对象列表。想了解标准规则是怎么定义的?也可以看看我以前的文章。