干预词典是在系统无法正确纠错时提供一种途径(组图)

优采云 发布时间: 2021-08-18 03:33

  干预词典是在系统无法正确纠错时提供一种途径(组图)

  干预字典是为用户提供一种在系统无法正确纠正错误时自定义纠错行为的方式。通过创建干预词典并配置查询分析中的拼写检查功能,选择相应的干预词典,实现纠错干预。

  使用介绍

  目前系统内置的拼写纠正词典支持人工干预。用户干预的过程通常有以下四个步骤:

  创建一个拼写错误纠正干预词典。用户通过搜索算法中心--->召回配置--->词典管理进入查询分析干预词典页面后,点击页面右上角的“创建”。选择词典类型后,为词典命名,创建干预词典,该词典会出现在页面的词典列表中。

  在干预词典中添加和管理干预条目。词典创建完成后,点击列表中的词典名称或点击词典对应的“管理”,进入干预词典详情页面。用户可以在详细信息页面中添加和管理干预条目。用户可以执行两种类型的干预来查询:

  添加更正词:在Query中添加更正词,系统会在查询Query时重写添加的更正词以调用结果。

  屏蔽改正词:对于屏蔽改正词的Query,在查询Query时,系统将不再重写屏蔽改正词来召回结果。

  使用干预词典。创建并填充拼写纠正词干预词典后,您可以选择在任何应用的查询规则中使用它。

  介入词典效果测试和在线。查询分析规则使用干预词典后,建议在线应用前先进行搜索效果测试,评估效果是否达到干预预期。

  干预条目的有效顺序

  1.顶部位置的干预入口优先:

  例如:干预词条:中国建设局->中国建设局好->建设银行,查询:中国建设社好,两个干预数据在查询中都有连续的语义词匹配,但是由于查询中的干预条目有重叠,所以选择了位置较高的干预条目生效,最终的纠错结果是中建非常好。

  2.的位置相同时,干预词的长度(语义词的个数)优先:

  例如:干预入口方法->开发与开放搜索->开放搜索,查询:开放搜索真的不错,最终纠错结果是开放搜索真的不错

  3.A 查询可以有多个收录匹配的干预才能生效。

  注意:

  干预条目:

  手机冲电器->手机充电器

  查询:

  query:手机冲电器哪个排子好

  结果:干预后的结果:手机充电器哪排好?使用此查询对系统模型进行纠错。在保证手机充电器->手机充电器干预生效的前提下,系统会进行进一步的纠错。 , 得出哪个品牌的手机充电器更好的结果。

  实践练习

  业务场景:电子商务导购业务在OpenSearch应用实例中使用查询分析规则。规则包括拼写错误纠正功能,但是网上查到了badcase,所以决定使用干预功能。

  badcase:当用户搜索Query“Fujian”时,结果并不多,但都收录“Fujian”关键词。事实上,这个查询的很多相关结果都没有被召回。

  问题诊断:用户输入的查询不正确。正确的写法应该是“Fujian”,系统的拼写纠错没有识别出错误的写法。

  解决方法:新建一个拼写纠错干预词典,在查询“福建”下干预添加更正词“福建”,然后将拼写纠错词典应用到在线查询分析规则中。

  步骤:

  1.控制台—->搜索算法中心—->Recall配置—->词典管理,创建拼写纠错词典:

  

  填写“姓名”,字典类型选择“拼写错误更正”:

  

  2.在新创建的拼写纠错干预词典中添加干预词条,查询栏填写“福建”,更正词栏填写“福建”,干预类型选择“添加”:

  

  3.首先在查询分析界面将新创建的“拼写纠错干预词典”应用到离线查询分析规则中,测试搜索效果:

  

  4.搜索测试是否符合预期结果。发现搜索结果召回结果改写为“福建”,符合预期:

  

  备注功能限制

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线