,如何提高信息检索系统中顶端结果重排序和查询扩展

优采云 发布时间: 2021-06-27 07:16

  ,如何提高信息检索系统中顶端结果重排序和查询扩展

  [摘要]:近年来,随着互联网的蓬勃发展,网络上的数据和信息资源呈爆炸式增长,用户从海量数据中获取信息的难度越来越大。随着信息检索技术的出现和飞速发展,搜索引擎已经成为用户查找信息资源的主要方式。在信息检索过程中,由于用户提交的查询词可能过短或过长,导致查询词不能准确表达用户的查询意图,导致查询词与网络词汇不匹配的问题文档,并且无法检索所需的查询。信息。另外,在大多数情况下,用户一般只对排在搜索结果列表顶部的搜索结果感兴趣,而搜索系统返回的这部分结果收录大量与用户无关的结果。信息需求,只能满足一小部分。用户要求。因此,如何提高信息检索系统中top结果的准确率和用户满意度一直是一个热门的研究课题。为了解决这些问题,研究人员通常采用两种方法:查询结果重新排序和查询扩展。查询扩展方法是通过挖掘与用户信息需求相关的词条对原创查询词条进行扩展,并利用扩展后的查询词条进行第二轮检索。查询结果重排序方法根据第一轮检索结果对结果列表中的文档进行重排序。从实用的角度来看,查询结果的重新排序方法更受欢迎。现有的对查询结果重新排序的方法主要考虑文档和文档之间的关系,利用它构建文档关系图,利用基于图的中心节点、半监督学习等技术重新计算文档和查询词之间的相似度,以达到对查询结果列表中的文档进行重新排序的目的。

  但是,这些方法只考虑了文档之间的关系,有一定的局限性。另一方面,将查询结果重新排序与查询扩展相结合的研究并不多。本文在前人研究的基础上,主要做了以下两个方面的工作:1.本文提出了一种基于多重关系对查询结果进行重新排序的方法。该方法考虑了文档与文档的关系,也考虑了查询结果中排名靠前的文档中关键词items和关键词items之间的关系,以及排名靠前文档中关键词items之间的关系和文件。然后使用正则化框架融合这三种关系,根据第一轮检索结果对查询结果进行重新排序。在信息检索标准评价数据集上的实验结果证明,基于多关系的查询结果重新排序方法比只考虑一种关系的方法可以显着提高准确率。 2.本文基于查询结果的重新排序,结合查询扩展,提出了一种检索排序优化方法。这种方法首先通过正则化框架合并文档和文档之间的关系。在第一轮检索结果的基础上,对检索结果列表文档进行重新排序;然后根据重新排序的结果中排名靠前的文档构建扩展项。设置,然后从构建的扩展词集中选择候选扩展词对原创查询词进行扩展。在真实数据集上的实验结果表明,该方法可以有效提高信息检索系统中top结果的准确率,从而提高用户满意度。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线