如何构建一个匹配函数,查询文档不匹配问题?

优采云 发布时间: 2021-05-01 06:24

  如何构建一个匹配函数,查询文档不匹配问题?

  在搜索中,查询和文档(通常是标题)被视为文本。文档和查询的相关性主要由两者之间的匹配程度来表示。如果匹配高,则认为文档与查询相关。计算机对自然语言的理解仍然具有挑战性。因此,匹配度的计算仍然仅限于文本级别,而不是语义级别。文本级别的高匹配度并不一定意味着语义级别的高相关性,反之亦然。另外,查询由用户发出,文档由编辑器编辑。由于自然语言的歧义性,用户和编辑者可能会使用不同的语言样式和表达方式来呈现相同的概念或主题。结果,搜索系统可能遭受所谓的查询文档不匹配问题。具体来说,当搜索引擎用户和文档编辑者使用不同的文本描述相同的概念(例如“ ny times”和“ New York”)时,查询文档可能不匹配。这仍然是搜索的主要挑战之一。转向交叉模式IR(例如,使用文本查询检索图像文档),查询文档不匹配的问题变得更加严重,因为不同的模态具有不同类型的表示形式。在跨模式检索中,一个主要的挑战是如何构建匹配函数以弥合这些模式之间的“异质性差距”。

  为了解决查询文档不匹配的挑战,一些方法提出了一种在语义级别执行匹配的方法,称为语义匹配。解决方案中的关键思想是执行更多查询和文档理解,以更好地表达查询和文档的含义,或者构建更强大的匹配功能以弥合查询和文档之间的语义鸿沟。已开发出传统的机器学习方法(Li和Xu,201 4)和深度学习方法(Guo等,2019b; Mitra和Craswell,2018; Onal等,201 8))用于语义匹配。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线