搜索引擎的3个核心问题,如何使得搜索结果更准确?

优采云 发布时间: 2021-08-11 01:19

  搜索引擎的3个核心问题,如何使得搜索结果更准确?

  搜索引擎的3个目标

  搜索引擎可以说是目前所有互联网应用中技术最先进的,虽然它的应用形式很简单:用户输入一个查询词,搜索引擎返回搜索结果。但要为亿万网民提供准确、快速的搜索结果,技术手段有很多。总的来说,搜索引擎技术希望实现的目标可以概括为:更全面、更快、更准确,如图1-1所示。

  

  图 1-1 搜索引擎的三个目标

  所谓的“更全面”是指被索引的网页数量。目前,任何商业搜索引擎索引网页的覆盖范围都只占互联网页面的一部分。这可以通过改进网络爬虫相关技术来实现。目标。

  “更快”的目标贯穿了搜索引擎的大部分技术方向。比如直接提出索引相关技术、缓存等技术来实现这个目标。许多其他技术也间接地为此服务。即使是分布式的海量云存储平台,也被设计为能够处理海量的网页数据,以实现对“更完整”和“更快”两个目标的响应和支持。

  这三个目标中,如何让搜索结果“更精准”是最关键的目标。无论是排序技术、链接分析技术,还是用户研究技术,最终目的都是为了让搜索结果更加准确,提升用户体验。对于一个搜索引擎来说,做到“更全”、“更快”,可以让它不落后于同类产品,但如果能“更精准”,就可以打造自己的核心竞争力。

  搜索引擎的3个核心问题

  

  如上所述,搜索引擎如何更准确地搜索是其最重要的目标,那么搜索结果如何更准确呢?涉及三个核心问题。

  3 个核心问题

  

  1 用户真正的需求是什么?

  搜索引擎用户输入的查询请求非常简短,查询的平均长度为2.7个字。如何从这么短的查询请求中知道隐藏的真实用户需求?这是搜索引擎首先需要解决的一个非常重要的问题。如果无法获得用户真实的搜索意图,搜索的准确性就无从谈起

  起点

  ,无论后续的内容匹配算法多么复杂,都无济于事。

  从另一个角度来看,即使是同一个查询词,不同的用户也有不同的搜索目标。如何识别这种差异?如果再进一步,即使同一个查询是同一个用户发送的,也可能是不同的,因为用户在不同的场景中,目的不同。如何识别?这些都是搜索引擎需要解决的核心问题,即用户在此时此地发出某个查询时,用户的真实搜索意图是什么。

  2哪些信息与用户需求真正相关

  上面提到的第一个核心问题是从用户需求的角度出发,另外两个核心问题是从数据的角度来考虑的。搜索引擎本质上是一个匹配过程,即从海量数据中寻找能够匹配用户需求的内容。因此,在明确了用户真实意图的前提后,如何找到

  满足用户需求的信息成为关键因素。

  判断内容与用户查询的相关性关键词一直是信息检索领域的核心研究课题,不断提出的信息检索模型正试图解决这个问题。相关研究历时近60年。虽然提出了新的方法,整体的检索效果逐渐提升,但该领域的基本指导思想仍然是基于关键词的匹配,包括目前所有搜索引擎的相关性计算部分。基本计算思路和几十年前没有本质区别。

  如何在这个核心问题上取得突破?这个问题会越来越重要,而从关键词匹配到让机器真正理解信息的含义是解决这个问题必须跨越的门槛。从目前来看,虽然包括人工智能在内的很多相关研究领域都在这方面取得了进展,但在短期内还没有看到明确的技术思路来解决这个问题。

  3哪些信息可以被用户信任

  搜索本质上是寻找能够满足用户需求的信息。虽然相关性是衡量信息是否满足用户需求的一个重要方面,但并不是全部。信息是否可信是另一个重要的衡量标准。

  搜索引擎需要处理的信息对象是任何用户在互联网上发布的内容,但没有明确的标准来判断内容发布者发布的内容是否可信。在此期间,恶意信息发布者故意歪曲事实,也存在信息发布者的偶然失误。在同一个查询的搜索结果中,可能会出现相互冲突的搜索答案。这时候,信息的可信度就成了一个突出的问题。

  例如,用户想在一家餐厅吃饭,在做出消费决定之前,他会在互联网上搜索在该餐厅用餐过的用户的过往评论,以协助决策。搜索到的相关内容完全有可能是餐厅故意发布一些好评信息,以误导消费者。但是如果信息发布者是用户的朋友,信息的可信度就会大大增加。

  从某种角度来说,链接分析之所以能够提升搜索结果,可以认为是对信息可信度的判断。以网页的重要性作为判断是否可信的标准,返回重要网页即返回可信网页。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线