网站搜索引擎优化 属于什么费用(如何使得搜索引擎用户真正的搜索结果更准确?(图))
优采云 发布时间: 2021-10-04 11:33网站搜索引擎优化 属于什么费用(如何使得搜索引擎用户真正的搜索结果更准确?(图))
目前搜索引擎可以说是所有互联网应用中技术含量最高的,虽然申请形式很简单:用户输入一个查询词,搜索引擎返回搜索结果。但要为亿万网民提供准确、快速的搜索结果,技术手段有很多。总的来说,搜索引擎技术希望达到的目标可以概括为:更全面、更快、更准确。所谓“更全”,是指被索引的网页数量。目前,任何商业搜索引擎索引网页的覆盖范围都只占互联网页面的一部分。这个目标可以通过改进网络爬虫相关技术来实现。
“更快”的目标贯穿了搜索引擎的大部分技术方向。比如直接提出索引相关技术、缓存等技术来实现这个目标。许多其他技术也间接服务于这一点,即使是分布式海量云存储平台,也能够处理海量的网络数据。
以实现对“更完整”和“更快”两个目标的响应和支持。
如上所述,搜索引擎如何更准确地搜索是其最重要的目标,那么如何才能使搜索结果更准确呢?这涉及以下三个核心问题。
1.用户真正的需求是什么
搜索引擎用户输入的查询请求很短,查询的平均长度为2.7个字。如何从这么短的查询请求中知道隐藏的真实用户需求?这是搜索引擎首先需要解决的一个非常重要的问题。如果无法获得用户的真实搜索意图,就无法讨论搜索的准确性,即使后续的内容匹配算法再精妙,也无济于事。从另一个角度来看,即使是同一个查询词,不同的用户也有不同的搜索目的。如何识别这种差异?如果再进一步,即使同一个查询是同一个用户发送的,也可能是不同的,因为用户在不同的场景中,目的不同。如何识别?这些都是搜索引擎需要解决的核心问题,即当用户此时和此处发出某个查询时,用户的真实搜索意图是什么。
2.哪些信息与用户需求真正相关
上面提到的第一个核心问题是从用户需求的角度出发,另外两个核心问题是从数据的角度来考虑的。搜索引擎本质上是一个匹配过程,即从海量数据中寻找能够匹配用户需求的内容。因此,在明确用户真实意图的前提下,如何找到能够满足用户需求的信息就成为关键因素。判断内容与用户查询的相关性关键词一直是信息检索领域的核心研究课题,不断提出的信息检索模型正试图解决这个问题。相关研究历时近60年。虽然提出了新的方法,整体检索效果逐渐提升,该领域的基本指导思想仍然是基于关键词的匹配,包括当前所有搜索引擎的相关性计算。在某种程度上,基本的计算思想与几十年前没有本质区别。
如何在这个核心问题上取得突破?这个问题会越来越重要,从匹配关键词到让机器真正理解信息的含义,是解决这个问题必须跨越的一道门槛。从目前来看,虽然包括人工智能在内的很多相关研究领域都在这方面取得了进展,但在短期内还没有看到明确的技术思路来解决这个问题。
3.用户可以信任哪些信息
搜索本质上是寻找能够满足用户需求的信息。虽然相关性是衡量信息是否满足用户需求的一个重要方面,但并不是全部。信息是否可信是另一个重要的衡量标准。
从某种角度来说,链接分析之所以能够提升搜索结果,可以认为是对信息可信度的判断。网页的重要性作为判断是否可信的标准,返回重要网页即返回可信网页。