根据百度搜索引擎排名的核心专利技术进行分析吧!
优采云 发布时间: 2021-07-04 23:08根据百度搜索引擎排名的核心专利技术进行分析吧!
很多做SEO的朋友都免不了接触百度的搜索引擎算法,百度经常更新算法。所以一位SEOer曾经说过:SEO就是分析百度的算法,找出算法的漏洞,然后采取行动。用。今天简单说一下百度的算法。注意这只是百度算法的研究
一、百度的两项专利技术
百度拥有两项核心专利技术,一是搜索引擎超链接分析技术;另一种是搜索引擎投票算法。那我们就按照百度搜索引擎排名的核心专利技术来分析吧!
超链接分析技术实际上是使用收录超链接锚文本的抓取页面作为最基本的算法来衡量网页的相关性和权重。
二、搜索引擎投票排名算法
该算法是超链接分析技术后扩展的投票记录算法
搜索引擎排名规则需要在搜索展示和访问之间进行有效的分析、比较和记录。无论是百度排名还是谷歌等搜索引擎结果展示,都不容易判断关键词和快照的权威性。如何判断关键词的权限和实际快照?搜索引擎自然排名
必须从用户出发,根据有效搜索做出判断。当一个人自然检索一个关键词并访问结果时,用户往往找不到他想要的结果,所以这个人自然搜索后,虽然访问了你网站,但不一定是有效搜索,因为最终搜索可能不会停留在你的网站。
如果你搜索一个词,打开第一个结果,发现不是你想要的,你肯定会继续访问下面的结果,然后停止访问剩下的结果,直到找到你需要的结果(也有可能你只是简单的查找如果找不到你想要的结果,你在找到你需要的结果后自然不会继续访问剩余的结果。最后一个目标页面被称为有效搜索;虽然这个想法而且算法还是有很多缺陷,大部分搜索引擎还是用这个算法作为最好的算法,因为搜索引擎无法判断关键词和快照的权限。
三、搜索引擎超链接分析算法
李彦宏于1997年提交了一项名为“超链接文件检索系统和方法”的专利申请,这比GOOGLE创始人发明PR要早得多。不得不说,这是一项非常具有前瞻性的研究工作。 .
超链接分析算法有两个核心:一是超链接的页面评分判断;百度快速排序算法另一个是锚文本相关性判断;这是李彦宏的超链接分析专利。
在该专利中,李彦宏提出了一种不同于传统信息检索系统的基于链接的排序方法。除了索引页面之外,本系统还构建了一个链接字典,记录了链接的锚文本的一些相关信息,例如锚文本中收录了哪些关键词,发布链接的页面的索引,以及百度快速排序算法收录指向特定锚文本的链接。总数,包括带有特定关键词 的链接指向的页面。同义词库不仅收录关键词 原型,还收录同一词干关键词 的其他派生词。
根据这些链接数据,尤其是锚文本,计算基于链接的文件相关性。用户搜索时,将获得的基于链接的相关性与基于关键词匹配的传统相关性相结合,以获得更准确的排名。
超链接分析专利其实是一种类似于现实生活中链接关系的应用。要确定哪个页面最权威,您不应该只看页面说了什么,还要看其他页面如何评价它。
在今天看来,这种基于链接的相关性计算是搜索引擎的常态,每个SEO人都知道。但在十三四年前,这无疑是一个非常创新的概念。
当然,目前的搜索引擎算法考虑链接不仅是针对锚文本,实际上还比较复杂。一种基于超链接检索与文档索引相关的文档的搜索引擎。
它的索引器遍历超文本数据库并查找超文本信息,包括超链接指向的文档地址和每个超链接的锚文本。
超文本信息存储在倒排索引文件中。这个倒排索引文件也可以用来计算每个超链接指向的特定文档的链接向量。
在输入查询时,搜索引擎在锚文本中查找收录查询词的所有文档的向量。另外,计算查询向量,然后计算查询向量和每个文档的链接向量的点积。
特定文档的相关点积之和决定了每个文档的相关性排名。专利权人是当时李彦宏的公司,发明人是李彦宏本人。
四、百度快排算法
百度本身没有任何快速排序算法。网上所谓的快速排序算法,其实就是SEO从业者研究百度算法,研究百度算法漏洞的算法。
而且这个算法一旦研究出来,效果一般都很好。但是有一个非常重要的问题。一旦百度有针对性地升级算法,快速排序算法就会失效。这就是为什么快排效果快,死亡也快的原因。