PageRank算法通过投票决定网页质量真正找到计算网页自身质量

优采云 发布时间: 2021-07-16 06:13

  

PageRank算法通过投票决定网页质量真正找到计算网页自身质量

  

  PageRank算法背景:数万条搜索结果只关注前20名用户

  整个互联网的网页数量庞大,百度抓取并收录的中文网页应该有数千亿,但用户需要的信息只是一小部分。几乎我们在百度上搜索的每一个关键词,百度都会返回上千条搜索结果。无论返回多少条结果,大多数人都会在前2页找到自己需要的信息,很少有人会去浏览。第 3 页或之后的搜索结果。

  搜索引擎的问题:如何对用户最想看到的结果进行排名?

  对于搜索引擎来说,这上千条结果应该如何排序,如何将用户最想看到的结果排在第一位?这个问题很大程度上决定了搜索引擎的质量。一般来说,对于一个特定的查询,搜索结果的排名取决于两组信息:

  1.关于网络质量信息,

  2. 该查询与每个网页的信息相关。

  雅虎是第一个尝试在互联网上对许多网站进行排名的人

  第一次尝试在互联网上对众多网站 进行排名的不是谷歌,而是雅虎。雅虎创始人杨致远和菲洛率先使用目录分类技术,让用户通过互联网检索信息。但是,由于计算机存储容量和速度的限制,雅虎等同时代的搜索引擎有一个共同的问题:收录的网页太少,只能索引网页中与常见内容相关的实际词。

  PageRank 算法通过投票决定网页质量

  Google 的创始人佩奇和布林真正找到了用于计算网页本身质量的完美数学模型。什么是 Google 的“PageRank”(页面排名)?其实就是简单的民主投票。比如我们找李开复博士,100个人举手说他们是李开复。那么谁是真的呢?可能有几个,但即便如此,每个人真正要找的是谁?如果大家都说创新工场的那个是真的,那他就是真的。

  

  PgeRank 算法对来自不同网页的链接的处理方式不同

  当然,Google 的 PgeRank 算法实际上要复杂得多。例如,不同网页的链接要区别对待,因为那些来自高排名网页的链接更可靠,所以应该给予这些链接更大的权重。这就像在现实世界中的股东大会上投票一样。必须考虑每个直接股东。对最终投票结果的影响明显不同。 PageRank算法考虑了这个因素,即网站贡献的页面排名高的链接权重很高。

  PageRank的核心思想

  在互联网上,如果同一个网页被许多其他网页链接,则意味着它得到了普遍的认可和信任。那么它的排名就很高。这是PageRank的核心思想。

  

  Google 的革命性发明是 PageRank 的页面排名算法

  页面排名算法的巧妙之处在于将整个互联网视为一个整体,不经意间符合了系统论的观点。相比之下,以前的大多数信息检索都将每个网页视为一个独立的个体。起初,大多数人只关注网页内容和查询语句的相关性,而忽略了网页之间的关系。虽然在佩奇和布林的时候也有人在思考如何利用网页之间的链接来衡量网页的质量,但他们只摸了皮毛,找到了一些拼凑,但并没有从根本上解决问题.

  PR 算法数倍革新准确率

  PageRank 对当时的搜索结果影响很大。 1998 年左右,在 Internet 上找到的所有搜索引擎中,十分之二或三个结果是相关且有用的。当时,仍在斯坦福大学实验室的谷歌能够实现每十个结果中有七个或八个是相关的。这是质的区别,感觉就像是 iPhone 和旧款诺基亚手机的区别。这使 Google 能够快速击败所有以前的搜索引擎。

  用户搜索点击行为对搜索质量影响很大

  但是今天,在任何商业搜索引擎中,十个结果中有七八个是相关的,而决定搜索质量的最有用的信息是用户的点击数据。相反,一项新技术带来的搜索质量提升空间非常有限,用户很难感受到差异。这就是为什么像微软这样的公司很难在搜索领域有所作为。

  时至今日,PageRank 在所有 Google 算法中仍然非常重要

  今天,谷歌搜索引擎比最初更复杂、更完整。但 PageRank 在所有谷歌算法中仍然至关重要。在学术界,该算法被公认为对文档检索的最大贡献之一,被多所大学列为信息检索课程的内容。 Page was also elected as an academician of the American Academy of Engineering at the age of 30 because of this algorithm, and was another dropout who was elected as an academician after Jobs and Gates.由于PageRank算法受专利保护,因此带来两个结果。首先,其他搜索引擎一开始就遵守游戏规则,没有侵犯。这对当时还很弱的谷歌来说,是一个很好的保护。其次,它让斯坦福大学拥有超过 1% 的谷歌股票,而且是有利可图的。超过 10 亿美元。

  SEO 人员如何使用 PR 算法建立外部链接?

  对于搜索引擎优化来说,了解搜索引擎的算法,尤其是链接分析中最重要的算法——谷歌的PageRank算法,将有利于SEO工作的发展。详细了解纵横SEO文章这篇文章《如何通过谷歌PR分析更好地利用PR搭建外链》

  

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线