搜索引擎优化行业排行(来源:PageRank专利和李彦宏超链分析专利的区别2006年05)
优采云 发布时间: 2022-02-28 22:13搜索引擎优化行业排行(来源:PageRank专利和李彦宏超链分析专利的区别2006年05)
来源:PageRank 专利与李彦宏的超链分析专利的区别 2006-05 今天看到洪博的博客文章:超链分析和PageRank的专利问题,第一次知道百度总裁Robin李已经申请了。并获得了超链接分析专利,我们称之为超链接分析专利。而这个专利申请是在谷歌提交自己的 PageRank 专利之前。我之前对中文搜索引擎了解不多,所以我真的很无知。看到这个文章,我的直觉是,如果这两个专利相似或者涉嫌抄袭,这就涉及到两家公司的核心利益。对于我这种搜索引擎优化师来说,也可以学习一些百度算法的内幕。于是我立即去看了李彦宏的专利申请,又看了一遍谷歌公关的专利申请。我的理解是,这两个专利申请之间的区别在于它们完全是在谈论两个不同的事情。所要解决的问题和实施方法不同,虽然研究对象相同,但都是环节。超链接分析解决文档与搜索 关键词 的相关性。李彦宏提出的方法是,除了引用文档本身的关键字外,还需要考虑反向链接中的关键词。具体来说,当一个文档被索引到数据库中时,它与文档的超链接和每个超链接中使用的锚文本(链接文本)一起被记录下来。搜索词还建立了一个数据库,
当搜索 关键词 时,以 关键词 作为链接文本的反向链接数量最多的文档或页面将被列为最相关的结果。这是基本思想,当然还有其他变量需要考虑。例如,当搜索字符串收录多个单词时,每个单词都是搜索向量的一个维度。我更感兴趣的是这个专利申请中提到了词干提取,而提到不同文本文档的相关 PR 专利显然集中在应用超链接分析后无法解决的问题。在谷歌的专利申请中,明确提到即使考虑到文档链接和链接锚文本,搜索引擎还有一个重要的问题需要解决,那就是,来自不同文档的链接具有不同的权重值。您不能指望白宫的链接 网站 与非洲小镇上学生的个人 网站 链接具有相同的投票价值。而 Google PageRank 是衡量网页重要性的一种方式。指向一个网页的链接越多,这些链接本身的权重越高,所指向的网页的重要性和PageRank就越高。谷歌的专利申请展示了如何计算这个重要性指数,他们将其命名为页面级别。页面级别的计算需要多个替代计算循环才能获得接近最终结果的 PR。GooglePR 独立于搜索词或文档相关性。具有与非洲一个小镇学生个人 网站 上的链接相同的投票价值。而 Google PageRank 是衡量网页重要性的一种方式。指向一个网页的链接越多,这些链接本身的权重越高,所指向的网页的重要性和PageRank就越高。谷歌的专利申请展示了如何计算这个重要性指数,他们将其命名为页面级别。页面级别的计算需要多个替代计算循环才能获得接近最终结果的 PR。GooglePR 独立于搜索词或文档相关性。具有与非洲一个小镇学生个人 网站 上的链接相同的投票价值。而 Google PageRank 是衡量网页重要性的一种方式。指向一个网页的链接越多,这些链接本身的权重越高,所指向的网页的重要性和PageRank就越高。谷歌的专利申请展示了如何计算这个重要性指数,他们将其命名为页面级别。页面级别的计算需要多个替代计算循环才能获得接近最终结果的 PR。GooglePR 独立于搜索词或文档相关性。而这些链接本身的权重越高,被指向的网页的重要性和PageRank就越高。谷歌的专利申请展示了如何计算这个重要性指数,他们将其命名为页面级别。页面级别的计算需要多个替代计算循环才能获得接近最终结果的 PR。GooglePR 独立于搜索词或文档相关性。而这些链接本身的权重越高,被指向的网页的重要性和PageRank就越高。谷歌的专利申请展示了如何计算这个重要性指数,他们将其命名为页面级别。页面级别的计算需要多个替代计算循环才能获得接近最终结果的 PR。GooglePR 独立于搜索词或文档相关性。
它仅描述某个文档的重要性或状态。从目前所有搜索引擎的表现来看,可以肯定这两种技术已经应用到了排名算法中,虽然名称可能不同。尤其明显的是,虽然谷歌一直以公关为旗帜,但很少引入他们的其他技术。但近一两年来,谷歌的算法越来越重视链接分析、锚文本分析、词干提取技术。这里所做的分析完全是针对两份专利申请中披露的技术问题,无意评论谁先来、谁受谁启发等。