胡水生顾问第一定律相关性定律(图)
优采云 发布时间: 2021-06-09 01:09胡水生顾问第一定律相关性定律(图)
胡水生SEO顾问
相关性第一定律
这听起来像是一篇学术论文。的确,就连第一定律和第二定律之前都没有提到过,但第一定律和第二定律的内容确实得到了业界和学术界的认可。事实上,早在互联网出现之前,学术界就已经广泛研究了第一定律,这就是所谓的关联定律。这个领域被称为信息检索,或信息检索,也被称为全文检索。
当时的相关性是基于词频统计的,即当用户输入一个搜索词时,搜索引擎会寻找那些在文章(网页)中出现频率较高的搜索词,以及它们的位置更重要。是的,在搜索词本身的常用程度上加上一些权重,最后排出一个结果(搜索结果页)。早期的搜索引擎结果排序是基于本文第一定律,如Infoseek、Excite、Lycos等,基本沿袭了互联网时代之前学术界的研究成果,行业的主要精力是处理大访问。在海量数据方面,相关性排名没有突破。
事实上,词频统计根本没有利用任何与网络相关的特征。它是前网络时代的一项技术。但是,互联网时代的主要文档都是网页形式,几乎每个人都可以随意在互联网上发布各种内容。词频相同的两个网页的质量可以相差很大,但是按照搜索引擎排名第一的规律,这两个网页的顺序应该是一样的。为了在某些搜索结果中名列前茅,不少网络内容创作者绞尽脑汁,在自己的页面上堆起了关键词。搜索引擎对此无法防御,这很悲惨。这种情况在 1996 年开始发生变化。
第二定律,人气与质量定律
1996 年 4 月,我去拉斯维加斯*敏*感*词*,召开信息检索学术会议。会议的内容就像拉斯维加斯的天气。像往常一样,它相对无聊。但远离公司,我难得有机会冷静下来认真思考问题。在听一篇无关紧要的论文介绍时,我突然将科学引文索引的机制与网络上的超链接联系起来。感谢北京大学。在我大三的时候,她教我科学引文索引的机制。 ,恐怕美国没有大学会在你本科的时候教你这些东西。
科学引文索引的机制,说白了就是,论文被引用次数多的论文被认为是权威论文,论文就是好论文。当这个想法移植到互联网上时,链接次数较多的网页被认为是高质量和高人气的网页。添加相应的链接文本分析后,可用于对搜索结果进行排序。这就引出了搜索引擎的第二定律:人气和质量定律。根据这个规律,搜索结果的相关性排名并不完全依赖词频统计,而更多地依赖于超链接分析。
我意识到这是一个突破。回去后,我迅速总结思路,于1996年6月申请了这方面的美国专利。1999年7月6日,美国专利商标局批准了专利号为5,920,859的专利,我是唯一的发明人。 1996年底左右,斯坦福大学计算机系的两名*敏*感*词*也想到了同样的解决方案。他们后来创建了一个名为 Google 的搜索引擎。谷歌的网站shang 仍然表示他们的技术正在申请专利。 (正在申请专利)不知道美国专利局会不会再授予这样的专利。无论如何,超链接分析的方法在1998年后逐渐被各大搜索引擎所接受。由于链接是网络内容的基本特征,此时的搜索引擎开始真正利用互联网时代的检索技术。
世界是不可预测的。自2000年互联网泡沫迅速破灭以来,各大搜索引擎要么被收购,要么被推迟上市。所有使用人气和质量法则的搜索引擎公司也未能幸免。那么,搜索引擎的出路在哪里?
自信第三定律
人气和质量定律解决了一个技术问题。然而,搜索引擎自诞生之日起,就从来就不是一个纯粹的技术现象。他们综合了技术、文化、市场等各个层面的因素。解决搜索引擎企业生存和发展的问题,需要搜索引擎第三定律——自信定律。
在 1998 年,没有多少人认真对待一家距离硅谷 500 英里的新成立的公司(现在更名为 Overture)。它只是购买了搜索引擎的技术服务,然后将他们在GoTo搜索结果中的网站排名拍卖给那些网站所有者。谁支付的多,网站排名靠前,支付是根据网友点击网站的情况计算的,只是出现在搜索结果中不需要支付。这是自信法则的最早践行者!根据这个规律,搜索结果的相关性排名,除了词频统计和超链接分析,更注重竞价拍卖。谁对他们的网站有信心,谁就排在第一位。自信的表现愿意为这个排名买单。需要说明的是,自信法则也是我给这个模型起的名字,之前的文献中没有人这样概括过。
在互联网行业萧条、纳斯达克风起云涌的今天,GoTo 蓬勃发展,市值13亿美元,收入占雅虎总收入的35%。回顾门户网站,哪一个可以从其搜索引擎服务中获得总收入的三分之一?原因是GoTo首先践行了搜索引擎的自信法则。以前的搜索引擎是按CPM收费的,CPM是借鉴了传统广告行业,没有考虑网络媒体的即时性、互动性、易竞价等特点。但是对于竞价排名,点击费用是网站店主直接提供销售线索,而不是传统意义上的广告。自信法则改变了过去搜索引擎靠CPM收钱的尴尬局面,开创了真正属于互联网的收费模式。
转载并注明出处:留学软实力