嘉兴网站搜索引擎优化(一下外链建设中比较有名的核心算法和DirectHit算法)

优采云 发布时间: 2022-03-19 11:05

  嘉兴网站搜索引擎优化(一下外链建设中比较有名的核心算法和DirectHit算法)

  外链是搜索引擎算法中判断网站权重的重要指标。当用户在搜索框中输入关键词时,搜索引擎面对大量相同内容的网页,首先要解决的是,哪些参数决定了页面的排名。今天,万里平台西宁会场将介绍比较有名的外链建设核心算法:PageRank算法、Hilltop算法和Direct Hit算法。

  

  一、PageRank算法

  1998 年,Sergey Brin 和 Lawrence Page 提出了 PageRank 算法。该算法根据“很多优质网页链接的网页一定是优质网页”的回归关系判断网页的重要性。该算法认为网页A到网页B的链接可以看作是A页面对B页面的支持票,根据票数判断页面的重要性。当然,不仅仅是投票数,还有投票页面的重要性。投票越重要的页面,评价越高。根据这样的分析,获得高评价的重要页面将被赋予更高的PageRank值,它们在搜索结果中的排名也会增加。PageRank是基于对“

  PageRank算法的优点是对互联网上的网页进行全局重要性排名,算法的计算过程可以离线完成,有利于快速响应用户请求。但是,它的缺点是与主题无关。它不区分页面中的导航链接、广告链接和功能链接,因此很容易高估广告页面。此外,PageRank 算法的另一个缺点是旧的页面排名会高于新的页面排名。页面高是因为一个新页面,即使是一个非常好的页面,不会有很多链接,除非他是一个站点的子站点。这就是为什么 PageRank 需要多种算法的组合。

  二、山顶算法

  HillTop 是一项搜索引擎结果排名专利,2001 年由 Google 工程师 Bharat 申请专利。HillTop 算法的指导思想与 PageRank 一致,即搜索结果的排名权重由数量和数量决定。反向链接的质量。但是,HillTop 认为,仅从具有相同主题的相关文档中计算链接对搜索者来说更有价值,即与主题相关的页面之间的链接比不相关的链接对权重计算的贡献更大。在 1999-2000 年,Bharat 和其他 Google 开发人员开发该算法时,他们将此类主题文档称为“专家”文档,而只有从这些专家文档页面到目标文档的链接才确定了“权威分数”的主要部分的链接页面。

  Hilltop算法的流程:首先计算出与查询主题最相关的“专家”资源列表;其次在选定的“专家”集中识别相关链接,并按照它们识别相关的网络目标;“专家”的数量和相关性。因此,着陆页的得分反映了最中立的专家对查询主题的集体意见。如果不存在这样的专家库,山顶将不会给出结果。

  从 Hilltop 算法的流程可以看出,该算法主要包括两个方面:寻找专家和排名目标。通过预处理搜索引擎抓取的网页来查找专家页面。对于 关键词 查询,首先查找专家,并对返回的结果进行排序。

  权威页面是查询主题的最佳专家指向的页面。专家也可能是更广泛领域或该主题其他领域的专家。专家页面上只有部分链接与该主题相关。因此,结合查询主题专家之间的相关外向链接,以找到与查询主题相关的页面高度认可的页面。

  从最匹配的专家页面和相关的匹配信息中选择专家页面的超链接子集。尤其是选择那些与所有查询相关的链接。根据这些选定的链接,找到其目标的一个子集作为与查询主题最相关的网页。该目标子集收录由至少两个非相关专家页面链接的网页。目标集根据指向它们的专家的综合得分进行排序。

  Hilltop 在应用中还有一些不足之处。专家页面的搜索和判断在算法中起着关键作用,专家页面的质量决定了算法的准确性;但是,专家页面的质量和公平性很难在一定程度上得到保证。*敏*感*词*忽略了大多数非专家页面的影响。在*敏*感*词*的原型系统中,专家页面仅占整个页面的1.79%,不能完全代表整个互联网。

  当 Hiltop 算法无法得到足够多的专家页面子集(少于两个专家页面)时,返回空,即 Hiltop 适合细化查询排名,但无法覆盖。这意味着 Hilltop 可以结合某种页面排序算法来提高准确性,并不适合作为独立的页面排序算法。从 Hilltop 中基于查询主题的专家页面集合中选择与主题相关的子集也是在线运行的,这会像前面提到的 HITS 算法一样影响查询响应时间。随着专家页面集合的增长,算法的可扩展性会受到影响。

  HITS算法的优势在于可以更好地描述互联网的组织特征。由于它只分析互联网的一个非常小的子集,它需要更少的迭代,更快地收敛,并降低时间复杂度。

  但是,HITS算法也存在以下不足:

  1.当一个 网站 上的多个网页指向同一个链接,或一个网页指向另一个 网站 上的多个网页时,中央网页之间相互引用以提高其网页评级这可能导致单个文件的评级异常增加,从而导致容易受到“垃圾邮件链接”的影响。

  2.话题漂移,在邻接图中往往会收录一些与搜索话题无关的链接,如果这些链接本身是中心页面或权威页面,就会造成话题漂移——对于每个不同的查询算法都需要重新-运行一次以获得结果。这使得它无法在实时系统中使用,因为这样的开销对于数千万并发查询来说太大了。

  三、直击算法

  与前两种算法相比,Direct Hit 算法是一种注重信息质量和用户反馈的排序方法。它的基本思想是搜索引擎将查询的结果返回给用户,并在检索结果中跟踪用户的点击。如果返回结果中排名靠前的网页被用户点击,浏览时间短,用户返回点击其他搜索结果,则可以认为其相关性较差,系统会降低网页的相关性。另一方面,如果网页被用户点击打开进行浏览,且浏览时间较长,则该网页的热度较高,相应地,系统会增加该网页的相关性。可以看出,在这个方法中,相关程度不断变化。对于在不同时间检索到的同一个词,结果集的顺序也可能不同。这是一个动态排序。

  该算法的优点是节省了大量时间,因为用户正在阅读从搜索结果中筛选出的更多合格结果。同时,该算法直接整合用户反馈信息,保证页面质量。

  但是统计显示,Direct Hit算法只适用于检索less关键词,因为它实际上并不进行排序,而是一种过滤和提取。当检索数据库很大时,关键词很多时候会返回上千条搜索结果,用户不可能一一查看。因此,这种方法不能作为主要的排序算法,而是一种很好的辅助排序算法,目前很多搜索引擎仍在使用。

  事实上,网页的搜索排名是各种算法综合作用的结果。简单分析以上三种算法,Pagerank可以给网站上所有网页的重要性排序,但是没有针对性和相关性。而现在PR值作弊已经到了泛滥的地步,于是PR提出了Hilltop算法,将对广大站长搭建外链起到指导作用。在 Hilltop 算法中,每个领域都会有几个专家页面。如果您搜索相关的关键词,搜索引擎将首先从专家页面搜索。等等。Direct Hit 算法可以作为 Hilltop 和 pagerank 的一个很好的补充。Direct Hit考虑了用户体验的影响,实时更新搜索结果的质量。一个最符合搜索用户要求的页面应该是用户从点击搜索框中的页面链接开始,如果用户浏览网站超过一定时间,将被视为结果页面,更符合用户的搜索需求。长期有效的点击会导致页面在搜索引擎中的排名有相应的提升。.

  通过以上三种算法可以了解到,无论是构建外链还是网站内容构建,首先要考虑的就是相关性。在外链建设中,力求找到权威性高的网站、软文、友情链接等,同时注意网站@的跳出率和浏览时间>,时刻反馈用户数据,对部分关键页面和用户点击率高的页面进行相关推荐,引导用户点击更多页面。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线