网站搜索引擎优化教程(搜索引擎收录网页的四个阶段是怎样的?(图))

优采云 发布时间: 2021-09-30 03:03

  网站搜索引擎优化教程(搜索引擎收录网页的四个阶段是怎样的?(图))

  站长朋友需要知道。搜索引擎收录页面的特性可以更好的做网站,制作真正有价值的网站内容

  作为SEO从业者,你不仅要被搜索引擎抓取,还要被收录抓取。最重要的是在收录之后有一个好的排名。本文将简要分析搜索引擎收录一个网页的四个阶段。每个网站和每个页面的排名都不一样。看看你的 网站 处于哪个阶段?

  

  首页收录 第一阶段:大小通吃

  搜索引擎的网页抓取采用“一刀切”的策略,即将网页中找到的链接一一添加到要抓取的网址中,并从新抓取的网页中机械提取网址。这种方法虽然比较老,但是效果很好。这也是为什么很多站长回应说有蜘蛛来访,但没有收录的原因。这只是第一阶段。

  网页收录第二阶段:网页评分

  第二阶段是对网页的重要性进行评级。PageRank 是一种著名的链接分析算法,可用于衡量网页的重要性。当然,网站管理员可以使用 PageRank 对 URL 进行排名。这就是您热衷的“失败链”。据一位朋友介绍,中国“断链”市场每年都有数亿元的规模。

  爬虫的目的是下载网页,但PageRank是全局算法,即当所有网页都下载完毕后,计算结果是可靠的。对于中小型网站来说,如果服务器质量不好,在爬取过程中如果只看到部分内容,则在爬取阶段无法获得可靠的PageRank分数。

  网站收录 第三阶段:OCIP 策略

  OCIP 策略更像是对 PageRank 算法的改进。在算法开始之前,每个网页都会获得相同的“*敏*感*词*”。每当A页面被下载时,A就会将他的“*敏*感*词*”平均分配给该页面所收录的链接页面,并清算他的“*敏*感*词*”。这也是导出链接越少权重越高的原因之一。

  对于要爬取的网页,*敏*感*词*最多的网页会按照手头*敏*感*词*的多少进行排序,*敏*感*词*最多的网页会先下载。OCIP 与 PageRank 大致相同。区别在于:PageRank每次都需要迭代计算,而OCIP则不需要计算。速度比PageRank快很多,适合实时计算。这可能就是为什么很多网页都有“二次采集”的原因。

  网站收录 阶段 4:大网站优先策略

  优先考虑大网站的想法很简单。以网站为单位来衡量网页的重要性。对于URL队列中待抓取的网页,按照网站进行分类,如果有网站等待下载的页面数最多,则优先下载这些链接。基本思想是“倾向于先下载大的网站URL”。因为大 网站 往往收录更多页面。鉴于大型网站往往都是知名网站,而且它们的网页一般都是高质量的,这个想法很简单,但是有一定的依据。

  实验表明,该算法虽然简单粗暴,但可以收录高质量的网页,并且非常有效。这也是为什么网站的很多内容都被转载了,但是大网站却能排在你面前的最重要的原因之一。

  以上就是网站优化搜索引擎收录网页四个阶段的详细内容。更多详情请关注其他相关html中文网站文章!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线