搜索引擎优化原理(搜索引擎工作过程非常复杂,接下来的几节我们简单介绍(组图))

优采云 发布时间: 2022-02-08 19:12

  搜索引擎优化原理(搜索引擎工作过程非常复杂,接下来的几节我们简单介绍(组图))

  搜索引擎的工作过程非常复杂。在接下来的几节中,我们将简要介绍搜索引擎如何实现网页排名。这里呈现的内容只是相对于真正的搜索引擎技术的划痕,但对于SEO人员来说已经足够了。

  一个搜索引擎的工作过程大致可以分为三个阶段。

  (1)爬取爬取:搜索引擎蜘蛛通过以下链接访问网页,获取页面HTML代码并存入数据库。

  (2)预处理:索引程序对抓取的页面数据进行文本提取、中文分词、索引等,为排名程序调用做准备。

  (3)排名:用户进入关键词后,排名程序调用索引库数据,计算相关度,然后生成一定格式的搜索结果页面。

  爬行和爬行

  爬取和爬取是搜索引擎工作的第一步,完成数据采集的任务。

  1.蜘蛛

  搜索引擎用来抓取和访问页面的程序称为蜘蛛,也称为机器人。

  搜索引擎蜘蛛访问 网站 页面类似于普通用户使用的浏览器。蜘蛛程序发送页面访问请求后,服务器返回HTML代码,蜘蛛程序将接收到的代码存储在原创页面数据库中。为了提高爬取和爬取的速度,搜索引擎使用多个蜘蛛并发分布爬取。

  当蜘蛛访问任何网站 时,它会首先访问网站 根目录下的robots.txt 文件。如果 robots.txt 文件禁止搜索引擎抓取某些文件或目录,则蜘蛛会遵守协议,不会抓取被禁止的 URL。

  与浏览器一样,搜索引擎蜘蛛也具有标识自己的代理名称。站长可以在日志文件中查看搜索引擎的具体代理名称,以识别搜索引擎蜘蛛。常见的搜索引擎蜘蛛名称如下:

  百度pitrthtp:///search/spide.htm) 百度蜘蛛

  Mozilla/5.0(兼容;Yahoo! Slurp 中国;htp:///help.htm1) Yahoo! Slurp 中国;

  Mila/5.0(兼容;Yahoo! Slurp/3.0;htp:/://help/us/ysearc/slurp)英文雅虎蜘蛛

  Moilla/5.0(兼容;Googlebot2.1;ttp:///bot.htmI)谷歌蜘蛛

  msnbot/1.1 (thtp:///msnbot.htm) 微软必应蜘蛛

  搜狗+webtrobot+(ttp:///docs/help/webmasters.htm#07)搜狗蜘蛛

  sososricr+htp://n/webspider.htm) 搜搜蜘蛛

  Mozila/5.0 (兼容; YodaoBot/1.0; htp://www.yoo.om/help/webmastr/spider; )

  (待续)

  学习建站了解网站能做什么,可以看上面的答案!!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线