搜索引擎优化原理(搜索引擎工作过程非常复杂，接下来的几节我们简单介绍(组图))

优采云发布时间: 2022-02-08 19:12

　　搜索引擎的工作过程非常复杂。在接下来的几节中，我们将简要介绍搜索引擎如何实现网页排名。这里呈现的内容只是相对于真正的搜索引擎技术的划痕，但对于SEO人员来说已经足够了。

　　一个搜索引擎的工作过程大致可以分为三个阶段。

　　(1)爬取爬取：搜索引擎蜘蛛通过以下链接访问网页，获取页面HTML代码并存入数据库。

　　(2)预处理：索引程序对抓取的页面数据进行文本提取、中文分词、索引等，为排名程序调用做准备。

　　(3)排名：用户进入关键词后，排名程序调用索引库数据，计算相关度，然后生成一定格式的搜索结果页面。

　　爬行和爬行

　　爬取和爬取是搜索引擎工作的第一步，完成数据采集的任务。

　　1.蜘蛛

　　搜索引擎用来抓取和访问页面的程序称为蜘蛛，也称为机器人。

　　搜索引擎蜘蛛访问网站页面类似于普通用户使用的浏览器。蜘蛛程序发送页面访问请求后，服务器返回HTML代码，蜘蛛程序将接收到的代码存储在原创页面数据库中。为了提高爬取和爬取的速度，搜索引擎使用多个蜘蛛并发分布爬取。

　　当蜘蛛访问任何网站时，它会首先访问网站根目录下的robots.txt 文件。如果 robots.txt 文件禁止搜索引擎抓取某些文件或目录，则蜘蛛会遵守协议，不会抓取被禁止的 URL。

　　与浏览器一样，搜索引擎蜘蛛也具有标识自己的代理名称。站长可以在日志文件中查看搜索引擎的具体代理名称，以识别搜索引擎蜘蛛。常见的搜索引擎蜘蛛名称如下：

　　百度pitrthtp:///search/spide.htm) 百度蜘蛛

　　Mozilla/5.0（兼容；Yahoo! Slurp 中国；htp:///help.htm1) Yahoo! Slurp 中国；

　　Mila/5.0（兼容；Yahoo! Slurp/3.0；htp:/://help/us/ysearc/slurp）英文雅虎蜘蛛

　　Moilla/5.0（兼容；Googlebot2.1；ttp:///bot.htmI）谷歌蜘蛛

　　msnbot/1.1 (thtp:///msnbot.htm) 微软必应蜘蛛

　　搜狗+webtrobot+(ttp:///docs/help/webmasters.htm#07)搜狗蜘蛛

　　sososricr+htp://n/webspider.htm) 搜搜蜘蛛

　　Mozila/5.0 (兼容; YodaoBot/1.0; htp://www.yoo.om/help/webmastr/spider; )

　　（待续）

　　学习建站了解网站能做什么，可以看上面的答案！！

0

2022-02-08

搜索引擎优化原理

0 个评论

要回复文章请先登录或注册