2.4搜索引擎是怎样实现网页排名的-zac的seo实战密码
优采云 发布时间: 2021-07-02 18:092.4搜索引擎是怎样实现网页排名的-zac的seo实战密码
扎克的seo实战密码
(注:由于seo实际密码电子书太大无法上传,我先上传一部分,需要的可以联系我,我发给你!)
2.4 搜索引擎工作原理介绍
搜索引擎的工作过程非常复杂。在接下来的几节中,我们将简要介绍搜索引擎如何实现页面排名。这里介绍的内容与真正的搜索引擎技术相比,只是皮包骨,但对于SEO人员来说已经足够了。
搜索引擎的工作过程大致可以分为三个阶段。
(1)
(2)
(3)
2.4.1 爬爬爬行
爬取和爬取是搜索引擎工作的第一步,完成数据采集的任务。
1.蜘蛛
搜索引擎用来抓取和访问页面的程序称为蜘蛛,也称为机器人。
当搜索引擎蜘蛛访问网站页面时,它类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序将接收到的代码存储在原创页面数据库中。搜索引擎为了提高爬取和爬取速度,使用多个蜘蛛并发分布爬取。蜘蛛访问任何网站时,都会先访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不会抓取被禁止的网址。
与浏览器一样,搜索引擎蜘蛛也有用于标识自己的代理名称。站长可以在日志文件中看到搜索引擎的具体代理名称来识别搜索引擎蜘蛛。下面列出了常见的搜索引擎蜘蛛。名称:
百度蜘蛛+(+)百度蜘蛛
雅虎中国蜘蛛
英文雅虎蜘蛛
谷歌蜘蛛
微软必应蜘蛛
搜狗蜘蛛
搜索蜘蛛
有道蜘蛛爬取爬行:搜索引擎蜘蛛通过跟踪链接访问网页,获取页面的HTML代码并存入数据库。预处理:索引程序对抓取的页面数据进行文本提取、中文分词、索引等处理,为排名程序调用做准备。排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后生成一定格式的搜索结果页面。