百度搜索引擎优化原理( 几个常见的搜索引擎蜘蛛分类及工作原理)
优采云 发布时间: 2022-03-01 16:19百度搜索引擎优化原理(
几个常见的搜索引擎蜘蛛分类及工作原理)
《搜索引擎原理》搜索引擎的基本工作原理和自然排名机制
搜索引擎的工作过程非常复杂。本章介绍的内容与真正的搜索引擎技术相比只是一个小插曲,但对于新手 SEO 来说已经足够了。Winter Mirror 试图以最容易理解的方式来解释它。
一、搜索引擎蜘蛛
搜索引擎蜘蛛也称为网络爬虫。目的:抓取高质量的网页内容。以下是一些常见的搜索引擎蜘蛛类别:
1.1 百度蜘蛛
百度还有其他几个蜘蛛:Baiduspider-news(新闻)、Baiduspider-mobile(wap)、Baiduspider-image(图片)、Baiduspider-video(视频)。站长们经常看到Baiduspider和Baiduspider-image。
1.2 Googlebot(谷歌蜘蛛)
还发现了一个Googlebot-Mobile,名字应该是爬取wap内容。
1.3 360蜘蛛(360蜘蛛)
它是一种非常“勤奋”的蜘蛛。
1.4 搜狗新闻蜘蛛
还包括以下:搜狗网络蜘蛛、搜狗inst蜘蛛、搜狗蜘蛛2、搜狗博客、搜狗新闻蜘蛛、搜狗猎户蜘蛛,看最权威的百度robots.txt为搜狗搜狗蜘蛛花了很多话节日,占据了很大的版图。
还有很多其他的蜘蛛,就不过多介绍了。SEO优化主要针对这四个。有兴趣的可以看一下搜索引擎蜘蛛的这篇文章文章。
二、搜索引擎的工作原理
小编认为,一个搜索引擎的工作原理大致可以分为三个阶段:1.爬取和爬取;2. 预处理(索引);3. 输出结果。
2.1 爬行和爬行
搜索引擎蜘蛛通过链接查找链接访问网页,从而获取页面HTML代码并存入数据库。
那么搜索引擎蜘蛛是如何抓取网页的呢?
A:找到链接→下载本网页→添加到临时库→提取网页中的链接→下载网页→循环。
2.2 预处理(索引)
蜘蛛(专业术语:索引程序)需要对爬取的网页内容进行关键词提取,生成倒排索引,计算页面的PageRank和TrustRank值,以及关键词的相关性页面,为了准备调用排名程序,这也是搜索引擎在很短的时间内返回搜索结果的关键。其中,PR值和相关性是我们最关心的。
2.3 输出结果
用户输入关键词后,排名程序调用索引数据库数据,程序自动匹配关键词,然后按照一定的规则生成搜索结果展示页面。这是因为之前的预处理,搜索引擎可以在时限内返回输出结果。这里要提醒大家的是,自然搜索排名和竞价推广排名是有区别的。
北碚商城更多产品介绍:五洲响应网站黑河开发网站优化推广潜江高端网站建设