百度搜索引擎优化原理(什么叫做百度搜索引擎优化?概念,第一百度第二优化)
优采云 发布时间: 2022-01-16 10:20百度搜索引擎优化原理(什么叫做百度搜索引擎优化?概念,第一百度第二优化)
什么是百度搜索引擎优化?
我们要明白两个概念,第一百度搜索引擎,第二优化。
百度搜索引擎:百度网站,为用户提供检索服务,将检索到的信息展示给用户。
优化:使用百度搜索引擎优化网站本身。
百度搜索引擎的工作原理:
百度“派”蜘蛛去抓取网络上的网站,蜘蛛抓取抓取到的网站,将处理后的页面放入百度数据库(存储)进行预处理,然后对页面进行索引。用户搜索百度时,百度根据用户发来的信息(即用户搜索到的关键词)匹配数据库中相关的网站,最后匹配到关键词@ > @>相关的网站被排序并显示给用户。
词汇表:
蜘蛛:百度搜索引擎派出的用于抓取大量页面的机器人。
预处理:蜘蛛对提取的文本进行中文分词,去除重复,去除停用词,去除噪声。
中文分词:将提取的文本分成有意义的词。
重复数据删除:从数据库中删除重复的内容
去掉停用词:去掉啊。呃。. . . 这些停用词
去除噪音:去除不相关的内容或链接
索引:使用倒排索引
倒排索引结构
使用关键词对应文件的形式,在数据库中搜索用户搜索到的关键词文件。不同的关键词对应多个不同的文件,搜索引擎会进行文件的相关性和权重。计算并将搜索结果呈现给用户。