六六seo基础入门第十六讲:搜索引擎排名机制的步骤
优采云 发布时间: 2021-07-12 23:53六六seo基础入门第十六讲:搜索引擎排名机制的步骤
最后讲了搜索引擎工作原理的排名机制的最后一步。前面六六个seo教程和同学介绍了爬取的原理和预处理的原理。经过前两步的准备,搜索引擎已经调用了用户需要的内容,搜索引擎计算出排名后,内容直接展示给用户,完成了这次与用户的直接交互。下面我们来看看第十六篇seo基础介绍第十六讲中搜索引擎排名机制的步骤。
搜索引擎的工作原理
第六讲seo基础介绍:搜索引擎工作原理排名第16讲
1、搜索词处理
分词-停词-指令识别-纠错-集成搜索-搜索框提示
用户输入搜索词后,引擎必须先对搜索词进行处理,然后再进行排名。处理方法与第15讲介绍的预处理原理有很多相似之处,比如分词和去除停用词也是引擎在处理搜索词排名时识别和去除的第一步。在分词和去除停用词之后,搜索引擎需要处理搜索词指令。该指令是用户在输入搜索词时通知搜索引擎具体搜索需求的一种方式。 (看不懂说明也别着急,后面我会给大家详细讲解搜索说明)说明识别出来后,引擎会提醒您搜索词的纠错。我们经常会遇到这种情况。引擎会提示我们是否在寻找一个词。然后引擎将触发对搜索词的集成搜索。所谓综合搜索触发,是指向用户展示的内容将包括文字、视频、图片等多维度展示。最后,搜索框提示是基于全网用户的搜索统计。当用户输入一些搜索词时,下拉框会显示用户最常搜索的词,以减少用户的输入时间。这是排名第一步的搜索词处理。
2、文件调用
引擎在处理完搜索词后,在预处理过程中,通过正向索引和倒序缩影,将所有文件按照关键词排序到数据库中。这时候直接调用用户输入的关键词文件就可以直接使用了。
3、筛选子集
当搜索引擎调出相关文件时,调出的文件都是与搜索词相关的文件。没有人知道这些页面是数十万还是数百万。那么,如果搜索引擎对如此海量的数据进行排名计算,就无法将结果实时展示给用户。这时候搜索引擎会通过一些不相关的因素过滤掉比较权威的页面子集(一般搜索引擎向用户展示的页面不到100页,这个子集理论上只需要1000页就可以满足用户搜索需求) 引擎可以直接计算子集。
4、无关因素
非相关因素是seoer非常感兴趣和赖以生存的技术手段。我们通过改进不相关的因素大大提高了页面的排名。这些不相关的因素包括:
关键词密度:理论上关键词出现的页面越多,页面对关键词的权威性就越大。当然,这是理论上的说法。实际情况比较复杂,引擎有明确的关键词友好密度:2%-8%。在这个密度范围内,出现的频率越高,权威性就越高。
关键词位置和格式:关键词的位置和格式已经在预处理过程中记录下来了。同样的关键词出现在“title”或“bold”中会比出现在普通文章中更有分量。 seo在布局网站时,关键词layout是非常重要的前期工作。
断电
关键词distance:虽然搜索引擎越来越智能,但是你可以慢慢识别不匹配的关键词。但是在比赛中出现的完整词汇仍然具有排名友好的优势。比如搜索seo学习步骤时,直接出现在页面上的seo学习步骤相关性高,自然比seo的哪些学习步骤有排名优势。当然,这是在去除其他排名因素的前提下。
链接分析:如果关键词附有锚文本的页面,自然会比没有链接的关键词排名好。
5、算法分析
此时,排名几乎可以确定,但搜索引擎仍然会对子集页面进行最终审查,这是搜索引擎算法的识别。通过算法分析,如*敏*感*词*集页面中存在作弊页面,自然会排到这个页面。
6、显示排名
经过算法分析后,引擎会根据排名向用户展示分析后的子集页面的原创标签和快照。
以上就是六六介绍的搜索引擎工作原理的排名机制。通过引入爬取、预处理和排序。希望对刚入门的seo新手有所帮助。没有浏览过爬取和预处理原理的同学可以直接访问六六首页交流学习。