seo优化搜索引擎工作原理(常用搜索引擎图标百度展现出关键词搜索结果的分析(一))
优采云 发布时间: 2021-10-08 10:31seo优化搜索引擎工作原理(常用搜索引擎图标百度展现出关键词搜索结果的分析(一))
从搜索引擎输入搜索词到搜索引擎根据关键词对搜索结果进行索引的过程是用户使用搜索引擎的完整步骤。搜索引擎如何在海量的互联网资源中以光速展示用户需要的页面?中间是怎样的逻辑和算法?需要对搜索引擎的逻辑和算法做一个简单的分析(国内以百度为例):
常见的搜索引擎图标
百度显示关键词搜索结果必须在互联网上拥有。从生成搜索展示结果到展示给用户,会有以下四点:抓取(BaiduSpiter蜘蛛)、过滤(临时库代码过滤)、索引区(存储文本)和排名展示(展示关键词搜索页面)。
更贴切的流程图
抓住
百度蜘蛛使用蜘蛛算法的规则来判断是否抓取目标页面(先抓取)。频率和频率根据页面大小自动匹配。蜘蛛算法基于网站的历史表现,一、页面内容的质量(优质内容优先),二、用户体验是否好(广告,内容布局) )、三、是否使用作弊技术等(建议不要使用作弊技术,百度从2017年下半年开始每个月都会推出新算法)。
网站 生成新的页面内容,百度蜘蛛会从互联网上指向改变页面的链接访问和抓取。如果没有设置外部链接指向新生成的网站页面,蜘蛛将无法抓取网站。对于已经爬取过的内容,搜索引擎会记录爬取过的页面,并根据这些页面对用户的重要性,安排不同频率的爬取和更新工作。
注意这里:
有些爬虫软件会冒充百度蜘蛛爬取页面,注意排查,注意被黑
筛选
并非所有新生成的页面都对用户有用,比如一些明显的欺骗用户的网页、死链接、空白内容页面等,对用户需求、蜘蛛、本站毫无意义,所以百度将这些不合规的页面排除在外临时库中的页面,以避免对用户和蜘蛛造成不必要的影响。百度特别怕用户。体验会产生影响。
索引区
百度会对爬取的内容进行一一标记识别(这里百度采用分词技术)进行关键词识别,并将这些标记存储为结构化数据。百度原文:“比如网页的tagtitle、metadescripiton、外链和网页的描述、抓取记录等。” 也就是说,相关的标题、关键词、描述都整理在索引库中,将关键词保存在页面上,方便后续用户搜索关键词索引。这里涉及正序和逆序,正序是指蜘蛛根据关键词对页面进行排序,逆序是指搜索引擎根据关键词显示页面。
排名展示
用户在百度上搜索关键词。百度使用闪回算法,根据用户输入关键词的强弱来过滤索引库中存储的符合条件的关键词页面。网页的优劣根据最终得分进行评分和排列,并展示给用户。
也就是说:保证内容优质,内容与标题相关,用户体验好,才会展示