seo优化搜索引擎工作原理(SEO(搜索引擎优化)的工作原理是怎样的的 )
优采云 发布时间: 2021-12-10 18:23seo优化搜索引擎工作原理(SEO(搜索引擎优化)的工作原理是怎样的的
)
SEO(Search Engine Optimization)通常定义为:在了解搜索引擎工作原理的基础上,对网站进行内外调整和优化,提高网站关键词的排名,获得更多流量,达到网站营销目的。通过这个定义,我们可以看出,要做SEO,首先要知道我们的搜索引擎是如何工作的。只有了解了它的原理,我们才能基于这个原理进行后期的优化工作。这就是今天本期要与大家分享的主题:搜索引擎是如何工作的!
由于搜索引擎的专业知识涉及的学科范围很广,因此可以作为一门单独的学科进行系统的研究。所以建议新手在刚开始学习SEO的时候可以多了解一下搜索引擎,或者自己买这个。关于搜索引擎原理的书很好。只有了解了搜索引擎的工作原理,才能对优化后的工作有一个明确的方向!
搜索引擎的工作原理
首先,搜索引擎的工作原理大致分为三个阶段:爬行和爬行:搜索引擎蜘蛛通过跟踪链接来查找和访问页面,然后读取HTML代码并存入数据库;预处理:搜索引擎蜘蛛对抓取到的页面数据进行文本提取、中文分词、索引(正向索引)、倒排索引等,用于后续的排序和展示;排名:通过一定的搜索相关性计算,生成一定格式的搜索结果页面。
搜索引擎的工作原理
针对这三个阶段,我们来详细说说搜索引擎的工作原理:
爬行和爬行
1、跟踪链接:一般跟踪方式有深度优先和广度优先两种,如图:
深度优先跟踪链接
广度优先跟踪链接
理论上,无论采用哪种跟踪方式,只要给蜘蛛足够的时间,它就可以抓取完整的互联网链接,但实际上,蜘蛛的宽带资源和时间非常有限,不可能全部抓取链接。,最多只能爬取和收录一小部分,所以我们在做SEO工作的时候需要主动吸引蜘蛛爬取和收录我们的页面。
2、吸引蜘蛛:哪些页面可以吸引蜘蛛?满足以下几点就足够了。
预处理
这里提到的预处理包括:文本提取、中文分词、去停用词、去噪、去重复、前向索引、倒排索引、链接关系计算、特殊文件处理和质量判断等,由于内容过多,我赢了这里不详述。我主要讲一下正向索引和倒排索引这两个核心内容。有些书将预处理阶段定义为索引。其实也解释了正向索引和倒排索引的要点。看下面的*敏*感*词*:
正向索引结构
倒排索引结构
上图中的文件是指页面,关键词是匹配用户搜索的词关键词,其中关键词是存储在搜索引擎内部的关键词,也是根据用户过去搜索过的词,进行采集整理。通过对比两种索引结构,可以看出倒排索引能够更好的满足搜索引擎的工作需求。当用户搜索某个关键词时,搜索引擎系统可以一次性直接导出带有关键词@的数据。>然后通过链接相关性、特殊文件处理、页面质量等计算匹配页面,确定哪些页面可以作为搜索结果页面,最后以排名方式展示。
秩
经过预处理,特别是倒排索引处理后,对用户搜索词进行处理,进行相应的文件匹配,得到初始文件的子集。这里的初始文件子集不能直接用于排名,而是相关的Performance计算、排名过滤和调整,最后展示页面的排名结果。这里的相关性计算主要是根据关键词的常用程度、词频与密度、关键词位置与形式、关键词距离、链接分析、页面权重来判断是否页面内容一致 用户搜索的词相关度高。