SEO优化:搜索引擎的工作原理是怎样的呢?
优采云 发布时间: 2021-07-09 21:09SEO优化:搜索引擎的工作原理是怎样的呢?
说到SEO优化,相信你已经学到了很多。如果你要问搜索引擎的工作原理,你可能不太了解。现在我们来谈谈关于搜索引擎的一些事情。
1 提取文本。
因为搜索引擎蜘蛛抓取网页的HTML代码,其中收录了大量的HTML标签、js等无法用于排名的内容,所以搜索引擎索引的首要任务就是去除HTML标签和js , 并保留页面的其余文本内容。
2 中文分词。
中文分词是中文搜索引擎独有的一步。英文单词之间用空格隔开,而中文单词之间没有分隔符,一个句子的单词是相连的。在中文搜索引擎中,首先要区分哪些词构成一个词,哪些词本身就是一个词。例如,“健身方法”可以分为“健康”和“方法”。
3停用词。
网页内容中会有很多对内容没有影响的词,如“这些”、“它”、“但是”、“啊”等。当被搜索引擎索引时,这些词会被删除,以使页面内容的主题更加突出。
4 去除(假原创为什么弊大于利)
在搜索结果中,搜索引擎会选择网页内容中出现频率最高的词,以减少重复内容,通常会选择大约10个关于网页的关键词来计算网页的“指纹”。
第五个指标
完成上述步骤后,搜索引擎就可以提取出一些可以代表网页内容的关键词,并记录这些词在网页上出现的频率、出现次数、格式和位置。
6 连接关系计算。
如果网页中有链接,搜索引擎会计算这些链接想要的页面,每个页面上有哪些导入链接,以及链接使用的锚文本。这些复杂的链接构成了网站和页面的权重。
这些连接关系也是百度计算权重的重要依据。至于百度的权重和链接分析,以后会有专门的文章。
7 页的质量判断。
在这个阶段,搜索引擎会判断网页内容的质量和链接的质量,比如百度的“绿萝石榴”算法。