seo优化搜索引擎工作原理(搜索引擎的工作原理是什么,它是如何工作的呢?)
优采云 发布时间: 2021-11-07 13:10seo优化搜索引擎工作原理(搜索引擎的工作原理是什么,它是如何工作的呢?)
SEO也叫搜索引擎优化,就是使我们的网页尽可能符合搜索引擎的工作习惯,并尽可能迎合它的过程。我们必须先弄清楚搜索引擎是如何工作的,然后才能迎合它的工作。那么搜索引擎的工作原理是什么,它是如何工作的呢?
seo营销人员必须知道的搜索引擎原理!
1、 当蜘蛛搜索引擎输入一个网站(如果是单个网页,这一步不用管),第一时间是在根目录下找到robots协议文件网站的,这个文件是给蜘蛛显示哪些网页可以去,哪些网页不需要它去收录。它将严格遵守本文件的规定。然后它会去寻找这个网站下的网站地图,也就是sitemap文件,看看如何去收录这个网站,当然你的< @网站 没有这两个文件,对搜索引擎是不利的(后面我们SEO优化课程会详细讲解这两个文件的*敏*感*词*法)。
2、 当搜索引擎进入网页时,首先会找到网页的标题和H1标签以及关键字和描述标签,所以我们必须保证这四个标签的关键词制服;
3、 文本提取:搜索引擎的爬取基于文本内容。因此,从优化的角度来看,*敏*感*词*网站、Javascript代码、图片内容是无法被引擎抓取的。不利于优化网站。“提取文本”是指搜索引擎首先从HTML文件中去除标签,程序提取可用于页面排名处理的文本内容。
4、分析判定关键词(中文分词):中文分词是中文搜索引擎独有的一步。搜索引擎在处理数据时是基于词的,英语和其他语言的词之间如果有空格,可以直接切词。中文单词和单词之间没有分隔符。一个句子中的所有单词和单词都连接在一起。搜索引擎首先要区分哪些词是词,哪些词是原词。像“减肥方法”这样的词,可以分为“减肥”和“方法”两个词。当搜索引擎发现标题、关键词、描述、H等标签中出现的词与文本中的大量词相同或相似时,就会认为这个词是关键词
5、 停用词:比如,to,to,ah,ha,ya 等词,这些词是任何网页都不可能用的关键词词,它们叫做停用词,搜索引擎会在将网页收录 输入数据库之前删除这些词。
6、 消除噪音:噪音是指网页上对页面主题没有贡献的内容,比如版权声明文字、导航栏、广告等,都是噪音,不好对于页面排名,它只能起到分散主题的作用。去噪的基本方法是根据html标签将页面分成块,区分页眉、导航、文本、页脚、广告等区域。网站上的大量重复块往往是噪音,所以这些地方最好不要放关键词。以免引起搜索引擎的误解,因为它会认为出现在这些地方的词不应该是关键词。因此,你会经常看到,在一些网页的底部,
7、去重:同一个文章经常出现在不同的网页上。搜索引擎不喜欢这种重复的内容,他们喜欢原创。因此,有些人会为了页面的更新而复制别人的文章,然后为所谓的伪原创添加一些简单的内容,这是一种逃不过引擎的去重算法。每个网站都有不同的权重,这也会导致不同的页面有不同的权重。用来衡量网站权重的最有效的概念是PR值。
8、索引:经过文本提取、关键词、去噪、去重确定后,搜索引擎得到的就是能反映页面主要内容的唯一内容,以词为单位。接下来,搜索引擎索引程序将执行以下操作:
1.Extract关键词:根据分词程序进行分词,将页面转换成关键词的集合;
2. 记录每个关键词在页面上出现的频率、出现次数、格式(例如关键词是否出现在标题、黑体、H标签、锚文本等中。 )、位置(比如是否在页面的第一段)等,这样每个页面都可以记录为一系列的关键词集合。当用户在搜索引擎中输入关键词来匹配这个页面时,引擎会根据它的算法对你的页面进行排名,然后在搜索引擎中显示出来。
以上八步就是搜索引擎的工作原理,也就是搜索引擎抓取网页的全过程。我们做网站SEO优化,最大程度的迎合搜索引擎的工作流程。一旦我们了解了搜索引擎的工作原理,我们就可以有针对性地进行SEO工作。
喜欢 (15)