seo优化搜索引擎工作原理(搜索引擎的工作原理-原创原创秘笈(二)优化)
优采云 发布时间: 2022-02-03 22:13seo优化搜索引擎工作原理(搜索引擎的工作原理-原创原创秘笈(二)优化)
搜索引擎如何工作 - SEO原创秘密 (二)
在接下来的课程中,广州新川教育的专业SEO老师庞宏老师将为您解答搜索引擎工作方面的问题。众所周知,SEO也叫搜索引擎优化,意思是我们的网页要尽可能的匹配搜索引擎。工作习惯,尽量迎合过程吧。我们必须弄清楚搜索引擎是如何工作的,然后才能迎合它的工作。
那么搜索引擎是如何工作的以及它是如何工作的呢?以下是解释搜索引擎如何工作的八个步骤:
1、当搜索引擎蜘蛛进入一个网站时(如果是单个网页,忽略这一步),第一次是在网站的根目录下找到robots.txt文件@> ,这个文件是给蜘蛛指明哪些网页可以去,哪些网页不需要去的文件收录,它会严格按照这个文件的规定。然后它会在这个网站下寻找网站地图,也就是sitemap文件,看看怎么去收录这个网站,当然在你的网站 没有这两个文件,对搜索引擎不利(如何制作这两个文件,我们后面的SEO优化课程会详细讲解)。
2、搜索引擎在进入网页的时候,会首先寻找网页的title和h1标签以及keywords和description标签,所以我们要保证这四个标签的关键词是高度均匀;
3、提取文本:
搜索引擎的爬取是基于文本内容的。因此,从优化的角度来看,*敏*感*词*网站、Javascript代码、图片内容都无法被引擎抓取。对于优化 网站 是 不利的。“提取文本”是指搜索引擎首先从HTML文件中去除标签,程序提取出可用于页面排名处理的文本内容。
4、分析判断关键词(中文分词):
对于西方的网站,搜索引擎判断一个词的方法很简单,有空格就会生成一个词。因此,当搜索引擎判断西方网站的关键词时,很简单,这个词出现的可能性越大,它就越有可能是关键词。
中文分词是中文搜索引擎独有的一步。搜索引擎在处理数据时基于单词。英文和其他语言的单词之间有空格,可以直接进行分词。但是,中文单词和单词之间没有分隔符。,一个句子中的所有单词和单词都连接在一起。搜索引擎首先要区分哪些词是词,哪些词原本是词。例如,“减肥法”可分为“减肥法”和“方法”两个词。
当搜索引擎发现出现在title、keywords、description、H等标签中的词与文本中大量出现的词相同或相似时,就会认为这个词是关键词@ > 本页。
5、停用词:
啊啊啊啊啊啊啊啊啊啊等等这些词是任何网页都不能作为关键词使用的词,它们被称为停用词,搜索引擎正在放网页收录 这些词会在进入数据库之前被删除。
6、去除噪音:
噪音是指网页上对页面主题没有贡献的内容,如版权声明文字、导航栏、广告等,这些都是噪音,对页面排名不利,只能播放对主题产生分散注意力的影响。去噪的基本方法是根据html标签将页面分成块,区分页眉、导航、正文、页脚、广告等区域。在网站上重复出现的块往往是噪声,所以这些地方你最好不要放置关键词。以免给搜索引擎造成误解,因为它会认为出现在这些地方的词不应该是关键词。因此,人们会经常看到,在一些网页的底部,有些人会故意放置很多关键词,
7、删除:
同一个文章经常出现在不同的网页上,搜索引擎不喜欢这样重复的内容,他们喜欢原创。所以有些人会为了页面的更新程度复制别人的文章,然后添加一些简单的内容来进行所谓的伪原创,逃不过引擎的去重算法。每个 网站 的权重不同,这也导致不同页面的权重不同。衡量网站权重最有效的概念是PR值。简单来说,权重的概念可以这样理解,如果一个有影响力的人(高权重)说一件事,很多人会相信,而一个不知名的小人物(低权重)说同样的话,人们会认为可信度不高。
当相同或高度相似的文章s出现在不同的网站s上时,权重较高的页面将排在最前面,而权重较低的页面将排名较低或根本没有收录@ >。这就是重复数据删除的概念。
8、索引:经过文本提取、确定关键词、降噪、去重后,搜索引擎得到的是能够反映页面主要内容的独特的基于词的内容。接下来,搜索引擎索引器将执行以下操作:
1).Extract关键词:按照分词程序,将页面转化为关键词的集合;
2)。记录页面上每个关键词出现的频率、次数、格式(如关键词是否出现在标题、粗体、H标签、锚文本等)、位置(如是否它在页面的第一段)等。这样,每个页面都可以记录为关键词的一系列集合。当用户在搜索引擎中输入关键词来匹配这个页面时,引擎会根据它的算法对你的页面进行排名,然后在搜索引擎中展示出来。
以上八个步骤就是搜索引擎的工作原理,也就是搜索引擎抓取网页的全过程。我们做网站SEO优化,这是最大程度迎合搜索引擎工作的过程。了解了搜索引擎的工作原理后,我们就可以有针对性地进行SEO工作了。