seo教程:搜索引擎优化入门与进阶(如何实现几万个页面能在一秒钟内做到有序排名?(图))
优采云 发布时间: 2021-12-20 23:03seo教程:搜索引擎优化入门与进阶(如何实现几万个页面能在一秒钟内做到有序排名?(图))
刚逛了一圈,南京SEO博主看到了这篇文章文章,对基础知识讲解的很全面透彻,所以转来这篇博客分享给大家。
当我刚接触 SEO 时,我曾经仔细观察搜索引擎。一方面,做SEO本身就是要靠搜索引擎生存,我们要为这个大哥服务;另一方面,我们想看看他是如何工作的,他是如何在一个页面上实现数万页的,在几秒钟内达到有序的排名。事实上,今天我们对这些问题有了更清晰的认识。
如果想在某个搜索引擎上有一定的排名,只知道网上的那些SEO基础是不够的。我也遇到过一些朋友把自己的站排名搞上去的,但是他不知道怎么做。他跟我说的就是做个外链,更新文章就上去了。我们不能排除这种可能性。毕竟关键词的竞争程度不同。但是我遇到的最多的还是排名,但是很快又掉下来了,不知道怎么维持这个排名。废话不多说,按照何涛的思路一步一步来。
搜索引擎的一些基本爬取知识
首先,我们不得不提一个SEO术语“蜘蛛”。这也是每个搜索引擎用来抓取和访问页面的程序,也称为机器人。在这里我将解释蜘蛛蜘蛛这个词:在我看来,他被称为蜘蛛蜘蛛的原因。究其原因,蜘蛛是按照互联网上的链接代码访问互联网上的每一个网站,而这些网站的每一个链接实际上就像一个非常复杂的网络。蜘蛛所要做的就是这个互联网上捕捉信息的形式与蜘蛛非常相似,所以也有形象的比喻。
我们是否对蜘蛛蜘蛛这个术语有所了解?事实证明,搜索引擎中必须更新的一些数据库和排名依赖于这样的程序来抓取和检索它们,然后才能定期更新。所以换句话说:如果我们想要我们的网站排名,我们是否必须让搜索引擎收录我们的站,并且想要搜索引擎收录,我们是否必须让我们的站搜索引擎收录先是蜘蛛蜘蛛来爬我们的站。其实这里会有一个过程,如何让蜘蛛爬到我们的网站这里我也大致说一下:
一般来说,我们称这种方法为“链接诱饵”。也就是说,通过某种方式来吸引蜘蛛爬到我们的网站。常见的比如将我们新制作的网站提交给搜索引擎,在网站中发布高权重链接,通过搜索引擎*敏*感*词*站点引导等等,这些都是比较好用的方式。
来看看蜘蛛的一些习性,让大家更好的掌握,以便继续喂他,培养蜘蛛访问网站的速度和习惯,增加网站@的权重>. 秩
说起蜘蛛习性,我们得有个“深度优先,广度优先”的概念。我们已经提到 Spider Spider 最终是一个程序。能引导他爬行的是网站和网站之间的链接。大家有没有印象,在看一些SEO基础教程的时候,都提到网站的结构一定是树形的,目录层次不要太深。事实上,对此的论据来自于深度优先和广度优先。
深度优先:比如蜘蛛访问一个网站的链接时,他会一直跟着这个链接往下爬,直到没有更多的链接,才回到第一页,然后再访问另一个链接。向前爬。比如蜘蛛在访问我们的网站首页时,它的一个爬行习惯一定是从导航中的一列往下爬,可能爬到我们的最后一页,然后再返回。
广度优先:这与深度优先有点不同。当蜘蛛在一个页面上发现多个链接时,他会先爬取第一层的所有链接,然后再爬到第二层的页面。找到的链接会上升到下一个级别。现在给大家看一张图来理解:
其实在我们的现实中,Spider Spider经常采用广度优先和深度优先的组合方式,这样我们就可以照顾到尽可能多的网站(广度优先)和一部分网站' s 内页(深度优先)
有了这个数据抓取原理,搜索引擎肯定会先对蜘蛛检索到的信息进行排序存储,并赋予每条信息一个特定的编号。
索引条目的搜索引擎处理
我们都知道蜘蛛蜘蛛毕竟只是一个程序。他做的工作不会通过网站的前台分析一个网站的内容,而是会爬取网站信息的代码。而在网站的源码中,我们会看到大量的html、js等程序语句。蜘蛛蜘蛛只对文章感兴趣,这意味着他只从网页中提取一些文本。可能有朋友提到过,那我们写什么代码呢?代码不再起作用了吗?
事实上,情况并非如此。在网站的标签优化中,我们都知道诸如H标签、nofollow标签、alt标签等,这些标签在蜘蛛爬取我们的网站信息时仍然可以起到强调和修饰的作用。例如,当遇到一张图片,但蜘蛛无法识别图片中的信息时,那么我们会考虑设置一个alt标签来帮助搜索引擎识别图片中的信息;为了不让 网站 的部分权重分散,我们在链接中添加了 nofollow。
由于搜索引擎蜘蛛对网站 文本特别感兴趣,所以是针对中文SEO优化的。里面会不会有概念性的东西,那就是“分词”
最简单的例子,比如我们中文中的四个词“网站optimization”,在百度搜索引擎数据词汇表中,其实就是把网站和优化这两个不同的词分开了。存入。当用户搜索网站优化词时,搜索引擎的步骤是将词库网站中的网页信息与优化词库中的信息结合起来进行检索和排序。这一点将在后面讨论。
说到分词,不得不提一件事,那就是我们看网站一个分词情况:在百度搜索引擎中搜索“宁波河套SEO”。在出来的搜索结果中,我们来看看。网站的快照如图
我们是否容易看到快照中显示的结果。百度把这个词分成三个不同背景颜色的词组。这只是其中之一。我们也可以在百度的搜索结果中看到,只要是我们搜索到的词,就会被标记为红色。这也是分词的另一种表现形式。
有的朋友可能会说,你说的都是个案。我们在实际过程中搜索的词远比这个复杂,可能会有一些模态粒子。作为一个日益复杂的搜索引擎。他们其实早就考虑过这个问题,首先是因为这些模态粒子在搜索过程中其实没有任何作用。搜索引擎在进行预处理时,也会对这些词进行过滤。一方面是为了减轻搜索负担,另一方面也是为了增加内容的准确度。
在搜索引擎将蜘蛛抓取到的信息归档之前,还有一个不可缺少的程度,他必须对内容进行反复审核。一个重要的含义:搜索引擎必须删除同一网站中的数据。有一种情况:比如有人搜索我的网站宁波SEO时,有可能我们的首页和内容页会出现在排名结果的第一页。其实,作为一个成熟的搜索引擎,这种情况是应该避免的。因为这样的内容对用户来说不是很有用,相当于同一个内容被排了两次。第二:对于不同的网站,因为互联网上有成千上万的内容。会有两个不同的网站但内容相同。这就是我们常说的关于网站的转载 内容。搜索引擎也会考虑重复的信息并删除它们。
有了前面步骤的反复复习,下一步就是做一个有效的数据排序。让我给你看两张表,你就会明白:
远期指数
文件编号
内容
文件 1
关键词1,关键词2,关键词7……关键词x
档案 2
关键词1,关键词7,关键词8……关键词是
…………
...
文件N
关键词6,关键词50,……关键词z
倒排索引
文件编号
内容
关键词1
文件 1、文件 2、文件 10、... 文件 m
关键词2
文件 1、文件 4、... 文件 n
…………
…………
关键词7
文件 1、文件 2、文件 8、... 文件 o
简单解释一下上表的含义:正向索引表,即搜索引擎暂时不能直接用于排名的数据表。在此,他根据文件分配每个关键词。换句话说,主键是文件。我们切换到第二张表,看到搜索引擎已经使用了关键词作为主键,这和搜索某个关键词来查找我们想要的信息是一样的。我们可以发现,当用户搜索关键词 7 时,此时搜索引擎不需要检索每条内容。它需要做的就是从 关键词 1 、文件 2、文件 8 等的字典中提取文件。
至于这些文件是如何排列的,请看下一节。
搜索引擎如何决定网站排名
在搜索引擎工作原理的最后一节中,应该提到搜索引擎的排名。网络上的信息是蜘蛛抓取并存储的,实际上是供终端用户搜索某个关键词搜索引擎,能够提供他真正想要的内容。
当用户搜索一个词时,搜索引擎做的第一件事就是根据需要对我们的词进行分段。这个在前面的文章中也有提到,原理还是一样的。但是在排名过程中,搜索引擎会先进行一个交集过程。我们都知道,搜索引擎的存储是以词为单位进行存储的。比如搜索宁波SEO时,搜索引擎的词库会先查找宁波这个词所收录的文件,然后再查找与SEO相关的文件。然后进行交集处理和删除选择。
在这里,我们不得不特别提到搜索引擎中拼写纠正的处理。我们可以在百度搜索宁波SEO培训新闻,查看百度的返回页值。
我们可以清楚地看到,百度会自动给出链接提示:你在找宁波SEO培训吗?之前有个朋友也跟我说,他们正在考虑优化一些词。大概意思是这样的:比如我们想做一个比较流行的关键词,但是由于我们自身的能力,我们可能会考虑优化一些像我上面举的例子那样的错字词,其实在我看来,你这样的操作不是说不行,在用户体验上是很差的。网站的转化率并没有高多少。
细心的朋友会问一些搜索引擎排名显示页面的问题:互联网上的页面那么多,百度搜索引擎在用户搜索某个词时会列出吗?在百度搜索引擎中,他最多只会列出76页左右的关键词排名结果。因为不管对用户来说多少,其实都没有这样的考虑,毕竟搜索引擎也会把最相关的数据排在第一位。
那么搜索引擎是用什么形式来确定关键词的最终排名的呢?
首先我觉得最重要的是我们关键词的密度。这也是我们在做SEO的时候经常会提到的一个话题。当然,标题和描述标签中不会有这样的关键词,而是他的排名,后面会讲到。关于关键词的密度,还是那句话:不要太追求密度,忘记用户体验。
关键词的位置和表现形式。我们都知道网站的title标签的权重比较高。相比之下,在其他条件相同的情况下,首页的标题会出现一定的关键词,排名相对来说也好过没有。当然,还会有其他形式如:加H标、加黑等。
关键词距离。在搜索结果页面中,我们会看到我们搜索到的词会被标记为红色。但是我们经常看到我们搜索的词都是分开的,并用红色标记。这给了我们一个信息。即我们在写网站标签和描述的时候,一定要考虑用户的搜索和搜索引擎的分词。尤其是百度。
网站 的页面权重。这一点绝对是重点。说到重量,肯定会涉及到外链的数量和质量。这也是我们SEO会认真做的一点。
总结
从搜索引擎的工作原理分析来看,SEO有必要了解搜索引擎,但我们也从中发现了很多规律。搜索引擎如何改变和增加用户体验是永恒的。所以在运营网站SEO的时候,一定要考虑用户,才能得到搜索引擎的认可。