搜索引擎优化知识完(增长超人将通过一个系列文章整理SEO常识点，你知道吗？)

优采云发布时间: 2021-12-31 18:21

　　说到Search Engine Optimization（搜索引擎优化），大家一定既熟悉又陌生。 SEO 是我们了解的第一个数字营销概念之一。那为什么要用“不熟悉”来形容呢？

　　因为大多数人从职业生涯开始就只了解SEO的一些概念和术语，但是在搜索引擎的工作原理、日常遇到的SEO语句如何解读、如何发现问题、如何去发现问题等方面存在很多盲点。优化。，更不可能根据自己的情况制定SEO策略。

　　所以从今天开始，超人成长会用一系列文章，力争为我们整理出SEO常识点。希望大家看完这个系列文章后，能得到一点启发，更好地为帖子服务。

　　作为列表的第一章，我们先了解一些基本内容。我们是否考虑过以下问题：

　　什么是搜索引擎优化？我们如何定义它？

　　为什么要做SEO？

　　移动互联网时代，还需要做SEO吗？

　　搜索引擎的工作原理是什么？经过简单的“输入-搜索”操作后，搜索引擎如何从海量数据中找到我们需要的内容并展示给我们呢？ ?

　　带着这些问题，让我们一起√搞定今天的常识吧！

　　常识点1：什么是SEO？我们如何定义它？

　　SEO的全称是“Search Engine Optimization”，中文译为“搜索引擎优化”。

　　简单理解SEO是一种从自然搜索结果中获取网站流量的方法和过程；

　　如果再仔细定义一下，SEO就是“在了解搜索引擎自然排名机制的基础上，对网站进行内外部调整优化，以提高网站在搜索引擎中的关键词自然排名，为了抢流量，进而推动网站销售或品牌曝光的过程。

　　常识点2：为什么要做SEO？

　　网站每个人都希望自己的网站流量尽可能大。不管网站的盈利形式和政策是什么，来访都是一个条件。 SEO 是将访问者带到网站的最佳方式。一起来看看SEO的“优势”：

　　低成本：虽然可能有成本，但成本相对较低

　　高回报：SEO的大部分用户都是“主动找”酒店，政策很精准

　　可移动：搜索引擎是用户查找、比较和购买产品的重要方式。移动互联网发展迅猛，SEO中心还在，只是载体变了

　　足够耐用：一旦暂停投资，流量会急剧下降；线上活动等营销效果显着，但话题过后流量会下降。搜索排名上升后，可以在较长时间内相对稳定，持续投放流量。

　　可扩展性：在掌握了关键词研究和内容扩展方法后，我们可以继续为网站和流量添加指南

　　常识点3：移动互联网时代，还需要做SEO吗？

　　看一些专业的查询数据，看看SEO还有没有用？

　　2017 年上半年，即时通讯、搜索引擎和网络新闻成为互联网的基本用途。用户规划趋于稳定，搜索引擎继续紧贴移动趋势。

　　虽然即时通讯已经确立为移动互联网流量中心的导入阵地。新网民各种用途的渗透率排名第一，比排名第二的搜索引擎16.高出9个百分点，但搜索引擎仍然排名第二。

　　截至2017年6月，我国搜索引擎用户计划达到6.9亿，使用率为81.1%，用户计划较2016年底增加707万，添加率为 1.2%

　　常识点4：搜索引擎是如何工作的？

　　面对数以万亿计的信息，搜索引擎如何在1秒或更短的时间内返回我们想要的内容？要回答这个问题，我们需要对搜索引擎的运行原理进行区分，大致划分一下。有3个阶段：

　　爬取和爬取：搜索引擎程序通过访问网页获取页面的HTML代码并存入数据库

　　预处理：程序对数据库网页进行一系列的处理，为排名程序的调用做准备

　　Ranking：用户输入关键词后，程序调用预处理数据，计算相关性，生成结果

　　先看列表的第一阶段，即“爬行爬行”

　　对于搜索引擎来说，首要任务是完成对互联网网页数据的采集。用于数据采集的就是我们经常听到的“蜘蛛”。它是搜索引擎用来抓取和访问页面的程序。蜘蛛公布页面访问请求后，服务器返回HTML代码，蜘蛛将接收到的代码存入数据库。蜘蛛将跟随链接并根据一页上的链接爬行（阅读）到下一个。这就是为什么它被称为“蜘蛛”。

　　在数据采集过程中，为了增加威力，防止重复阅读网页数据，搜索引擎会建立一个地址库来记录“已读”和“发现但未读”的页面。构建原创页面数据库，存储读取后的页面数据。

　　在读取并构建原创数据库后，搜索引擎将执行任务的第二阶段——“预处理”。什么是“预处理”？原创数据库中有数以万亿计的网页数据。排名程序无法每时每刻分析如此庞大的数据，1-2秒内也无法搜索回来。结果。因此，有必要对这些数据进行处理，为最终的排名程序调用做准备。

　　预处理的第一步是选择数据，去除无用信息，提取文本。现在的搜索引擎还是以文字内容为主。数据库中的页面数据，除了我们在网页上看到的文字外，还收录不能用于排名的内容，比如HTML标签和JavaScript程序。程序需要去除这些无用信息并提取可用于排名的内容。除了文本，程序还会提取一些收录文本信息的特殊代码，如Meta标签中的文本、图片替换文本、Flash文件替换文本、链接锚文本等。

　　接下来需要介绍一点常识，也就是中文搜索引擎独有的流程——“中文分词”。 “词”是程序处理数据和用户查询的单位和基础。与英语不同，搜索引擎需要区分用户正在查找的中文内容中哪些词构成一个词，然后才能进行下一步。

　　在分词之后，程序还需要经过另一个过程，就是去掉“停用词”。在任何语言中，都有出现频率高但对内容影响不大的词，如汉语的“的”、“啊”、“而”；英文中，"the" "a" "and" "to" "of" "Wait。这些被称为“停用词”，程序将这些停用词去掉，使搜索更加突出，减少程序记账中的内部冲突.

　　接下来，程序还将对网页数据进行重复数据删除。相同的内容可能会在多个网站中重复发布。为了防止重复的内容被多次退回支持，需要提前去除重复的内容。

　　完成上述操作后，程序会得到“common，可以反映页面的主题，在词汇方面”的内容，然后程序会被向前索引。通过提取关键词，将内容转化为“关键词的单位”的集合，以及关键词呈现的频率、模式（粗体、粗体锚文本）、方向（标题, page) 一起记录段落开始、段落结束) 等特征。然后将其转化为如下结构并存入数据库：

　　“正向索引”后的数据不能直接排序，因为同一个关键词可能会出现在多个文件中，于是聪明的程序员发明了“倒排索引”，重新启动文件的结构就是倒排索引:

　　现在，搜索引擎已准备好随时处理用户的搜索请求，接下来是搜索引擎任务的第三阶段，即排名。

　　搜索引擎每次收到用户要查找的内容时，都会这样处理：

　　分词（同预处理，根据“词”将我们要查找的内容分组）

　　去除停用词（同预处理，去除不相关词）

　　指令处理（搜索引擎默认使用关键词之间的“与”逻辑）

　　拼写纠正（纠正程序检测判断错误的内容）

　　经过上述处理和匹配后，程序会在倒排索引数据库中找到符合搜索内容关键词的文件集合。例如，如果搜索内容收录“关键词1”“关键词2”，排名程序只需要查找收录这2个关键词的文件，即“文件2”和“文件 3”。

　　由于数量庞大，搜索引擎程序不会处理这些庞大的数据，只会对页面数据中最重要的部分进行排名。另外，用户一般只查看前两页的搜索结果。因此，搜索引擎无需费力对所有数据进行排名。那么，如何对“页面数据最重要的部分”进行排名，这里就要靠自己的算法——相关性计算的辅助，算法会计算出某个页面数据与用户搜索内容的相关性，而然后完成排名。

　　到这里，搜索引擎已经基本完成了用户的“搜索请求”，但是按照2/8规则，搜索内容的20%左右，占总搜索次数的80%左右。搜索引擎会缓存常用词汇的排名和数据，并在用户搜索时直接调用缓存的数据，进而减少一系列庞大而耗能的过程，缩短反应时间，提升用户体验。

0

2021-12-31

搜索引擎优化知识完

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

搜索引擎优化知识完(增长超人将通过一个系列文章整理SEO常识点，你知道吗？)

0 个评论

发起人

AI时代内容工厂

搜索引擎优化知识完(增长超人将通过一个系列文章整理SEO常识点，你知道吗？)

0 个评论

发起人

相关问题