搜索引擎优化知识完(增长超人将通过一个系列文章整理SEO常识点,你知道吗?)

优采云 发布时间: 2021-12-31 18:21

  搜索引擎优化知识完(增长超人将通过一个系列文章整理SEO常识点,你知道吗?)

  说到Search Engine Optimization(搜索引擎优化),大家一定既熟悉又陌生。 SEO 是我们了解的第一个数字营销概念之一。那为什么要用“不熟悉”来形容呢?

  因为大多数人从职业生涯开始就只了解SEO的一些概念和术语,但是在搜索引擎的工作原理、日常遇到的SEO语句如何解读、如何发现问题、如何去发现问题等方面存在很多盲点。优化。 ,更不可能根据自己的情况制定SEO策略。

  所以从今天开始,超人成长会用一系列文章,力争为我们整理出SEO常识点。希望大家看完这个系列文章后,能得到一点启发,更好地为帖子服务。

  作为列表的第一章,我们先了解一些基本内容。我们是否考虑过以下问题:

  什么是搜索引擎优化?我们如何定义它?

  为什么要做SEO?

  移动互联网时代,还需要做SEO吗?

  搜索引擎的工作原理是什么?经过简单的“输入-搜索”操作后,搜索引擎如何从海量数据中找到我们需要的内容并展示给我们呢? ?

  带着这些问题,让我们一起√搞定今天的常识吧!

  常识点1:什么是SEO?我们如何定义它?

  SEO的全称是“Search Engine Optimization”,中文译为“搜索引擎优化”。

  简单理解SEO是一种从自然搜索结果中获取网站流量的方法和过程;

  如果再仔细定义一下,SEO就是“在了解搜索引擎自然排名机制的基础上,对网站进行内外部调整优化,以提高网站在搜索引擎中的关键词自然排名,为了抢流量,进而推动网站销售或品牌曝光的过程。

  常识点2:为什么要做SEO?

  网站每个人都希望自己的网站流量尽可能大。不管网站的盈利形式和政策是什么,来访都是一个条件。 SEO 是将访问者带到 网站 的最佳方式。一起来看看SEO的“优势”:

  低成本:虽然可能有成本,但成本相对较低

  高回报:SEO的大部分用户都是“主动找”酒店,政策很精准

  可移动:搜索引擎是用户查找、比较和购买产品的重要方式。移动互联网发展迅猛,SEO中心还在,只是载体变了

  足够耐用:一旦暂停投资,流量会急剧下降;线上活动等营销效果显着,但话题过后流量会下降。搜索排名上升后,可以在较长时间内相对稳定,持续投放流量。

  可扩展性:在掌握了关键词研究和内容扩展方法后,我们可以继续为网站和流量添加指南

  常识点3:移动互联网时代,还需要做SEO吗?

  看一些专业的查询数据,看看SEO还有没有用?

  2017 年上半年,即时通讯、搜索引擎和网络新闻成为互联网的基本用途。用户规划趋于稳定,搜索引擎继续紧贴移动趋势。

  虽然即时通讯已经确立为移动互联网流量中心的导入阵地。新网民各种用途的渗透率排名第一,比排名第二的搜索引擎16.高出9个百分点,但搜索引擎仍然排名第二。

  截至2017年6月,我国搜索引擎用户计划达到6.9亿,使用率为81.1%,用户计划较2016年底增加707万,添加率为 1.2%

  常识点4:搜索引擎是如何工作的?

  面对数以万亿计的信息,搜索引擎如何在1秒或更短的时间内返回我们想要的内容?要回答这个问题,我们需要对搜索引擎的运行原理进行区分,大致划分一下。有3个阶段:

  爬取和爬取:搜索引擎程序通过访问网页获取页面的HTML代码并存入数据库

  预处理:程序对数据库网页进行一系列的处理,为排名程序的调用做准备

  Ranking:用户输入关键词后,程序调用预处理数据,计算相关性,生成结果

  先看列表的第一阶段,即“爬行爬行”

  对于搜索引擎来说,首要任务是完成对互联网网页数据的采集。用于数据采集的就是我们经常听到的“蜘蛛”。它是搜索引擎用来抓取和访问页面的程序。蜘蛛公布页面访问请求后,服务器返回HTML代码,蜘蛛将接收到的代码存入数据库。蜘蛛将跟随链接并根据一页上的链接爬行(阅读)到下一个。这就是为什么它被称为“蜘蛛”。

  在数据采集过程中,为了增加威力,防止重复阅读网页数据,搜索引擎会建立一个地址库来记录“已读”和“发现但未读”的页面。构建原创页面数据库,存储读取后的页面数据。

  在读取并构建原创数据库后,搜索引擎将执行任务的第二阶段——“预处理”。什么是“预处理”?原创数据库中有数以万亿计的网页数据。排名程序无法每时每刻分析如此庞大的数据,1-2秒内也无法搜索回来。结果。因此,有必要对这些数据进行处理,为最终的排名程序调用做准备。

  预处理的第一步是选择数据,去除无用信息,提取文本。现在的搜索引擎还是以文字内容为主。数据库中的页面数据,除了我们在网页上看到的文字外,还收录不能用于排名的内容,比如HTML标签和JavaScript程序。程序需要去除这些无用信息并提取可用于排名的内容。除了文本,程序还会提取一些收录文本信息的特殊代码,如Meta标签中的文本、图片替换文本、Flash文件替换文本、链接锚文本等。

  接下来需要介绍一点常识,也就是中文搜索引擎独有的流程——“中文分词”。 “词”是程序处理数据和用户查询的单位和基础。与英语不同,搜索引擎需要区分用户正在查找的中文内容中哪些词构成一个词,然后才能进行下一步。

  在分词之后,程序还需要经过另一个过程,就是去掉“停用词”。在任何语言中,都有出现频率高但对内容影响不大的词,如汉语的“的”、“啊”、“而”;英文中,"the" "a" "and" "to" "of" "Wait。这些被称为“停用词”,程序将这些停用词去掉,使搜索更加突出,减少程序记账中的内部冲突.

  另外,程序会去除版权声明的文字、导航栏的文字等对搜索无用的文字,并消除噪音。

  接下来,程序还将对网页数据进行重复数据删除。相同的内容可能会在多个网站中重复发布。为了防止重复的内容被多次退回支持,需要提前去除重复的内容。

  完成上述操作后,程序会得到“common,可以反映页面的主题,在词汇方面”的内容,然后程序会被向前索引。通过提取关键词,将内容转化为“关键词的单位”的集合,以及关键词呈现的频率、模式(粗体、粗体锚文本)、方向(标题, page) 一起记录段落开始、段落结束) 等特征。然后将其转化为如下结构并存入数据库:

  “正向索引”后的数据不能直接排序,因为同一个关键词可能会出现在多个文件中,于是聪明的程序员发明了“倒排索引”,重新启动文件的结构就是倒排索引:

  现在,搜索引擎已准备好随时处理用户的搜索请求,接下来是搜索引擎任务的第三阶段,即排名。

  搜索引擎每次收到用户要查找的内容时,都会这样处理:

  分词(同预处理,根据“词”将我们要查找的内容分组)

  去除停用词(同预处理,去除不相关词)

  指令处理(搜索引擎默认使用关键词之间的“与”逻辑)

  拼写纠正(纠正程序检测判断错误的内容)

  经过上述处理和匹配后,程序会在倒排索引数据库中找到符合搜索内容关键词的文件集合。例如,如果搜索内容收录“关键词1”“关键词2”,排名程序只需要查找收录这2个关键词的文件,即“文件2”和“文件 3”。

  由于数量庞大,搜索引擎程序不会处理这些庞大的数据,只会对页面数据中最重要的部分进行排名。另外,用户一般只查看前两页的搜索结果。因此,搜索引擎无需费力对所有数据进行排名。那么,如何对“页面数据最重要的部分”进行排名,这里就要靠自己的算法——相关性计算的辅助,算法会计算出某个页面数据与用户搜索内容的相关性,而然后完成排名。

  到这里,搜索引擎已经基本完成了用户的“搜索请求”,但是按照2/8规则,搜索内容的20%左右,占总搜索次数的80%左右。搜索引擎会缓存常用词汇的排名和数据,并在用户搜索时直接调用缓存的数据,进而减少一系列庞大而耗能的过程,缩短反应时间,提升用户体验。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线