百度搜索引擎优化原理(做SEO没有长久的“秘笈”,你知道吗?)

优采云 发布时间: 2021-08-31 04:01

  百度搜索引擎优化原理(做SEO没有长久的“秘笈”,你知道吗?)

  众所周知,百度的搜索引擎系统分为几个重要的系统:抓取系统、快照存储系统、页面分析系统、索引系统、检索和召回系统。百度搜索引擎的基本原理和流程可以参考皮子锐的《SEO深度分析》一书的“搜索引擎原理”部分。这部分码迷跟皮子锐老师的略有不同,对百度搜索引擎的基本原理和流程做了比较深入的拆解分析。

  

  关于代码迷

  7年SEOer,摩天大楼内容助理作者,专注SEO算法研究,倡导精益科学的SEO识别。 QQ号2027725943,欢迎志同道合的朋友一起交流。

  心碎

  很多同事都说做百度SEO越来越难了。都说百度等搜索引擎现在自媒体抓了很多流量,SEO做不到。

  但是很多公司反映百度的流量转化率仍然高于抖音,比如自媒体。

  我认为SEO并不是越来越难,只是你没有改变。

  经过十多年的发展,百度搜索引擎已经发生了很多很多的变化,但你还是原地踏步。我从12年左右开始接触SEO,优化方法不断升级迭代,但很多同行业的方法16年前就卡住了。

  做SEO没有长期的“秘密”。重要的是主动跟上搜索引擎算法的步伐,然后做实验找出规律,然后用合理的手段将优化优化到极致。

  基本概述

  很多书只提到搜索引擎原理上的倒排索引,而更多的书只讲内容处理、链接处理、用户体验。事实上,百度搜索引擎是一个非常复杂的项目。除了做一些积极的事情,比如反作弊、推广优质内容等,搜索引擎还有一些令人难以置信的处理程序,比如人工干预和圈子流量策略。一块。

  Magic 认为搜索引擎的大致结构如下:

  

  大致分为百度抓取和百度查询两部分。

  百度爬取部分

  步骤 01

  百度爬虫查找网页并抓取网页的html内容

  步骤 02

  百度对抓取到的网页进行初步的页面分析。先分词,去掉停用词。

  

  步骤 03

  这一步主要是对网页的初步评估。

  通过向量空间模型对分词后的网页进行初步分类判断;

  利用相关算法提取相关词,判断话题集中度;

  通过结构相似度和文本相似度算法确定原创degree;

  利用信息熵等手段判断是否存在恶意广告;

  最后进入反黄*赌*毒*系统等。

  步骤 04

  如果内容通过测试,百度将访问网页的分词结果转化为有效索引倒排,提取网页内容的结构化数据(标题、摘要、内容等),并保存快照.

  百度查询部分

  步骤 01

  首先对用户输入的查询词进行分词处理,通过用户的地理位置、个性化信息和机器学习预测查询词的实体类型,第二个需求词,第三个需求词词等被预测。

  比如搜索“优采云票”,那么“优采云票查询”、“优采云票12306”、“优采云票改签”也会被纳入用户需求。第N个需求词,也叫后续词,也可以通过对后续词做文章来优化排名。

  如何使用后续词获取排名,码粉们在之前的博文《黑帽SEO案例分析:用“摩天大楼SEO工具”分析黑帽SEO手段》中提到的代码迷们,如果回到家,自然也会明白逆冬的手段,没看也没关系,后面的章节代码爱好者会详细告诉你。

  

  Step 02 粗排序步骤

  “粗略布局”的概念最早是在零的公众号文章《我是如何在百度首页对“SEO”这个词进行排名的》中被码迷看到的。

  粗略的类型是百度使用布尔模型在大量信息中找到N个符合要求词组的文档。然后通过与训练结果模型的向量距离比较,过滤出M个文档,然后通过结果距离算法得到第一个O个文档集合,通过BM25相关性得分取出TOP760文档集合。

  

  比如百度的专利“2.0信息搜索方法和装置”就引用了刘德华妻子的例子。当你搜索“刘德华”时,如果你的页面中没有“朱丽倩”,说明页面内容很差,很大程度上进不了粗排。

  

  打个广告:摩天轮内容助手是一款可以精准预测相关词的工具,推荐大家使用

  

  Step 03 子安排链接

  整合每个文档对应的链接权重得分、点击日志得分、网页加载速度、相关性得分、查询结果分类策略等,然后插入人工干预的内容,结合用户日志分析(快速排名) ),并将最终的排序结果呈现给用户。

  大家爱听的持久快速的排名方式,比如“首页7天”,都是干扰精细排名的点击策略,影响百度预测的正向结果模型,促进短术语主页。

  

  总结

  其实我们在做SEO的时候,应该知道,人类最宝贵的东西就是生命。生命只属于我们一次。

  SEOer的人生就该这样度过:

  回忆往事,不后悔网站降权,也不以身为K站为耻;

  临终时,他可以说:“我的一生和所有的精力都奉献给了世界上最伟大的事业!努力与百度争夺SEO流量。

  百度李老板的终极目标是赚钱。我们做 SEO 是为了捕获部分流量来赚钱。

  现在的搜索引擎已经很长时间不简单了。如何在李老板眼皮子底下获得更多流量,我们下一节开始正式讨论。

  文末福利

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线