如何搜索引擎优化(基于Google搜索引擎,基本原理和理论适用于Bing等其他搜索引擎)
优采云 发布时间: 2022-01-16 18:14如何搜索引擎优化(基于Google搜索引擎,基本原理和理论适用于Bing等其他搜索引擎)
在第一章中,我们说过搜索引擎是一个问答机器,其意义在于发现、理解、存储和组织互联网上的内容,并在用户搜索时根据相关性为用户提供内容排名。
搜索结果的相关性,即搜索结果是否满足用户的意图,是衡量搜索引擎质量的最重要指标。
简单来说,就是“用户可以搜索自己想要的东西”。
因为每个人的知识背景不同,即使用同一个关键词搜索,每个人的意图(需要的答案)也不一定相同。满足全世界用户的愿望并不容易。事物。
毫无疑问,谷歌是目前世界上最好的搜索引擎。为什么人们要使用谷歌而不是百度,因为谷歌可以更好地搜索我们需要的答案。
换句话说,谷歌更了解用户。
下面的文章是基于谷歌搜索引擎的,其基本原理和理论同样适用于Bing等其他搜索引擎。
一、搜索引擎是如何工作的?Crawl Crawl:不断搜索整个互联网,根据URLs抓取网站的内容和代码。索引索引:存储和组织捕获的海量网络内容。网站被爬取后,会进入索引过程。索引完成后,可以在相关搜索结果中看到网站的内容。Ranking Rank:根据用户的搜索词从存储的网页中查找相关内容,将网站的部分片段展示给用户。网站 越符合用户的搜索意图,排名越高。搜索引擎如何抓取网页?
搜索引擎机器人(也称为“蜘蛛”)不断在 Internet 上寻找和发现新内容。
内容可以是网页、视频、PDF 文件,无论格式如何,最终都会以 URL 链接的形式被发现。
蜘蛛从一个网络节点(URL)开始,爬取该节点的内容,并在该节点中找到其他的URL节点,然后继续向下爬取这些节点,直到爬取整个互联网上的URL。
这里很重要的一点是,你的网页网址必须出现在其他已经被蜘蛛爬过的网页中,否则蜘蛛将无法找到你。
其他网站 中指向我们的网站 的链接称为外部链接。搜索引擎蜘蛛不仅依靠外部链接来抓取我们的网页内容,还会根据外部链接的数量和来源的可靠性来判断我们。网页的质量是好是坏。
当然你也可以设置网站不让蜘蛛爬,或者让蜘蛛只爬一部分。
什么是索引索引?
搜索引擎拥有海量的数据库系统,抓取的网页会进入数据库系统,按照一定的规则进行排序存储。这个过程就是索引。
什么是搜索引擎排名?
当用户输入关键词进行搜索时,搜索引擎从索引数据库中检索出相关内容,然后根据自己的算法对内容进行排序,排列出最相关的内容以满足用户的需求。根据相关性排序就是排名。
二、如何确保网页被搜索引擎收录?
在搜索引擎中输入“site:”,如果返回结果中收录您的网站内容,则表示网站已被索引。
返回的结果中有一行显示有多少结果。该数据是 Google 索引数据库中关于此 网站 的所有页面的数量。结果不一定准确,可以作为参考。
如果需要更准确的索引号,可以使用谷歌提供的免费工具谷歌站长工具(Google Search Console)来查看。
如果您的 网站 没有出现在搜索结果中,可能是由于以下原因:
谷歌的蜘蛛机器人已经够聪明了,但是它仍然不明白你的网站中哪些页面是重要的,哪些是过时的,哪些不需要索引(比如隐私声明等),因此,我们有必要把这个信息告诉谷歌,而网站中与蜘蛛机器人打交道的语言是以下两个文件:
机器人.txt
一般位于网站根目录下,该文件会由WordPress中安装的Yoast SEO、All in one SEO、Rank Math等常见的SEO插件自动生成。
该文件具有三个功能:
如果你的网站没有这个文件,google会默认抓取所有可以抓取的网址。如果有这个文件,谷歌蜘蛛就会按照这个文件的规范进行爬取。
机器人文件只是一个软约束,并不是所有的搜索引擎都会遵循这个规则,恶意电子邮件地址搜索引擎也不会遵循这个规则。
另外,如果是WordPress网站,请确保在设置中没有勾选“搜索引擎不索引此站点”选项。
抓取预算是多少?
无论 Google 蜘蛛多么强大,它的 收录 网络资源也是有限的。尽管我们指定了机器人规则以允许 Google 抓取网站范围内的内容,但 Google 不一定会包揽一切。
具体的 收录 内容取决于许多因素,包括它对您的 网站 内容的重视程度、它的年龄等等。这个最终能被搜索引擎搜索到的数据量收录就是蜘蛛对我们的抓取预算网站。
如何让谷歌优先考虑收录重要内容?
由于抓取预算有限,为了让 Google收录 优先考虑我们认为重要的内容,请确保以下几点:
内容不会隐藏在登录屏幕后面,Google 无法抓取需要登录才能查看的内容。虽然谷歌越来越聪明,但它并不能保证图片和视频中的文字内容能够被完全索引。如果网页内容是图片、视频等多媒体格式,最好同时添加文字。清晰的内部导航结构。一个网页,如果没有指向它的内部链接,对蜘蛛来说就好像它不存在一样。这里所说的链接不仅是网页头部的导航,也是页面之间的链接关系。
将站点地图用于站点地图。顾名思义,站点地图是 网站 的 URL 列表,它告诉搜索蜘蛛 网站 有哪些页面。该文件可以手动编辑,当然也可以由 SEO 插件自动生成。
有关站点地图规范,请参阅 Google 站点地图帮助文档
三、搜索引擎如何对结果进行排名?
搜索引擎如何确保查询某个关键词的用户得到他们想要的答案?
答案是相关性。
Google 如何确定网页与某个 关键词 的相关性?
答案是谷歌的排名算法。
排序算法是谷歌的核心资产。对于外人来说,排序算法是一个黑盒子。我们无法知道里面是什么,只能从外部的角度观察它。
而谷歌的算法还在不断变化,甚至每天都在变化。详情可以查看Moz计算的google核心算法更新记录:/google-algorithm-change,记录了2000年以来的所有重大更新。
不建议花太多时间研究谷歌的算法,谷歌也不会主动泄露算法更新的信息。我们能找到的算法信息是基于SEO行业人士的经验。
无论算法如何变化,它的方向都保持不变,提高搜索结果的质量并尽快满足客户的意图。
我们努力的方向应该与它一致,以满足客户的意图。
那么哪些网页最有可能满足客户的意图呢?
1、链接链接
在之前的文章中,我们提到如果一个页面没有被外部网页链接,那么它就不能被搜索引擎蜘蛛看到,也不能被索引。因此,链接在搜索引擎中起着非常关键的作用。
链接不仅决定了网页能否被索引,链接的数量和质量也是搜索引擎衡量网页排名的重要标准。
有两种类型的链接:
外部链接:顾名思义就是我们的网站从外部网站导入的链接地址,内部链接就是我们的网站内部引入不同页面的链接地址.
外部链接类似于现实社会中的口碑。如果大家都说某家餐厅的菜好吃,尤其是吃这方面的权威人士或机构也都说这家餐厅好吃,那我们基本可以判断这家餐厅的菜好吃(虽然不是一定是正确的,但这就是现实世界的运作方式)。
内链就等于说你餐厅的菜好吃,权限会少很多。
切换到网站,如果有很多权威的网站链接了你的网站,说明你的网站口碑不错。搜索引擎还根据口碑确定页面排名。
链接资产
除了链接的数量外,还有权重的衡量标准。权重相当于现实世界中的可信度。咖啡领域的专家不如红酒领域的专家可信。
谷歌有一个专有名词“PageRank”来衡量链接的权重,由创始人拉里佩奇发明。网页内容越相关,行业权威度越高网站,链接权重越高。
链接权益的详细介绍请参考:/learn/seo/what-is-link-equity。
我们如何才能让其他人链接到我们的 网站?
网站不可能无缘无故地介绍其他网站的链接,就像在现实社会中,不知道某家餐厅我们不会无缘无故说好。权威人士不太可能随意发表评论。
网站要被其他网站,尤其是具有高权限的网站引用,优质的内容是必不可少的一环。
2、内容
搜索引擎问答机返回的答案来自它所抓取的网页内容,而不是它自己存储的答案。
换句话说,你在谷歌上查找一个问题,谷歌只会告诉你哪个页面最有可能回答你的问题。
每个用户查询都有数千个可能的结果。搜索引擎如何知道哪个页面最有可能满足用户的查询需求?
如前所述,搜索引擎会根据用户的意图以及使用的 关键词 与页面内容的匹配程度来判断。
如何计算匹配,哪些页面最匹配 关键词 或用户意图?关键词 出现多少次合适?页面内容多长时间?
这些问题也没有标准答案,或者说除了谷歌之外的任何人都不可能完全清楚。
听到这里,也许你会觉得很悲哀……作为一个SEO从业者,这个行业没有硬性标准。
别担心,我们不知道排序算法和相关算法是如何工作的,但我们知道它的运行结果。
全球SEO从业者通过逆向工程不断调整各种网页参数,观察搜索结果的排名规则,总结数百个影响排名的因素。发现三个关键因素没有改变:
反向链接网页内容(满足搜索者意图的高质量内容)RankBrain3、RankBrain
RankBrain 是 Google 核心算法中的机器学习组件。所谓机器学习,其实就是一个计算机程序。该程序与普通程序的不同之处在于,它会根据当前的成绩和表现不断调整下一次的排名结果。因此,我们看到的搜索结果是不断变化的,每次搜索都可能看到不同的结果。
例如:如果一个在排名中排名较低的页面受到更多用户的关注,它可能会在接下来的搜索结果中排名第一。这就是 RankBrain 发挥作用的地方。
同样,我们无法知道 RankBrain 是如何工作的,甚至 Google 的工程师也不知道。
4、参与度指标
另一个越来越重要的指标是参与度,即用户在网页上的交互方式,主要体现在:
4、其他排名因素
以上四点只是SEO行业从业者总结出来的最有可能的因素。MOZ 进行了一项调查,采集了可能影响搜索引擎排名的因素。详情请参考:/search-ranking-factors/correlations。