百度搜索引擎优化原理(什么是搜索引擎的工作原理及存储方式?如何处理?)
优采云 发布时间: 2021-09-02 05:16百度搜索引擎优化原理(什么是搜索引擎的工作原理及存储方式?如何处理?)
搜索引擎是一种响应机制。它的存在是为了发现、理解和组织互联网内容,以便为用户的搜索问题提供最相关的结果。那么就有必要了解搜索引擎的工作原理。为了出现在搜索结果中,您的内容必须首先对搜索引擎可见,其次是收录。如果您的网页未编入索引,它将永远不会出现在 SERP(搜索引擎结果页面)中。
一、搜索引擎的工作原理
搜索引擎通过三个主要功能工作:
1、crawl:在网上搜索内容,查看蜘蛛找到的每个网址的代码/内容。
2、Index:存储和整理爬取过程中发现的内容。页面一旦进入索引,就会在用户搜索时出现在查询结果中。
3、ranking:提供最能回答搜索者查询的内容片段,这意味着结果按从最相关到最不相关的顺序排列。
什么是搜索引擎抓取?
爬网是一个发现过程,在这个过程中,搜索引擎会派出一组机器人(称为爬虫或蜘蛛)来寻找新内容和内容更新。内容可能不同——可以是网页、图片、视频、PDF等——但无论格式如何,内容都是通过链接找到的。
Googlebot 首先获取多个网页,然后按照这些网页上的链接查找新网址。通过沿着此链接路径跳转,爬虫能够找到新内容并将其添加到名为 Caffeine 的索引系统中,这是一个巨大的已发现 URL 数据库。当用户在该 URL 上搜索内容时,这很有意义。好搭配。
什么是搜索引擎索引?
搜索引擎处理并存储它们在索引中找到的信息。索引是一个庞大的数据库,收录所有已发现的内容,足以为搜索者提供服务。
什么是搜索引擎排名?
当有人执行搜索时,搜索引擎会在其索引中搜索高度相关的内容,然后对内容进行排序以解决搜索者的查询。这种按相关性排序的搜索结果称为排名。一般来说,您可以假设网站 的排名越高,搜索引擎认为网站 与查询需求的相关性越高。您还可以阻止搜索引擎抓取网站 的部分或全部内容。虽然这样做可能是有原因的,但如果您希望搜索者找到您的内容,您必须首先确保抓取工具可以访问它并且可以将其编入索引。
二、如何查看网站在搜索引擎中的索引
正如刚才提到的搜索引擎的工作原理,确保你的网站被抓取并被索引是出现在SERP中的先决条件。如果你已经有了网站,可以先查看索引中的页数。检查索引页的一种方法是“站点:”。转到 Google 并在搜索栏中输入上述命令。这将返回 Google 在其索引中针对指定站点的结果:
Google 显示的结果数量(参见上图中的“关于 XX 结果”)并不准确,但确实可以让您清楚地了解 网站 哪些页面被编入索引以及它们在搜索结果中的位置显示方式。
要获得更准确的结果,请使用 Google Search Console 中的索引覆盖率报告。如果您目前没有,可以注册一个免费的 Google Search Console 帐户。使用此工具,您可以为您的网站 提交站点地图,并监控实际添加到Google 索引中的提交页面数量等。
如果网站没有出现在搜索结果中,可能有以下原因:
1) 您的网站 是全新的,尚未被抓取。
2)您的网站还没有建立任何外部链接网站。
3) 你的网站 导航让爬虫很难有效地抓取它。
4) 您的站点有防止爬虫爬行的代码。这些代码将阻止搜索引擎收录 网页。
5)您的网站存在严重质量问题,被谷歌处罚。
三、如何让搜索引擎抓取你的网站
如果您在使用 Google Search Console 或“site:”时发现索引中遗漏了一些重要的页面,以及索引错误的一些不重要的页面,您可以更好地引导 Googlebot 抓取您的 Web 内容。比如通过GSC URL检查,重要的页面先提交给Google进行索引,robots.txt用于告诉搜索引擎哪些页面不想让Googlebot查找。包括内容稀疏的旧网址、重复网址(如电子商务排序和过滤参数)、特殊促销代码页等。
Robots.txt文件位于网站的根目录下(例如/robots.txt),文档中写有搜索引擎抓取和不抓取的文件路径。如果Googlebot找不到网站的robots.txt文件,它会继续抓取网站;如果找到这个文件,它通常会按照规则继续爬取网站。
您还可以通过提交 XML 站点地图来允许抓取工具发现您的网页并将其编入索引。确保 Google 找到您所有 网站 页面的最简单方法之一是创建符合 Google 标准的站点地图文件并通过 Google Search Console 提交。它可以帮助抓取工具跟踪您所有重要页面的路径并将其编入索引。
四、一些与排名相关的数据指标
在 Google 排名中,参与度指标是指显示搜索者如何通过搜索结果与您的 网站 互动的数据。这包括以下内容:
1) 点击(来自搜索的访问)
2)页面停留时间(访问者离开前停留在页面上的时间)
3) 跳出率(只浏览一页的用户百分比)
4) Pogo-sticking(点击一个搜索结果,然后快速返回 SERP 选择另一个结果)
Google 前搜索质量主管 Udi Manber 表示:排名本身受点击数据的影响。如果我们发现对于一个特定的查询,80% 的人点击 #2,只有 10% 的人点击 #1,过一段时间我们会发现 #2 可能是人们想要的,所以我们会提高它的排名。
各种测试已经证实谷歌会根据搜索者的参与度调整SERP序列:
1)Rand Fishkin 之前的测试允许大约 200 人从 SERP 中点击 URL,第 7 名的结果上升到第 1 名。有趣的是,排名提升似乎与访问链接的用户所在的位置无关。在参与者众多的美国,排名飙升,而在谷歌加拿大、澳大利亚等页面的排名仍然较低。
2) Larry Kim 测试了一些热门页面并比较了它们的平均停留时间,结果表明 Google 算法会降低停留时间较短的页面的排名位置。
就页面排名而言,参与度指标就像一个事实检查器,它不会改变您网页的客观质量。链接和内容等客观因素先对页面进行排名,然后是参与度指标,可以帮助谷歌在用户体验方面调整排名。如果搜索者的行为表明他们更喜欢其他页面,您的排名可能会下降。
结论:现在定位结果受事实数据的影响。这种交互性是搜索者交互和响应本地企业的方式。由于谷歌希望为搜索者提供最好和最相关的本地业务,因此他们使用实时参与指标来确定质量和相关性是非常有意义的。但是我们不需要了解谷歌算法的来龙去脉(这仍然是一个谜!),我们只需要对搜索引擎的工作原理(如何抓取、索引、存储和排名)有一个基本的了解。