allintitle:seo 搜索引擎优化(新型人工智能机器学习算法:让网站符合算法的规则提升自然排名 )

优采云 发布时间: 2021-10-03 16:06

  allintitle:seo 搜索引擎优化(新型人工智能机器学习算法:让网站符合算法的规则提升自然排名

)

  译者:朱欢、胡祥杰

  【新智苑攻略】如果你想在谷歌或百度的搜索结果中排名靠前,除了广告(给钱),你还可以选择SEO(搜索引擎优化):让网站遵守规则算法并提高搜索引擎内的自然排名。但从去年开始,谷歌就开始使用基于深度学习的人工智能核心搜索算法RankBrain。本文认为,这种越来越“人性化”的算法将每个搜索结果个性化,每个网站排名都变得越来越随机,搜索引擎“钻空子”会越来越难。搜索引擎优化将继续是非常技术性的。只有掌握好分析和大数据做SEO,才有希望获得巨大的收益。

  

  RankBrain 仍是弱人工智能

  现在大家都听说过谷歌的RankBrain算法。这种全新的人工智能机器学习算法是诞生于加州山景城谷歌总部的最新、最重要的算法。然而,很多读者可能还没有意识到RankBrain 会引起SEO(搜索引擎优化)行业的快速变革。在本文中,我将带您了解一些清晰的示例,让您了解SEO 的许多旧规则已不再适用,并让您知道如果您想保持领先地位并继续提供SEO 服务对于您的业务,您需要做什么。

  那么,什么是人工智能?

  一般来说,人工智能分为三种类型:

  1.弱人工智能:这是为特殊目的服务的人工智能(例如,用于击败世界象棋冠军的人工智能)

  2.强人工智能:这是一种可以做任何事情的人工智能。一旦人工智能能够像人类一样行动,我们就认为它具有强大的人工智能。

  3. 人工智能超级智能:人工智能对做任何事情的水平都非常高(例如,它的水平超过了一个人)。

  当我们谈论 Google 的 RankBrain 和 Google 目前运行的机器学习算法时,我们谈论的是弱人工智能。事实上,弱人工智能已经存在一段时间了。您有没有想过电子邮件服务中的垃圾邮件过滤器是如何工作的?是的,这就是弱人工智能的表现。我最喜欢的弱人工智能项目是:谷歌翻译、IBM Watson、亚马逊的自动产品推荐、自动驾驶汽车和我们亲爱的谷歌RankBrain。

  在弱人工智能的世界里,有很多不同的方式来实现它。Pedro Domingos 曾在 MasterAlgorithm 一书中明确指出,那些试图实现完美人工智能的数据科学家可以分为五个“派系”,它们是:

  • 象征主义者

  • 联结主义者

  • 进化论者

  • 贝叶斯

  • 行为类比器(Analogizers)

  Google 的 RankBrain 属于联结派。连接论者认为,我们所有的知识都被编码为大脑中的神经元连接。RankBrain 使用的具体方法是一种被专家称为“反向传播”的技术,这种方法后来被称为深度学习。

  Connectionists 声称这种方法可以从原创数据中学习任何东西,因此它最终可以实现知识发现的自动化。谷歌显然相信这一点。2014年1月26日,谷歌宣布收购深度学习公司Deepmind,彰显其在该领域的野心。

  因此,当我们谈论 RankBrain 时,可以说它使用了弱人工智能中的深度学习技术。那么,目前该领域的发展情况如何?更重要的是,它如何改变 SEO 业务?

  2025年左右实现强人工智能?

  在他的文章“AI 革命:通往超级人工智能之路”中,Tim Urban 比任何人都更清楚地解释了这项技术的发展。

  回顾历史,技术的进步是这样的:

  

  然而,正如厄本所指出的,在现实中,你实际上看不到自己立场的正确一面(即你的未来)。因此,当您站在图表的当前位置时,您的实际感受是这样的:

  

  这张图表显示的是,当人类试图预测历史时,他们往往低估了未来的趋势。这是因为他们总是在图表的左侧查看过去,而不是在图表的右侧查看未来。

  然而,现实是,随着时间的推移,人类的进步越来越快。Ray Kurzweil 将此称为“加速循环定律”。库兹韦尔理论背后的科学原理是:与过去不太先进的社会相比,未来更先进的社会有能力以更快的速度进步——因为当时的社会更先进。这种推理也可以应用于人工智能和技术进步的增长率。

  在计算资源方面,我们已经看到了这一点。通过以下图标,您可以查看由于“加速循环定律”而进展的速度:

  

  正如您所看到的,我们都直观地感觉到,处理器和计算机技术的增长受益于加速周期的规律。另一个令人震惊的事情是,在未来的某一天,一台简单的计算机的处理能力不仅会超过一个人,而且会超过所有人类的总和。

  

  事实上,看起来我们将在 2025 年左右实现强大的人工智能。技术显然发展得越来越快,这肯定会让我们大多数人感到惊讶。

  从傻瓜到爱因斯坦

  正如我上面解释的,谷歌的 RankBrain 只是弱人工智能的一个例子。这意味着 RankBrain 在特定领域可以比一个人做得更好,但仅此而已:它只是人工智能的一种相对较弱的形式。然而,即使是这种“弱”的人工智能,也会很快成为我们不知道如何应对的东西。

  

  你可以清楚地看到,谷歌的 RankBrain 尽管在特定任务上非常聪明,但在一般智能量表上仍然失败。但是,如果我们将加速循环定律应用到人工智能领域会发生什么?Tim Urban 进行了这样一个思想实验:

  “随着人工智能的智能离我们越来越近,我们会看到它变得越来越聪明,就像动物一样。在那之后,它会达到人类的最低层次——用尼克博斯特罗姆的话来说,它来自于村。傻瓜的水平——我们会说,“哇,看起来像人类的傻瓜,太可爱了!” 然而,重要的是,在各级智能的谱系中,从傻瓜到爱因斯坦的所有人类只占一小部分——因此,在人工智能达到“村傻瓜”的水平并拥有强大的人工智能后,突然变得比爱因斯坦更聪明,我们不知道那会是什么。”

  

  那么,这对 SEO 业务和我们当前的人工智能意味着什么?

  在我们开始预测未来之前,让我们先来看看 RankBrain 是如何改变 SEO 的。我与 Scott Stouffer 进行了交谈,他是卡内基梅隆大学的校友、Market Brew(一家为财富 500 强 SEO 团队提供搜索引擎模型的公司)的首席技术官,以及联合创始人 Scott Stouffer。作为一名搜索工程师,Stouffer 对过去几十年的发展有着大多数人所没有的独特视角。

  ,SEO行业应该如何应对?以下是他的一些建议。

  回归分析存在严重缺陷

  这是目前SEO行业最大的缺陷。每当谷歌的排名发生巨变时,就会有很多“高手”——一些来自行业知名公司的数据科学家和CTO会宣称他们知道谷歌的排名指数最近发生变化的原因。事实上,他们最常用的方法就是仔细分析过去几个月的排名数据,了解各种网站的排名情况是如何变化的。

  按照目前的回归分析方法,这些数据科学家会指出一些受到影响(正面或负面)的特定类型的网站,并且相当肯定谷歌最近的算法变化就是针对这些网站@ > shared 出现某种类型的算法(内容或外部链接)。

  然而,谷歌不再这样做。Google 的 RankBrain 使用机器学习/深度学习方法,它的工作方式与过去大不相同。

  事实上,谷歌内部已经存在许多核心算法。RankBrain 的任务是学习如何组合这些核心算法以最好地应用于每种类型的搜索结果。例如,在某些搜索结果中,RankBrain 可能会了解到最关键的搜索信号是这些搜索结果中的 Meta Title。

  给那些元标题匹配算法更多的权重,这可能会带来更好的搜索体验。但在另一个搜索结果中,相同的元标题信号与良好的搜索体验之间可能存在负相关。因此,在这种类型的搜索中,可能会给予其他算法(例如 PageRank)更多的权重。

  

  这意味着在每个搜索结果中,Google 使用了完全不同的算法混合方法。现在,您将明白为什么“在没有搜索结果上下文的情况下对所有 网站 进行回归分析”是一个严重的缺陷。

  由于这些原因,当前的回归分析必须基于每个特定的搜索。Stouffer 最近谈到了一种搜索模型方法,可以用来衡量谷歌算法的变化程度。

  首先,您可以截取屏幕截图来确定搜索引擎模型在过去针对特定 关键词 搜索的校准情况。然后,当检测到排名方法发生变化时,您可以重新校准搜索引擎模型以显示两个搜索引擎模型设置之间的差异。使用这种方法,您可以看到在经历排名方法的变化后,哪些特定算法的权重有所增加或减少。

  知道了这一点,我们就可以专注于如何针对这些特定的搜索结果改进网站的SEO。但同样的方法不适用于其他搜索结果。这是因为 RankBrain 在搜索结果级别(或 关键词)运行。准确地说,RankBrain 为每个搜索结果个性化了算法。

  把握细分,避免误分类

  Google 还发现他们可以让新的深度学习系统 RankBrain 了解“好”网站 的外观和“坏”网站 的外观。正如他们为每个搜索结果分配不同的算法权重一样,他们也发现每个垂直领域都有不同的“好”网站 和“坏”网站 示例。这无疑是因为不同的垂直领域有不同的客户关系管理方法、不同的模板和数据结构类型。

  当 RankBrain 运行时,它实际上是在学习每个垂直环境中正确的“设置”是什么样的。您可能已经猜到,这些正确的设置是什么完全取决于设置所在的垂直场。比如在医疗行业,谷歌知道这样的网站有很好的口碑,就会把这样的网站放在它的搜索索引的顶部。而任何结构上与WebMD网站类似的网站也会归入“好”的类别网站。同样,那些结构上与已知医疗废物网站相似的网站将被归类为“不良”网站。

  由于 Rankbrain 使用深度学习能力同时对“好”网站 和“坏”网站 进行分类,如果您的 网站 收录许多不同行业的信息怎么办?

  

  首先,我们必须更多地讨论深度学习的工作原理。在将所有 网站 分为“好”和“坏”两组之前,RankBrain 必须首先确定每个 网站 属于哪个类别。网站 这样的分类很好。尽管这两个 网站 上有许多不同的子类别,但它们都有一个通用类别。这种网站很容易分类。

  但是,那些收录许多不同类别的 网站 呢?这种 网站 类型的一个很好的例子是 How-To 类型的 网站。这些网站通常有很多通用的类别。面对这些网站,深度学习方法会崩溃。那么,谷歌在面对这些网站时使用了什么样的训练数据呢?答案是:它可能使用了看似随机的数据。它可以从许多类别中选择这个类别,也可以选择另一个类别。对于像维基百科这样知名的网站,谷歌可能根本不采取任何分类过程,以确保深度学习过程不会干扰用户现有的搜索体验(因为像维基百科这样的大型网站可能会产生不良网页。)

  然而,那些鲜为人知的网站会怎样呢?答案是:“谁知道?” 也许这个机器学习过程可以自动对每个网站进行分类,然后与其他网站进行比较。操作方法类型 网站 可能看起来与 WebMed 网站 相同。

  如果系统的分类过程认为这个网站是关于鞋子的,那么它会比较网站和Nike 网站结构而不是WebMD。或许,这个网站的结构很像一个鞋垃圾网站,不像有名的WebMD网站;如果是这样,内容太笼统了网站 会被标记为“垃圾”。因此,如果此 How-To 类型 网站 具有不同的子域,则最好使每个子域看起来与域 网站 中的最佳域相似。掌握这些细分。

  可以识别“好坏”的RankBrain

  让我们来看看这将如何影响外部链接。根据上面提到的分类过程,以下内容将变得比以往任何时候都更加重要:坚持只在您的邻近区域进行链接。因为RankBrain可以知道你的某些外链是否与你的垂直领域中的同类型网站不同。

  让我们仍然使用前面的例子。一家公司有一个关于鞋子的网站。我们知道,RankBrain 的深度学习过程会尝试将这个 网站 的各个方面与鞋业中最好和最差的 网站 进行比较。因此,这个网站的外链特征也会被用来与同类网站的最佳和最差外链特征进行比较。

  假设一个典型的知名鞋业网站在三个相邻区域有以下外部链接:

  运动的

  健康

  时尚

  现在,假设公司的 SEO 团队决定从这三个相邻区域购买外部链接;另外,由于公司CEO与汽车行业有一定关系,他们决定使用汽车的免费外部链接网站。看起来很“聪明”:他们采用交叉营销的方式,在车上展示“租车,送鞋”的页面网站,这些页面会引导到公司的新鞋页面。看起来很棒,不是吗?

  但是RankBrain会发现这一点,发现网站的外链特征与鞋业网站的特征有很大的不同。更糟糕的是,它发现很多鞋垃圾网站也有来自汽车网站的外链功能。

  这样,即使 RankBrain 不知道什么是“正确”的外部链接功能,它也注意到了其搜索引擎结果的“好”网站 和“坏”网站@。>. 这个鞋业网站将被标记为“坏”,来自汽车网站的免费外链将带来流量急剧下降。

  你不能再利用它了

  从我们之前对加速度定律的讨论中,我们知道RankBrain等人工智能在未来会超越人脑。在这一刻,没有人知道这项技术将把我们带到哪里。

  然而,有些事情是确定的:

  从某种意义上说,深度学习方法使 SEO 业务变得更容易。当你知道RankBrain等类似技术已经具备了堪比人类的能力时,你应该遵循的原则就变得非常明确:你不能再钻空子了。

  在另一种意义上,事情变得更难了。SEO 领域将继续变得非常技术化。分析和大数据是当今的王者,那些还不熟悉这些方法的SEO们必须尽快赶上。那些已经拥有这些能力的 SEO 们希望他们在未来能获得巨大的收益。

  “招聘”

  专职记者、编撰及活动运营

  欢迎实习生

  和人工智能翻译机构的志愿者

  更多信息请进入公众号点击“招聘”

  或电邮至

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线