搜索引擎优化指南20(提高非文字内容的可爬取性:可索引的链接结构 )

优采云 发布时间: 2022-01-14 14:12

  搜索引擎优化指南20(提高非文字内容的可爬取性:可索引的链接结构

)

  对于搜索引擎优化的方法,众说纷纭。不同的搜索引擎和不同的国家可能有不同的优化方法。本文总结了一些国外的搜索引擎优化方法。可操作性还是比较强的,应该可以作为参考。

  可索引的内容

  为了让页面更好地被搜索引擎识别,重要的内容应该放在 HTML 文本标签中。虽然网络爬虫技术有了长足的发展,但 FLASH 文件、Java 小程序和非文本内容通常被搜索引擎爬虫忽略。但是,以下策略可以提高非文本内容的可抓取性:

  可抓取的链接结构

  搜索引擎在抓取页面内容进行索引之前,需要通过搜索链接找到该页面。可爬取的链接结构对于爬虫查找 网站 上的所有页面至关重要。由于不可抓取的链接,大量网站无法被搜索引擎索引。下面是一个典型的问题站点。

  

  不可抓取的链接结构

  在此示例中,搜索引擎永远无法找到页面 C 和 D,因为这两个页面没有直接的、可抓取的链接。如果搜索引擎连一个页面都找不到,那么无论内容再好,关键词准确,爬虫都无法到达那个页面。

  以下是搜索引擎无法访问页面的几种常见情况:

  Wpax

  关键词的选择和使用

  关键词 是搜索过程中最基本的因素。搜索引擎不是在数据库中存储数百亿网页,而是通过 关键词 搜索和索引页面。

  早期的搜索引擎完全通过 关键词 搜索页面,而不关心这些 关键词 是如何使用的。随着近年来机器学习的发展,搜索引擎已经能够识别出 关键词 的有效使用,尽管其阅读和理解能力不如人类。

  因此,关键词 的使用应该尽可能自然和有效。如果指向关键词的页面是“*敏*感*词*”,那么你应该在页面中收录关于*敏*感*词*的内容,比如*敏*感*词*的历史,*敏*感*词*周围的建筑等等。如果你只是传播“*敏*感*词*”这个词,所有在页面上并且不收录与其相关的内容,它不会帮助您的搜索引擎排名。

  关键词 的使用指南

  下面是一些提高使用 关键词 效率的策略:

  标题标签

  页面的标题标签应收录对页面的精确而简短的描述,这对于用户体验和搜索引擎优化至关重要。在搜索引擎优化中,标题标签的优化是最简单最有效的。以下是一些优化建议:

  元标签

  Meta 标签的最初目的是作为一个关于 网站 内容的信息图。以下是一些基本的元标记以及如何使用它们:

  元机器人

  Meta Robots 标签可用于控制搜索引擎爬虫的行为:

  

...

  此标签支持的行为有:

  在 HTTP 头中使用 X-Robots-Tag 可以达到同样的效果,但更适合非 HTML 文件,例如图片

  元描述

  元描述标签中的内容是对页面内容的简短描述。搜索引擎不按此标签中的关键词进行排名,但搜索结果中的页面描述主要来自该标签中的内容

  

  元描述

  一个好的元描述可以让读者在很多搜索结果中选择你的网站,提高点击率。

  元描述可以是任意长度,但搜索引擎一般最多显示 160 个字符,因此最好将标签内容保持在此长度内。如果没有元描述,搜索引擎会从页面的其他元素抓取并生成搜索结果描述。

  网址结构

  URL在搜索中占有很大的权重,因为会显示在搜索结果中,所以会影响显示效果和用户的点击欲望。URL 也会影响搜索结果的排名,在 URL 中正确使用 关键词 可以为您带来排名优势。

  网址创建指南

  _、+、%20(空格)等其他分隔符不是很通用

  权威和重复的内容

  搜索引擎会对内容稀少和内容重复的页面进行搜索排名处罚。在现代内容管理系统中,一个页面经常会存在多个重复版本,例如普通版和打印版,并且这些不同的版本具有不同的 URL 地址。浏览器如何确定要显示哪个版本的页面?

  搜索结果的丰富片段

  通过使用丰富的片段,可以在搜索结果中显示更多的页面信息。虽然使用丰富的片段并不能提高搜索排名,但更丰富的搜索结果可以吸引用户的点击。可以使用微数据生成丰富的片段。

  保护您的网站

  一些流氓 网站 可能会窃取您的 网站 内容并影响您的 网站 在搜索引擎中的排名。

  解决方案

  Home

  利用:

  Home

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线