搜索引擎禁止的方式优化网站(网页设计需要以搜索蜘蛛容易索引方式制作的网站架构)
优采云 发布时间: 2022-02-17 10:37搜索引擎禁止的方式优化网站(网页设计需要以搜索蜘蛛容易索引方式制作的网站架构)
由于目前的搜索引擎无法完全解读网页的内容,因此网页设计需要以搜索蜘蛛可以轻松索引的方式进行。对于搜索引擎来说,他们看到的页面和我们不一样。在本章中,我们将重点介绍 网站 的技术方面,这样的 网站 架构在搜索引擎和用户眼中将是相似的。本章可以分享给程序员、前端工程师、网页设计师,让参与网站制作的每个人都拥有相同的知识。
制作可索引的内容
为了在搜索引擎列表中获得更好的性能,请将 HTML 用于重要内容。Flash、Java 和其他非文本内容经常被蜘蛛忽略或认为不重要,即使搜索引擎蜘蛛改进了它们的爬行技术。将内容呈现给访问者的最简单方法是使用 HTML 文本供搜索引擎抓取。但是,更好的方法是在保持视觉设计 网站 的同时呈现给搜索引擎。
这里有几种方法:
1.图像的 Alt 属性。在 HTM 中分配 gif、jpeg 或 png 格式的“alt 属性”图像,以使搜索引擎更容易解释,并向这些图像添加一些文本。
2.做 网站 导航搜索框和内部链接。
3.为 Flash 和 Jave 插件添加了文本叙述版本。
4.提供视频和音频的文本副本,以便这些字幕可以被搜索引擎索引。
“我的页面不能是 收录。我为 Juggling Pandas 制作了一个 Flash,但我在 Google 上找不到它。发生了什么?”
将您的 网站 视为搜索引擎
很多网站在“内容索引”方面存在很大问题,所以在网页设计完成后需要仔细检查。使用 Google 的缓存、 和 MozBar 等查看工具,您可以检查您的哪些 Web 内容可以被搜索引擎读取和索引。看看您当前打开的页面在 Google 上的显示效果如何?看看同一个页面对搜索引擎和你来说是如何不同的。
以下 Moz 以 Juggling Pandas 为例:
哇!这就是我们的样子吗?
使用谷歌catch的功能,我们可以发现谷歌看到的首页并没有我们来的那么丰富,这是因为网站的一些结构不能被搜索引擎解释。
以下 Moz 以斧战猴博客为例:
嘿!好玩的小游戏去哪了?
呃……通过谷歌catch,我们可以发现右上角显示的网站真是一片空白,吓人。没有文字描述,也没有小游戏。在设计网页的时候,这个网站都是用Flash构建的,可惜这也意味着搜索引擎不能索引任何文字,更别说Flash游戏了。如果没有 HTML,这个 网站 在搜索引擎上的排名会非常难看。
最明智的做法是使用 SEO 工具,除了检查文本外,还要仔细检查搜索引擎中显示的 网站 内容。不仅是图片,还有下面将要介绍的“链接”。
有可以爬取的链接结构
就像搜索引擎需要爬取关键词对网站内容进行分类一样,网页也需要有正确的链接,这样搜索引擎才能第一时间抓取,所以要有一个正确的链接,可以被搜索引擎蜘蛛抓取建设非常重要。但也有很多网站犯了在蜘蛛无法进入的地方建立链接的致命错误,这也使得网页无法索引并隐藏在网络世界中。
下面,我们用图片来说明这个问题的原因:
在上图中,Google 蜘蛛已经爬到了 A 页面,并且看到了 B 和 E 页面的链接。但是由于链接构造不正确,即使页面 C 和 D 很可能是这个 网站@ 中最重要的页面>,蜘蛛仍然无法爬到页面C或D(或者换句话说,蜘蛛可能不知道页面C和D的存在)。如果谷歌蜘蛛找不到,也意味着页面C和D不存在。内容再好,关键词选择再精准,网页设计再美,营销手段再巧妙,只要蜘蛛爬不上来,一切都是徒劳.
让我们剖析链接架构!
的
网页上的所有可点击页面都允许访问者以图像、文本或其他对象的形式从一个页面移动到另一个页面,这些形式称为链接。链接是互联网中最基本的元素,网页设计中最常听到的词是“超链接”。在上图中,“<a”代表链接的开始,它告诉浏览器(和搜索引擎)链接的去向。在这个例子中,这个链接是去的。在此之后,访问者可以看到的文本在 SEO 搜索引擎优化的世界中称为锚文本,用于介绍链接的目的地。以这个网站为例,网站的目的地是Jon Wye的定制腰带,所以锚文本显示“Jon Wye的定制设计腰带”,最后一个“</a>”
以上是链接的最基本形式,也是搜索引擎完全理解它的方式。搜索蜘蛛会知道必须把链接放入数据库,并用它来计算页面的Query-Independent variable(类似于Google的PageRank),并根据结果对索引进行分类。
Query-Independent搜索蜘蛛会先根据网站中的关键字和网页链接估计网站的重要性和价值,然后再对新的网页进行索引分类,这符合用户的搜索习惯是不同的。
一起来看看网页无法阅读的常见原因吧!
如果您的 网站 最初旨在要求访问者填写在线表格以登录,那么搜索引擎可能无法看到受保护的内容。该表格可以采用受密码保护的登录页面或问卷的形式。在任何一种表单中,搜索蜘蛛一般都不会尝试提交表单,因此任何只能通过表单登录访问的页面都不会被蜘蛛抓取。
如果您使用 JaveScrip 样式的链接,您会发现搜索引擎要么不抓取,要么赋予嵌入链接很小的权重。如果您希望蜘蛛抓取,请改用标准 HTML 链接(或匹配 HTML)。
Meta Robots 标签或 robots.txt 都是 网站 管理员设置的程序,用于防止搜索蜘蛛进入特定网页。但是要注意,虽然很多网站管理员使用这两个命令来试图阻止垃圾邮件蜘蛛进入,但是如果使用不当,整个网站可能无法让蜘蛛进入。
在网页设计技术方面,Frames和iframes形式的链接可以被搜索引擎抓取,但两者在组织和搜索引擎跟踪方面都存在结构性问题。除非您是知道搜索引擎如何索引和跟踪 Frames 链接到的 网站 内容的专业人士,否则不要使用它。
虽然这与上述警告的在线形式有关,但它很常见,必须单独提出。一些 网站 管理员认为在 网站 中放置一个搜索框,搜索蜘蛛就会找到访问者搜索的内容。但不幸的是,蜘蛛不会使用搜索框来查找访问者搜索的关键字。只要网站链接做的不好,这样的页面就会被永远隐藏,不会被爬取。
在上面的例子中,Juggling Panda网站 里面的链接就是最好的例子。尽管每个熊猫都是指向另一个页面的链接,但这些页面对搜索引擎来说是不可见的,因为蜘蛛无法使用这种类型的链接格式指向其他页面。
搜索引擎只抓取网页上固定数量的链接。这个限制是为了防止垃圾链接,保护排名的正确性。如果页面上的链接过多,则存在并非所有链接都会被抓取和索引的风险。
只要您避免落入这些陷阱,您就拥有 网站 一个干净的、可索引的 HTML 链接,蜘蛛可以轻松进入。
相对=“nofollow”
Rel=”nofollow” 可以使用以下语法:
<a href=”” rel=”nofollow”> 烂朋克!</a>
链接可以有许多搜索引擎几乎忽略的属性,除了 rel=”nofollow” 属性。在上面的例子中,在链接中加入 rel=”nofollow” 的意思是告诉搜索引擎这个网站有不可信的内容,让搜索引擎不要继续往下搜索,避免权重被扣除的页面。
从字面上看,Nofollow 指示搜索引擎不要跟踪该链接(尽管有些仍然这样做)。Nofollow 属性最初旨在帮助阻止垃圾邮件自动回复和博客和留言板上的链接,但它已经演变为告诉搜索引擎减少链接的原创值。每个搜索引擎对 Nofollow 链接的判断略有不同,但很明显,Nofollow 链接不会比普通链接具有更大的权重。
nofollow 链接不好吗?
虽然 Nofollow 链接与 Follow 链接相比价值不大,但它仍然是配置各种链接的常用方法。一个有很多入站链接的 网站 通常也有很多 nofollow 链接,这不是一件坏事。事实上,Moz 对排名因素的分析表明,Nofollow 入站链接较多的 网站s 往往排名高于排名较低的 网站s。
谷歌
谷歌表示,在大多数情况下,他们不会关注 Nofollow 链接,也不会向这些链接传递 PageRank 或锚文本值。事实上,使用 Nofollow 链接会提示 Google 将目标链接放置在整个页面范围之外。Nofollow 链接没有权重,仅被视为 HTML 文本(即链接不存在)。尽管如此,许多 网站 管理员认为,即使是来自权威的 网站(例如 Wikipedia)的 Nofollow 链接,仍然可以提高他们的 网站 信任度。
Google 对 nofollow 的定义
必应和雅虎!
提供雅虎搜索引擎技术的 Bing 也表示,他们的搜索引擎蜘蛛会抓取 网站 中的 Nofollow 链接,但不会收录其值,对排名 网站 相对没有影响。
Bing 对 nofollow 的定义
关键字使用和定位
关键字对搜索过程非常重要,它是构建搜索过程的基石和语言。事实上,关键词是整个信息检索科学的基础,包括谷歌等网络搜索引擎。当搜索引擎抓取网页时,搜索引擎会根据网页中的文本内容(关键字)对其进行分类,而不是将所有内容放在同一个收录 25 亿个网页的数据库中。因此,搜索引擎拥有数以亿计的小数据库,每个小数据库都是一个特定的关键字或词,这使得搜索引擎能够以最快的速度进行搜索。
显然,如果您希望您的网页在关键字“dog”的搜索结果中排名,最好确保您网页上的关键字“dog”是一个易于被搜索引擎抓取的关键字。
控制关键字(支配、支配、控制、支配)
关键字控制着我们如何传达我们的搜索需求以及我们如何与搜索引擎交互。当我们输入查询的文字(单词)时,搜索引擎会根据我们输入的文字,以及文字的顺序(“pandas juggling” vs. “juggling pandas”)、拼音、标点符号匹配相关网页, 和 size Writing 还为搜索引擎提供了额外的信息,以查看和排名最相关的结果。
搜索引擎测量关键字在网页上的呈现方式,以帮助确定网页的内容是否与用户的查询匹配。优化页面排名的最佳方法之一是确保关键字在页面标题中,文本中的关键字以文本形式呈现,并且关键字收录在元数据中。
一般来说,你的关键词越具体,就越能减少你的搜索引擎排名竞争,提高你排名更高的机会。上图是广义词“书”和精确词“两城记”的对比图。你会发现,查询的文本越广泛,得到的结果就越多;文本越精确,你得到的结果就越精确,但同时,网站与你的竞争就越少。
滥用关键字
自网络搜索开始以来,为了操纵搜索引擎排名,一些人不断以错误的方式滥用关键词,这包括在文本、URL、元标签和链接中“堆叠”关键词。不幸的是,这些方法都不会让你的 网站 变得更好,只会变得更糟。
早期,搜索引擎在判断网站与关键词的相关性时,是看关键词在网页中出现的频率,而不是关键词使用的合理性。直到今天,虽然搜索引擎仍然无法像人类一样理解文本内容,但智能学习已经逐渐完善了它们。
最好的方法是以有组织(计划)的方式自然地使用关键字。如果你的网页关键词是“埃菲尔铁塔”,那么内容当然是关于埃菲尔铁塔的,*敏*感*词*狗,那么你再怎么努力依靠“埃菲尔铁塔”来提高页面排名都是非常有限的。我们的目标不是对 文章 中的所有关键词进行排名,而是关注特定用户会使用的关键词。
关键字密度损失
根据 Edel Garcia 博士在 The Keyword Density of Non-Sense 中的说法,关键字密度不是现代排名算法的一部分。
如果有两个网页,D1和D2,D1收录1000个字符(l=1000),其中关键词是20次(tf=20),关键词密度软件分析关键词密度文件的) (KD) 为 20/1000 = 0.020 (或 2%)。同理,D2 收录 500 个单词 (l=500),其中关键字为 10 次 (tf=1 0)@) >,同样的密度结果。所以显然关键字密度分析无法解释哪个页面更相关,也无法告诉我们这个:
关键字之间的相对距离。(proximity) 词的分布位置 (distribution) 词之间的共引(这是一个专有名词:表示同时被引用) 频率(同时提及) 关键词和主题、主题和副主题(主题内容)
总之,关键词密度与内容、质量、语义或相关性无关。
网页优化
如何使用和定位关键字仍然是搜索引擎排名计算的一部分。我们可以使用一些有效的关键字使用技术来帮助优化网页。在 Moz,我们进行了大量测试,并获得了很多关于搜索结果和关键字使用策略的工具。在 网站 优化中,我们建议您使用如下关键字:
网页内部链接请不要在同一网站中使用关键字,这称为关键字竞价。
注意:“关键词竞赛”网站的多个网页具有相同的关键词,这将导致搜索引擎难以确定哪个网页是最相关的搜索查询焦点。因此,SERP(搜索引擎结果页面)可能不一定是用户希望看到的页面和内容的热门搜索结果。
什么是网页的关键词优化?以下是“运动鞋”的示例:
在标题标签中至少使用一次关键字。尽量将关键字放在标题标签的前面。标题标签将在本章后面讨论。
关键字被放置在最可见页面的顶部。
在页面正文中放置关键字至少两到三次,包括文本变体。如果文章的内容很长,可以多放一些。频繁使用您可能认为会带来好处的关键字,但根据我们的经验,页面排名几乎没有什么好处。
在页面图像的 alt 属性中至少使用一次关键字。这不仅有助于网络搜索,还有助于图像搜索,偶尔也有助于流量。
在 URL 中使用关键字一次。本章稍后将讨论使用 URL 和关键字的规则。
在元描述标签中至少使用一次关键字。请注意,元描述标签对搜索引擎排名没有帮助,但它可以吸引点击率,因为搜索引擎会抓取其内容并将其暴露在搜索结果页面上。
有关网页优化的更多信息,请参阅此文章。
声明:本站所有文章,除非另有说明或标记,均发布在本站原创。任何个人或组织未经本站同意,不得复制、盗用、采集、将本站内容发布到任何网站、书籍等媒体平台。本站内容如有侵犯原作者合法权益的,您可以联系我们处理。