网站设计中面向搜索引擎的优化注意事项(一)

优采云 发布时间: 2021-06-21 02:20

  网站设计中面向搜索引擎的优化注意事项(一)

  关键词:Google PageRank“链接流行度”“网站推广”“搜索引擎优化”

  内容摘要:(注意:这个网站 设计本身使用了其中的一些方法)。

  网站 搜索引擎优化的设计注意事项:

  谁不希望您的 网站 在 Google 的搜索结果中排名靠前,但您的 网站 设计是否已准备好搜索引擎?

  什么是PageRank

  Google 等新搜索引擎的优势之一是它们不仅索引量大,而且将最好的结果排在搜索结果的顶部。具体原理请参考谷歌のSecret-PageRankThorough Explanation一文,PageRank简单的说就是类似于科学论文中的引用机制:谁的论文被引用次数多就是权威。互联网上的PageRank是基于对网页内链接关系的分析。

  另外还有这篇文章从计算方法的角度解释PageRank机制:

  有更详细的PageRank算法描述和各种清晰的小案例分析

  例如:子页面中导航栏的重要性

  B A => C

  对比

  B A C (OK)

  页数因素:

  B A C

  对比

  F G

  B A C (OK)

  DE

  一个意想不到的结论:

  (B A C) (E D F)

  对比

  (B A C) (E D F)

  PageRank 的提升仅是链接首页 A 和 D 两个,而网站subpages 的 PageRank 平均会略有下降。同时:一个网站进入Google的索引越大,受类似因素的影响越小。

  PageRank 非对称页面链接:

  Google 会使用 BadRank 等算法进行修正,如果网页中收录来自“与自身不相称”的高 PageRank 网站的链接,但缺乏足够数量和质量的反向链接,其 PageRank 将自动降低到0, A(pr=7) B(pr=0)

  简单来说:偶尔来自权威网站的反向链接不算数,需要被足够多的权威网站引用才能提高其网页的PageRank。

  链接就是一切

  在互联网的海洋中,最重要的是互联。没有被其他网站引用的网站是“信息岛”。 “酒好的话,只怕巷子很深。”也许这有点像垃圾邮件广告,但事实就是如此。所以,如果网站的目的不是单纯的欣赏,你需要积极宣传你的网站。通过搜索引擎推广自己需要注意以下几个方面:

  以量取胜:推广网站无需加入大网站类别,任何来自其他网站的反向链接都是有用的

  网站 比较经典的推广方式是加入一个比较大的门户网站的分类目录,比如Yahoo!等。其实有个误区:你不必加入一个大网站分类推广网站,因为现在搜索引擎不再只是网站目录的索引,而是一个更全面的网页索引,所以无论什么,来自其他网站任何地方的反向链接都非常即使在新闻报道、论坛、邮件列表档案中也很有价值。向很多大型网站的邮件列表发送邮件时,一定要注意在签名中加上网站地址。

  博主(Weblog 的缩写)可能最深刻地理解“链接就是一切”这句话的含义。由于博客内容之间存在大量的相互链接,所以最常被引用的博客页面是在搜索引擎中。排名往往高于一些大型商业网站页面。

  以质取胜:被网站高PageRank引用可以更快提升PageRank

  数量只是关键因素之一。来自具有高 PageRank 的页面的链接也可以更快地提高链接目标的 PageRank。以我个人网站为例:我没有加入任何类别,只是添加了一些文章在ZDNet中国提交的文章。由于页面上有文章源链接,经过一段时间后,相应网页的PageRank和网站整体得到了很大的提升。有时什么样的网站引用有时比引用次数更重要。在这里特别要感谢的是,当时ZDNet China是唯一一个遵守我的版权声明,注明出处文章,并有反向链接网站。

  根据这个原则:被列入雅虎等大型权威目录的前两级是非常有价值的。和 DMOZ。了解搜索引擎的“价值”:

  Lucene介绍 这个文章被Lucene项目引用,这个文章成为所有页面中PageRank最高的页面(谷歌工具栏上的5/10),以及谷歌深厚的学院氛围总让我怀疑他们对政府、教育等非功利性网站有什么特别之处:-),毕竟.代表了互联网精神的精髓:知识共享。

  但更合理的解释是:许多 .org 是开放技术平台的开发者。他们会在主页上添加Powered By Apache、Power by FreeBSD 等链接,以表示对其他开源平台的尊重,因此Apache、PHP、FreeBSD 等开源网站在GOOGLE 中的PageRank 非常高。许多这些 .edu 网站是学术文件。以超链接的形式标明引用来源已经成为一种习惯,这无疑是PageRank的最佳依据。

  注意:不要使用Link Farm来提高您的网站排名:Google会惩罚那些主动链接到Link Farm站点以提高其排名的网站,相应站点的页面将不会被纳入索引。但是如果你的页面被另一个链接农场链接,不要担心,因为这种被动链接不会受到惩罚。不要吝啬给其他网站的链接:如果一个网页只有大量的入站链接,而没有导出链接,也会被搜索引擎认为是一个毫无价值的网站。确保您的网站 可以帮助搜索引擎更准确地确定对用户最有价值的信息是什么。也就是说,如果你的网站只有外部反向链接而没有导出链接,它也会对你的网站在搜索结果中的表现产生负面影响。

  当然,网站甚至没有导出链接的情况非常罕见,除非你故意这样做。一般情况下,大家自然会在网页上添加一些其他的网站链接,引导访问者到我们认为重要的地方或者可以提供更有价值的信息的地方。

  在宣传自己网站之前,您可能首先需要了解您网站目前在某些搜索引擎中的受欢迎程度。原理很简单。可以参考文章如何评价网站的人气。

  网站 推广只是一种手段。如何突出内容,让需要相关信息的用户尽快找到你的网站是目标。高 PageRank 并不意味着门户网站像 Yahoo!结果排名靠前,因为搜索引擎结果是页面上搜索关键词和页面PageRank组合的排名结果。那么第二点:如何高亮关键词。

  如何突出关键词:面向主题的关键词匹配标题设计只是提高关键词密度(关键词密度)的一个方面:现代搜索引擎中关键词匹配的过程中,匹配的过程不只看当前页面的内容摘要:在很大程度上,不仅看这个页面说你有什么内容,还有其他人在链接时如何描述你的网站。

  例如,勾选:“世界卫生组织”。返回的结果中没有中文,这个页面也没有中文。之所以能匹配到,是因为它的中文网站的很多链接都使用:世界卫生组织,所以,这个页面上不存在的关键词也成为了页面摘要的一部分。

  所以把握整个网站的主题风格很重要。与链接页面的主题相关的链接标题越多,对链接页面的好处就越大。

  网站的主题设计请参考:

  标题不要留白:空缺等于浪费最有价值的职位;

  在传统页面中,HTML页面中会有类似如下的隐藏信息,用于描述当前页面的主要内容关键词:

  后来由于这种手动添加关键词的方式被滥用,为了增加在大量网页中被搜索引擎命中的概率,一些与实际网页内容无关的热门key经常被添加,比如“音乐mp3下载”等,所以新一代搜索引擎不再关心页面头文件中手动的meta关键字声明,页面标题在命中过程中往往占有更高的比例搜索引擎的关键词。如果一个关键词在标题中的点击量会比页面上的点击量高,并且在相应的搜索结果中排名更高。

  标题长度和内容:不要太长,一般在40个字符以内,并充分突出关键词的比例;

  对于较长的标题,搜索引擎一般会忽略它们,所以尽量把主要的关键词放在标题的前面。省略不必要的形容词,毕竟用户主要是用名词来寻找自己需要的东西。标题内容:尽量使用一些别人可以通过关键词找到的词(不要走得太远,如果标题中的词超过未收录内容的1分之一,可能会被排除在外)由搜索引擎索引),因此基于来自关键词其他搜索引擎的查询统计的网络日志是非常必要的。

  如果网页较多,尽量使用不同的网页标题,尽量让你的网站内容更多地进入搜索引擎索引范围;

  因为搜索引擎会根据页面内容的相似度将某些内容排除为重复页面;

  是我的 网站 上的一个小应用程序:用于 Web 界面的 Unix 命令手册(手册页)。在之前的设计中,所有动态页面都使用同一个标题:“phpMan: man page /perldoc /info page web interface”,Google索引了3000多个页面,后来我把页面标题改成了“phpMan: [命令名称]”格式,如:"phpMan:ls",所以大部分动态页面的标题都不一样。一个月后,谷歌从这个页面条目中索引了大约 6000 个页面。因此,如果网站中的许多网页使用相同的标题,例如:“新闻频道”、“论坛”,这些页面中的很大一部分将被重复数据删除机制忽略。

  此外,您还可以使用标题行来突出内容的主题,以增强标题的效果;

  在我的网站 设计中:我将使用类似 [title] 的模板来突出显示标题,而不是更改字体以突出显示标题。其他网站design Tips 尽量使用静态网页:目前像Google这样可以索引动态网页的搜索引擎相对较少,甚至Google也不会索引所有内容。一般来说,谷歌喜欢新的静态网页。内容。

  因此,无论对于搜索引擎收录的效率还是方便,使用内容发布系统将网站内容发布为静态网页是非常有必要的。

  例如:

  与 ¶meter=intro§ion=3 相比

  更容易访问搜索引擎的索引。有时 URL 中的命中可能比标题中的 关键词 更突出。

  而且能进入谷歌索引的页面越多越好。您可以使用类似于以下的脚本来统计您的网站 被谷歌和百度索引。

  #!/bin/sh

  YESTERDAY=`date -d 昨天 +%y%m%d`

  LOG_PATH='/home/apache/logs'

  grep -i Googlebot $LOG_PATH/access_log|awk'{print $7}' |sort -u>spider/$YESTERDAY.googlebot.txt

  grep -i baiduspider $LOG_PATH/access_log|awk'{print $7}' |sort -u>spider/$YESTERDAY.baiduspider.txt

  网站目录结构应该是扁平的,因为PAGERANK每一级目录就降低一级。假设首页是3,子目录是2,那么它可能不会被更深地收录在评分范围内。

  性能和内容分离:“绿色”网页

  网页中的 javascript 和 css 应尽可能与网页分开。一方面,它改进了代码重用(也促进了页面缓存)。另一方面,由于有效内容占网页长度的比例很高,因此也可以提高相关关键词在页面的比例也有所增加。总之,应该鼓励遵循w3c规范,使用更规范的XHTML和XML作为显示格式,以利于内容的更长时间保存。

  允许所有页面快速进入:站点地图,方便网络爬虫(蜘蛛)快速遍历网站所有需要发布的内容。如果首页是用Flash或图片进入的,就等于把搜索引擎拒之门外。除了用户友好的 UI 设计,蜘蛛友好也很重要。

  保持网站自身健康:经常使用断链检查工具来检查网站中是否存在死链接。

  保持网页内容/链接的稳定性和持久性:网页在搜索引擎索引中的历史也是一个比较重要的因素,历史越久的网页越容易被链接。为了保证您的网页可以被其他网站页面更长时间的引用,如果您的网页有链接更新,最好保留旧页面并做好链接重定向以保持内容的连续性。要知道,“训练”一个网站 并且内容在搜索引擎排名非常高并不容易。没有人想找到自己的内容最后被别人发现了,但是点击的是“404”页面不存在”,所以网站管理员有必要分析一下自己网站的error.log。

  文件类型因素:Google 能够索引 PDF、Word(Power Point、Excel)、PS 文档。由于这个文档的内容已经比普通的HTML更有条理,学术价值普遍更高,所以这些类型的文档在PageRank中天生就比一般的HTML文档高。所以对于比较重要的文档:技术白皮书、FAQ、安装文档等,建议使用PDF PS等高级格式访问,这样可以在搜索结果中获得比较高的位置。经常发现门户网站上的一条新闻往往排名高于其他网站的首页。因此,一个网站的整体PageRank提升后,其自身的一些不重要的内容往往会与那些PageRank较高的内容一起被搜索引擎纳入优先查询列表。这有点不合理,因为这往往导致很多大型网站的邮件列表存档往往高于其他网站首页的PageRank。知己知彼——站点访问统计/日志分析挖掘的重要性

  网站的设计不仅仅是被动迎合搜索引擎的索引,更重要的是充分利用搜索引擎带来的流量进行更深入的用户行为分析。目前,来自搜索引擎关键词的统计几乎是各种WEB日志分析工具的标准功能。我认为商业日志统计工具在这方面应该有更加强的实现。 WEB日志统计功能非常重要,日志分析工具webalizer在新的RedHat 8中被用作标准服务器配置应用之一。

  以Apache/webalizer为例,具体做法如下: 记录访问来源:

  将日志格式设置为Apache配置文件中的组合格式,这样的日志会收录扩展信息:其中一个字段是对应访问的重定向源:HTTP_REFERER,如果从搜索结果中找到用户一个搜索引擎点击你的网页,日志中记录的HTTP_REFERER就是用户搜索引擎结果页面的URL。此 URL 收录用户查询的 关键词。

  webalizer默认配置搜索引擎统计:如何在HTTP_REFERER中提取关键词

  Webalizer默认有yahoo、google等国际流行搜索引擎的查询格式:这里我增加了国内门户网站的搜索引擎参数设置

  搜索引擎 p=

  搜索引擎 q=

  搜索引擎 q=

  搜索引擎词=

  搜索引擎词=

  搜索引擎词=

  搜索引擎 q=

  通过这样设置webalizer的统计,HTTP_REFERER中来自搜索引擎的URL中的关键字会被提取出来,例如:all from the link,参数q的值会被算作关键词: ,从汇总统计结果中,可以看出用户根据关键词找到你的次数,找到你的人对关键词最感兴趣等等。另外,webalizer里面还有设置,统计结果可以导出为CSV格式的日志,方便以后导入数据库进行历史统计和更深入的数据挖掘。

  之前通过WEB日志进行的用户分析主要是基于日志中的访问时间/IP地址来源。显然,基于搜索引擎关键词统计的分析结果更加丰富、直观。因此,搜索引擎服务的潜在商业价值几乎不言而喻。或许这也是传统搜索引擎如Yahoo! Altavista 网站 在门户模式之后重新强调了搜索引擎市场。看看谷歌一年一度的关键词Statistics就知道了,互联网上谁比搜索引擎更了解用户对什么感兴趣?

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线