seo经典之作-2011最新搜索引擎优化实战(1.了解搜索引擎网站域名和页面权重的重要问题是什么)

优采云 发布时间: 2021-12-25 21:10

  seo经典之作-2011最新搜索引擎优化实战(1.了解搜索引擎网站域名和页面权重的重要问题是什么)

  1.了解搜索引擎

  网站域名和页面权重非常重要。除了具有较高的整体维度和可靠的内容,容易获得好的排名,获得基本权重也是页面参与相关度计算的最基本条件。一些权重过低的页面即使相关度高也可能无法排名,因为没有机会参与排名。

  对于大型网站,最关键的问题是解决收录问题。只有完全收录,才能推广大量长尾关键词

  2.搜索引擎和目录

  真正的搜索引擎是指蜘蛛程序沿着链接爬行,抓取互联网上的大量页面,存储在数据库中,经过预处理,用户在搜索中输入关键词后,搜索引擎排序程序从数据库中选择一个符合搜索要求的页面关键词。蜘蛛的抓取、页面的收录

和排序都是自动处理的。

  典型的网站目录包括雅虎目录、Open Directory、Hao123等,目录的数据来源是通过人工编辑获得的。

  搜索引擎和目录各有优缺点。首先,搜索引擎收录的页面数远高于目录收录的页面数,但是搜索引擎收录的页面质量参差不齐,提取网站内容和关键词是准确的性通常没有目录那么高;而且,目录只能收录网站首页,规模非常有限,但收录的网站质量比较高。最后,搜索引擎数据更新快,很多收录在目录中的网站内容都非常陈旧,甚至不复存在。

  当前网站目录对于SEO最大的意义在于建立外部链接,如雅虎、Open Directory、Hao123等,均具有较高的权重,可以为收录的网站带来高质量的外部链接。

  3.搜索引擎面临的挑战

  页面抓取需要快速而全面。搜索引擎蜘蛛更新数据库中的页面需要很长时间。因此,有些网站不利于搜索引擎蜘蛛抓取抓取,如网站链接结果存在缺陷、大量使用Flash、JavaScript脚本等。, 或者把内容放在用户必须登录才能访问的部分,增加了搜索爬取内容的难度。经典搜索结果列表主要分为三部分。(例如:Google)第一行是页面标题,通常取自页面HTML代码中的Title Tag。可见页面的标题标签的措辞对排名和点击率都具有重要意义。

  第二行和第三行是页面描述。页面描述有时取自页面HTML中的Description Tag,有时则从页面可见文本中动态抓取相关内容。显示什么页面描述文本是由用户查询时确定的。

  第四行显示三个消息。最左边是 URL。用户可以看到网页来自哪个网站,以及目录和文件名信息。中间是百度数据库页面最后更新的日期。然后是百度快照链接。用户可以点击快照查看存储在百度数据库中的页面内容。

  用户搜索到的关键词在标题和描述中以红色高亮显示。

  4.搜索引擎工作原理介绍

  搜索引擎的工作过程大致分为三个阶段。

  爬行和爬行:搜索引擎蜘蛛通过链接访问网页,获取页面的HTML代码并存储在数据库中。蜘蛛

  当蜘蛛访问任何网站时,它首先会访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不会抓取被禁止的网址。

  百度蜘蛛+(+) 百度蜘蛛

  追踪链接

  最简单的爬行遍历策略分为两种,一种是深度优先,一种是广度优先,通常是混合的。

  吸引蜘蛛

  蜘蛛尽量抓取重要页面:1、 网站和页面权重。质量高、资质旧的网站被认为权重较高,抓取深度也较高,会收录

更多的内页;2、 页面更新率,更新频繁,蜘蛛频繁访问,更快的跟踪和抓取新页面;3、 导入链接,无论是外链还是同一个网站的内链,都必须有导入链接才能进入页面;4、 点击离主页的距离。一般来说,首页的权重最高。大多数外部链接指向主页。离首页的点击距离越近,页面权重越高,被蜘蛛爬取的机会就越大。

  爬行时复制内容检测

  检测和删除复制内容通常在预处理中进行,在爬取和抓取文件时也会进行一定程度的复制内容检测。当在权重较低的网站上遇到大量转载或抄袭的内容时,很可能无法继续爬取。

  预处理:索引程序对抓取的页面数据进行文本提取、中文分词、索引等处理,为排名程序调用做准备。排名:用户输入关键词后,排名程序对数据库数据进行索引,计算相关性,然后生成一定格式的搜索结果页面。5.链接原理

  黑帽SEO是指一切使用作弊或可疑手段,如垃圾链接、隐藏网页、桥页、关键词填充等。

  链接因素现在已经超过了页面内容的重要性。

  谷歌公关

  PR是PageRank的缩写,Google PR理论是所有基于链接的搜索引擎理论中最著名的。PR是谷歌创始人之一拉里佩奇发明的,用户表达了页面重要性的概念。简单的说,反向链接越多的页面就是越重要的页面,所以PR值就越高。

  传递的 PR 值还取决于页面上各处的链接数。所以一个页面的 PR 值取决于导入链接的总数、发布链接的页面的 PR 值以及发布链接的页面上各处的链接数。

  PR值的计算公式为PR(A)=(1-d)+d(PR(t1)/C(t1)+...+PR(tn)/C(tn) ))

  A代表页面APR(A)代表页面A的PR值,d为阻尼指数。一般认为d=0.85t1... tn代表页面A的链接,页面t1到tnC代表页面导出链接的数量。C(t1)是t1页面导出的链接数。从概念和计算公式可以看出,PR值的计算必须通过迭代计算。PR值只与链接。经常被站长问到,他这个网站已经存在很久了,内容都是原创的。为什么PR还是零?其实PR和站长是否认真没有直接关系,如何网站长,或者内容是否原创,有反向链接就有PR,没有反向链接就没有PR。

  除了PR对排名的影响之外,还有几个重要的点:

  站点收录

是页面的深度和总数。PR值高的网站能够收录更多的页面,蜘蛛爬取内页的深度也会更高。更新频率。PR值越高,搜索引擎蜘蛛访问的频率越高。重复内容判断。PR值越高,大网站权重越高,小网站内容的转载视为原创。选择排名的初始子集。初始子集的选择与关键词的相关性无关,仅从页面的​​重要性来看。PR值是一个与关键词无关的重要指标。PR 算法应该排除一些 Google 认为可疑或无效的链接,例如付费链接、博客和论坛中的垃圾邮件链接。

  山顶算法

  Hilltop算法可以简单理解为话题相关的PR值。传统的 PR 值不与特定的 关键词 或主题相关联,只计算链接关系。可能存在某种漏洞。所以,到主题相关、业务相关的论坛或分类信息网站上发布锚文本。

  Hilltop 算法建议 SEO 在建立外部链接时应该更加关注与主题相关的网站。最简单的方法是搜索某个关键词。目前排在最前面的页面是最好的链接来源,甚至可能是竞争对手网站的链接是最好的。当然,获取这样的链接是最困难的。

  6.用户如何浏览和点击搜索结果

  著名的用户视线分布金三角

  搜索用户点击搜索结果页面后,他的眼睛会先放在左上角,然后直接往下移动,可以一一浏览搜索结果。当他们看到感兴趣的页面时,向右水平阅读页面标题。排名靠前的结果最受关注,下降的越少,它们就形成了所谓的“金三角”。

  7.高级搜索命令

  双引号,将搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面收录

所有出现在双引号中的词,甚至顺序必须是完全匹配。百度和谷歌都支持这个命令,搜索结果更准确。减号,减号(-),即目标文本-(要排出的词),可以排除不相关的搜索结果。关键词,搜索结果可以呈现为“关键词、关键词词、关键词”等。 inurl、inurl:指令用于搜索URL中出现查询词的页面。百度和谷歌都支持inurl,inurl命令支持中英文。site:是大家最熟悉的SEO高级搜索命令,用于搜索某个域名下的所有文件。link:也是SEO常用的指令,用于搜索一个url的反向链接,包括内链和外链。谷歌搜索反向链接几乎没用,百度不支持链接:说明。

  《SEO实用密码》搜索引擎工作原理,为深入理解SEO相关文章打下良好基础2

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线