百度搜索引擎优化白皮书(衡量网页质量的维度百度搜索引擎在搜索引擎中获得更多流量)

优采云 发布时间: 2022-02-21 16:14

  百度搜索引擎优化白皮书(衡量网页质量的维度百度搜索引擎在搜索引擎中获得更多流量)

  网页质量是衡量网页满足用户需求能力的指标,是搜索引擎确定结果排名的重要依据。在网页资源的内容与用户需求相关的基础上,内容的完整性、页面美观、用户友好、来源权威、专业等因素共同决定网页的质量。

  对于搜索引擎来说,呈现给用户的网页质量直接影响最终的搜索效果和用户需求的满足程度;对于广大站长来说,整体网页质量的提升有助于在搜索引擎和展示中获得良好的排名,从而吸引更多的用户,获得更多的流量。

  百度搜索整合了用户在不同网页上的实际感受,制定了一套判断网页质量的标准。在此标准的基础上,对百度搜索的收录、排序、展示环境进行了调整,给优质网页更多的收录、展示机会,同时压制一些不好的、低级的影响用户体验和欺骗搜索引擎的优质网页。

  目前,互联网上只有7%的网页可以达到高质量标准。作为中国最大的搜索引擎,百度希望与站长们一起,从互联网生态的角度,构建一个良好的互联网生态系统,更好地为网民服务。,也让优质内容的网站得到更好的开发。

  另外,之前搜索引擎比较封闭。一直以来,站长都需要通过不断的探索,找出搜索引擎对网页的判断标准,指导网站内容的建设。推出《网页质量白皮书》的目的,是为了开放百度对网页质量的判断标准,为站长们提供参考,希望能产出更多更好的内容,满足搜索引擎用户的需求,并在网站管理员的时间相同。来到交通,实现双赢。

  衡量网页质量的维度

  百度搜索引擎在衡量网页质量时,会从以下三个维度给出质量分数。下面将介绍影响网页质量判断的这些维度的特点: • 内容质量 • 浏览体验 • 可访问性 访问流畅、内容质量高、浏览体验好的网页质量高;否则,任何一个维度出现问题,都会影响页面的整体质量。下面我们详细介绍这三个维度。

  衡量网页质量的维度 - 内容质量

  网页的主要内容是网页的价值,是满足用户需求的前提和基础。百度搜索引擎评价网页内容质量的主要依据是其主要内容的质量,以及主要内容能否满足用户。不同类型的网页有不同的主要内容。百度搜索引擎在判断不同网页的内容价值时,有不同的关注点,例如: • 首页:导航链接和推荐内容是否清晰有效。• 文章页面:能提供清晰完整的内容,最好有图文并茂。• 产品页面:是否提供完整真实的产品信息和有效的购买入口。• 问题和答案页面:是否提供信息丰富的答案。• 下载页面:是否提供下载入口,是否有权限限制,资源是否有效。• 文档页面:用户是否可以阅读,是否有权限限制。• 搜索结果页面:搜索结果是否与标题相关。

  百度搜索引擎从多个维度考虑网页内容的质量,最重要的是:成本;内容完整性;信息的真实性和安全性。我们举个例子看看百度搜索引擎是如何对网页的内容质量进行分类的。请站长对比自己网站的页面,从搜索引擎和用户的角度给自己打分:

  1、内容质量好:百度搜索引擎认为网页的内容质量不错,花费了大量的时间和精力编辑,倾注了编辑的经验和专业知识;内容清晰、完整、丰富;资源有效且优质;信息真实有效;安全无毒;不收录任何作弊行为和意图,对用户有很强的正向利益。对于这部分网页,百度搜索引擎将提高其展示在用户面前的机会。例如: • 专业医疗机构发布的内容丰富的医学专题页面;• 资深工程师发布的专业文章,彻底解决一个技术难题;• 专业视频播放清晰流畅的正版电影网站 或完整的电影和电视页面集合;• 知名B2C网站上完整有效的产品购买页面;• 权威新闻台原创 或编辑的热点新闻报道;• 网友精心编辑,内容丰富Entry;• Q&A网站中,回答内容可以完美解决提问者的问题。

  示例参考:

  例子

  内容质量

  阐明

  案例3.1.1-1

  好的

  专业医学网站 发布丰富的医学专题页面

  案例 3.1.1-2

  好的

  一位资深工程师发表的专业,彻底解决一个技术难题文章

  案例 3.1.1-3

  好的

  在专业视频网站上,清晰流畅地播放正版影视整页

  案例3.1.1-4

  好的

  完整有效的京东商品购买页面

  案例3.1.1-5

  好的

  权威新闻台热点新闻报道原创

  案例3.1.1-6

  好的

  经网友精心编辑,内容丰富的百科词条

  案例3.1.1-7

  好的

  百度知尚,完美解决用户问题的问答页面

  2、内容质量中等:内容质量中等的网页往往能满足用户需求,但在制作和编辑上花费的时间和精力并不多,不能体现编辑的经验和专长;内容完整但不丰富;资源有效但质量差;信息真实有效,但采集来源;安全无毒;没有作弊或意图。在互联网中,中等质量的网页实际上是一个比较大的数字集合,种类和外观也是多种多样的。百度搜索引擎在评估此类网页时,往往需要考虑许多其他因素。这里只举几个例子让大家感受一下: • 论坛分类中的普通帖子网站;• 一个普通的问答页面;• 无需任何编辑,直接转载其他网站的消息;

  示例参考:

  例子

  内容质量

  阐明

  案例3.1.2-1

  中间

  网易直接转载了中国新闻网的一条消息。

  案例3.1.2-2

  中间

  网友在文库上传的“国庆放假安排”消息

  案例3.1.2-3

  中间

  采集起点小说网盗版小说站

  案例 3.1.2-4

  中间

  百度的一个普通帖子贴吧

  3、内容质量差:百度搜索引擎认为主要内容的内容信息量少,或者没有有效信息,或者信息无效过期,这些都是内容质量差的页面,有对用户没有实质性帮助,应该减少显示的内容量。机会。同时,如果一个网站中此类网页的比例过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电子商务网站、黄页网站特别注意过期和无效网页的管理。例如: • 已下架的产品页面,或已过期的团购页面;• 已过期的招聘和交易页面;• 资源已过期,

  4、根本没有内容质量:没有内容质量的网页是那些生产成本低、质量低劣的网页;来自其他地方的内容 采集 被放置在网上,无需进行最少的编辑;*敏*感*词*木马等病毒;收录作弊行为或意图;完全无法满足用户需求,甚至收录带有欺骗性内容的网页。例如: • 内容空洞且短小,内容量少,但无法支撑页面的主要用途;• 问答页面有问题没有答案,或者答案根本解决不了问题;• 网站上的搜索结果页面未提供相关信息

  除了上面提到的网页之外,欺骗用户和搜索引擎的网页在无内容质量集合中占很大比例。百度搜索引擎将作弊网页定义为:以不满足用户需求为目的,以不正当手段欺骗用户和搜索引擎的网页。目前,这部分网页在互联网上还属于少数,但作弊网页的价值是负面的,对用户的危害很大。对这类网页,搜索引擎采取坚决打击的态度。

  衡量网页质量的维度 - 浏览体验

  不同质量的网页带来的浏览体验会有很大差异。一个高质量的网页应该给用户一个积极的浏览体验。用户希望看到干净且易于阅读的网页。版面混乱、广告过多会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户获取网页主要内容的成本与浏览体验成反比,即获取成本越高,浏览体验越低。对于内容质量相近的网页,浏览体验较好的网页更有可能获得较高的排名,而对于浏览体验较差的网页,百度搜索引擎会视情况降低其展示概率甚至拒绝收录 .

  影响用户浏览体验的因素有很多。目前百度搜索引擎主要从内容布局和广告影响两个方面考虑网页: 内容布局:用户进入网页首先看到的是内容布局,它决定了用户对网页的感知。用户的第一印象也决定了用户获取内容的成本。广告影响力:百度搜索引擎明白网站的生存和发展需要资金支持,支持在网页上投放合法广告。网页的主要目的应该是满足用户需求。最好的状态是“主内容和广告一起满足用户的需求,内容就是主内容,

  我们举个例子,看看百度搜索引擎是如何对网页的浏览体验进行分类的。站长可以对比测试自己网站的浏览体验:1、浏览体验好:页面布局合理,用户获取主要内容成本低,一般具有以下特点: • 合理排版,排版美观,易于阅读和浏览;• 用户需要的内容在网页中占据最重要的位置;• 可以通过页面标签或页面布局清楚地区分哪些广告;• 广告不抢占主要内容的位置,不妨碍用户访问主要内容;

  示例参考:

  例子

  浏览体验

  阐明

  案例3.2.1-1

  好的

  网站招聘、房产等的首页也有很多广告,不过都是招聘相关的,浏览体验还可以。

  案例3.2.1-2

  好的

  文章 页面,页面布局合理,没有广告,布局不错,结构合理

  案例3.2.1-3

  好的

  游戏首页,布局精美,布局合理,无广告,浏览体验极佳

  2、浏览体验差:广告的页面布局和投放影响用户对主要内容的获取,增加了用户获取信息的成本,让用户反感。包括但不限于以下几种情况: • 正文内容不换行、不分段,导致用户阅读困难;• 字体和背景颜色相似,难以区分内容;• 页面布局不合理,网页首页看不到有价值的主要内容;• 广告屏蔽了主要内容;或者一般分辨率下,第一屏都是广告,看不到主要内容;• 弹出广告太多;• 浮动广告过多,影响弹窗阅读;• 广告与内容混淆,

  衡量网页质量的维度 - 可访问性

  用户希望从搜索引擎中快速获得所需的信息。百度搜索引擎为用户提供的网页结果尽可能一次直接获取所有信息。百度搜索引擎认为,不能直接获取主要内容的网页对用户不友好,会根据情况调整其展示概率。

  百度搜索引擎会从正常打开、权限限制、有效性三个方面来判断网页的可访问性。对于可以正常访问的页面,可以参与正常排序;对于有权限限制的页面,将通过其他维度进行观察;对于无效网页,其展示机制将被降级甚至从数据库中删除。

  1、可以正常访问的网页没有权限限制,可以直接访问所有主要内容网页。

  2、有权限限制的网页此类页面分为开放权限和资源访问权限两种

  1)打开权限:表示需要登录才能打开网页。未经许可,您根本看不到具体内容。普通用户无法获取或获取成本非常高。百度搜索引擎会降低其展示概率。不包括以登录为主要功能的网页。

  2)资源访问权限:指获取网页的主要内容,如文档、软件、视频等,需要权限或者需要安装插件才能获取完整内容。此时会出现三种情况: • 网站 提供高质量的正版内容,由于内容建设成本高,但查看全文或需要插件许可或安装下载,这是在用户的预期之内。百度搜索引擎也不考虑对用户造成伤害的权限行为,给予与正常访问页面相同的处理。• 对于一些非优质、非正版资源,被用户甚至机器转载采集,本身成本低,内容不唯一,并且用户对资源有访问限制——用户需要注册登录或付费查看,百度搜索引擎会根据具体情况决定是否调整其呈现方式。• 还有一些视频和下载资源页面。也许自己的资源质量还不错,但是需要安装很冷门的插件才能正常访问。例如,如果他们要求安装“xx大片播放器”,百度搜索引擎就会怀疑他们有恶意倾向。但是他们需要安装非常冷门的插件才能正常访问。例如,如果他们要求安装“xx大片播放器”,百度搜索引擎就会怀疑他们有恶意倾向。但是他们需要安装非常冷门的插件才能正常访问。例如,如果他们要求安装“xx大片播放器”,百度搜索引擎就会怀疑他们有恶意倾向。

  示例参考:

  例子

  可访问性

  阐明

  案例3.2-1

  好的

  CNKI上的一篇论文只能收费下载,但有版权,浏览体验不错

  案例3.2-2

  好的

  优酷有新电影,需要付费观看,浏览体验不错。

  案例3.2-3

  中间

  内容已复制,但需要登录才能查看更多内容

  案例3.2-4

  区别

  入党申请表本身是转载的,网上到处都是,但是这个页面还是要收费才能下载的。

  3、无效网页通常是指有死链接和无效主要资源的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长对此类网页进行相应设置,及时登录百度站长平台,使用死链接提交工具通知百度搜索引擎。

  无效网页包括但不限于: • 404、403、503 等网页;• 报告程序代码错误的网页;• 打开后提示删除内容的网页,或因内容不存在而跳转到首页的网页;• 已删除内容的论坛帖子、已删除的视频页面(主要在 UGC 网站上) Internet 网络资源的当前状态

  根据CNNIC 2014年初发布的《中国互联网发展统计报告》,截至2013年12月,中国网页数量为1500亿,同比增长22.2% 2012 年期间。2013 年,中国单 网站 的平均页数和单页的平均字节数均保持增长,表明中国互联网上的内容更加丰富:平均网站的页数达到4.69万,比去年同期增长2.3%。

  为保证搜索质量,提高用户满意度,百度搜索引擎每周都会进行网页质量抽样评估。但从过去一年的评价数据中,我们发现优质网页的绝对数量非常少,几乎没有增加;普通页面的比例在下降,相应地,劣质页面的比例显着增加。截至2014年5月,统计显示,在百度网络搜索发现的海量网页中,只有7.4%是优质网页,21%是劣质网页,7个1. 6 是其余的普通网页 %。

  

  百度搜索通过一系列筛选、识别、分析、赋能等工作,力求将更多优质网页呈现给用户。每天,它与数以万计的劣质网站作斗争,涉及数百万个网页。可以减少用户对劣质网页的干扰。根据下图2014年5月网页呈现分析数据,在用户面前呈现的网页质量分布中,优质网页占比40%,劣质网页占比40%减少到 11%。虽然这种变化已经非常明显,但百度网搜还是希望与广大站长一起努力,将劣质的比例降低到更低的水平。

  互联网上的所有网页

  百度搜索显示的网页

  高级网站

  7.4%

  41%

  普通网页

  71.6%

  49%

  页面质量差

  21%

  11%

  上述低质量网页包括低质量网页和垃圾网页。低质量网页的分布如下图所示:

  从上图我们可以看出,目前低质量网页中最严重的问题是广告过多、占据网页主要位置、意外弹窗、内容等导致的浏览体验差。为空且短,网页需要权限才能获取资源并过期。信息也是低质量网页的重要组成部分。

  除低质量页面外,完全没有质量的垃圾页面问题分布如下图所示:

  

  从上图我们可以看出,目前低质量网页中最严重的问题是广告过多、占据网页主要位置、意外弹窗、内容等导致的浏览体验差。为空且短,网页需要权限才能获取资源并过期。信息也是低质量网页的重要组成部分。

  除低质量页面外,完全没有质量的垃圾页面问题分布如下图所示:

  

  死链接对用户、网站 和搜索引擎没有任何意义,它们占垃圾邮件的比例最大。二是对用户和搜索引擎造成极大伤害的作弊网页。大量浪费用户时间的网页,如无效资源、未回答的问题、不相关的搜索结果页面,并不是搜索引擎想要呈现给用户的。百度搜索引擎给站长的建议

  以上介绍了百度搜索引擎判断网页质量的标准。与这些标准相对应,站长在实际工作中应该遵循几个原则: • 设计网页时,主要考虑的是用户,而不是搜索引擎 • 始终关注用户体验 把它放在第一位 • 根据用户需求创建内容 •多思考如何让你的 网站 具有独特的价值 • 长远来看,过度的广告弊大于利 • 及时删除低质量的内容 • 不要试图以任何方式欺骗用户和搜索引擎

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线