百度搜索引擎优化白皮书(衡量网页质量的维度百度搜索引擎在搜索引擎中获得更多流量)

优采云 发布时间: 2021-09-11 02:01

  百度搜索引擎优化白皮书(衡量网页质量的维度百度搜索引擎在搜索引擎中获得更多流量)

  网页质量是衡量一个网页满足用户需求的能力,是搜索引擎决定结果排名的重要依据。基于网页资源的内容与用户需求的相关性,内容完整、页面美观、用户友好、来源权威专业等因素都决定了网页的质量。

  对于搜索引擎而言,呈现给用户的网页质量直接影响最终的搜索结果和用户需求的满足;对于广大站长来说,网页整体质量的提升有助于获得搜索引擎良好的排序和呈现,从而吸引更多的用户,获得更多的流量。

  百度搜索结合用户对不同网页的真实感受,制定了一套网页质量评判标准。基于此标准,调整百度搜索的收录、排名、展示环境,提供更多优质网页。 收录,展示机会,压制一些影响用户体验、欺骗搜索引擎的不良低质量网页。

  目前,互联网上只有 7% 的网页可以达到高质量标准。百度作为中国最大的搜索引擎,希望能从互联网生态的角度,与站长一起,共建一个良好的互联网生态。为网民服务的同时,也让网站的优质内容得到更好的发展。

  另外,搜索引擎之前相对封闭。长期以来,站长需要通过不断的探索,找出搜索引擎对网页的判断标准,指导网站内容的建设。此次发布《网页质量白皮书》,旨在公开百度对网页质量的判断标准,为站长提供参考。希望能产出更多更好的内容,满足搜索引擎用户的需求,为站长提供指导。来流量,实现双赢。

  衡量网页质量的维度

  百度搜索引擎在衡量网页质量时,会从以下三个维度给出质量评分。下面将一一介绍影响网页质量判断的这些维度的特点: • 内容质量 • 浏览体验 • 可访问性 访问流畅、内容质量高、浏览体验好的网页质量更高;相反,任何一个维度都有问题。 ,会影响页面的整体质量。下面我们将详细介绍这三个维度。

  衡量网页质量的维度-内容质量

  网页的主要内容是网页的价值,是满足用户需求的前提。百度搜索引擎主要根据主要内容的质量以及主要内容是否能够满足用户来评估网页内容的质量。不同类型的网页的主要内容是不同的。百度搜索引擎在判断不同网页的内容价值时,需要注意的点也存在差异,例如: •首页:导航链接和推荐内容是否清晰有效。 • 文章页:能否提供清晰完整的内容,最好有图片和文字。 • 产品页面:是否提供完整真实的产品信息和有效的购买入口。 • 问答页面:它提供有价值的答案吗? • 下载页面:是否提供下载入口,是否有权限限制,资源是否有效。 • 文档页面:是否可以被用户阅读,是否有权限限制。 • 搜索结果页:搜索结果是否与标题相关。

  百度搜索引擎从多个维度考虑网页内容的质量,最重要的是:成本;完整的内容;信息真实有效且安全。我们通过一个例子来感受一下百度搜索引擎是如何对网页的内容质量进行分类的。请从搜索引擎和用户的角度对比自己网站的页面,给自己打分:

  1、内容质量好:百度搜索引擎认为,内容质量好的网页在编辑上花费了大量的时间和精力,投入了编辑的经验和专业知识;内容清晰、完整、丰富;资源有效且优质;信息真实有效;安全无毒;不收录任何作弊或意图,对用户具有很强的积极利益。对于这部分网页,百度搜索引擎将增加其展示在用户面前的机会。例如: • 专业医疗机构发布的丰富医学专题页面; • 专业的文章,可以彻底解决高级工程师发布的技术问题; ;• 知名B2C网站,完整有效的产品购买页面;• 权威新闻站原创 或编辑整理的热点新闻报道;• 经网友精心编辑、内容丰富的条目; •问答网站里面,回答的内容可以完美解决提问者的问题。

  示例参考:

  示例

  内容质量

  说明

  案例3.1.1-1

  好

  专业的medical网站发布丰富的医学专题页面

  案例3.1.1-2

  好

  高级工程师发布的专业彻底解决某个技术问题文章

  案例3.1.1-3

  好

  在专业视频网站上,播放清晰流畅的正版影视全版

  案例3.1.1-4

  好

  一个完整有效的京东商品购买页面

  案例3.1.1-5

  好

  权威新闻台原创热点新闻报道

  案例3.1.1-6

  好

  经网友精心编辑,内容丰富的百科词条

  case3.1.1-7

  好

  百度智商,一个完美解决用户问题的问答页面

  2、内容质量:内容质量中等的网页往往能满足用户需求,但在制作和编辑上花费的时间和精力并不多,无法体现编辑者的经验和专业知识;内容完整但不丰富;资源有效但质量不好;信息真实有效但属于采集得来;安全无毒;它不收录作弊行为和意图。在互联网中,中等质量的网页实际上是一个比较大的类型和面孔的集合。百度搜索引擎在评估此类网页时通常会考虑许多其他因素。在这里,我们只举一些例子,让你感受一下: • 论坛网站 的一个普通帖子; • 一个普通的问答网页; • 未经任何编辑,直接转载其他网站新闻; • 普通电影播放页面无版权信息 • 采集全球小说网站盗版小说页面。

  示例参考:

  示例

  内容质量

  说明

  案例3.1.2-1

  中

  网易直接转载了中新网的一条新闻。

  案例3.1.2-2

  中

  网友上传的“国庆放假安排”新闻

  案例3.1.2-3

  中

  采集起源小说网盗版小说网站

  案例3.1.2-4

  中

  *敏*感*词*一个普通帖子

  3、内容质量差:百度搜索引擎认为主要内容的内容信息较少,或者没有有效信息,或者信息无效过期。它是一个内容质量较差的网页,对用户没有任何实质性的帮助,应该减少其显示。机会。同时,如果网站此类网页的比例过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电子商务网站、黄页网站 ,特别注意过期,无效网页的管理。例如: • 已下架的产品页面,或已过期的团购页面; • 已过期的招聘和交易页面; • 资源已过期,如视频被删除,软件下载后无法使用。

  4、无内容质量可言:无内容质量可言的网页是指制作成本低、制作以次充好的网页;来自采集 其他地方的内容无需编辑和整理即可在线放置;*敏*感*词*木马病毒等;收录作弊或意图;完全不能满足用户的需求,甚至含有欺骗性的内容。例如: • 内容短,内容少,但不能支持页面的主要意图; • 问答页面有问题且无答案,或答案根本无法解决问题; • 网站上的搜索结果页面,但未提供相关信息

  除了上述网页之外,欺骗用户和搜索引擎的网页在没有任何内容质量的情况下占据了很高的比例。百度搜索引擎对作弊网页的定义是:不满足用户需求的网页,通过不正当手段欺骗用户和搜索引擎牟利。目前,这部分网页在互联网上的数量还很少,但作弊网页的价值是负的,对用户的危害很大。搜索引擎对此类网页采取坚决打击的态度。

  衡量网页质量的维度——浏览体验

  不同质量的网页浏览体验会有很大差距。高质量网页的浏览体验应该是积极的。用户希望看到干净且易于阅读的网页。混乱的版式和过多的广告会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户对网页主要内容的获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相近的网页,浏览体验好的网页更有可能获得更高的排名。对于浏览体验较差的网页,百度搜索引擎会根据情况降低其呈现的概率,甚至拒绝收录。

  影响用户浏览体验质量的因素有很多。目前,百度搜索引擎主要从内容布局和广告影响力两个方面考虑网页: 内容布局:用户进入网页首先看到的是内容布局,它决定了布局。用户对网页的第一印象也决定了用户获取内容的成本。广告影响力:百度搜索引擎明白网站生存发展需要资金支持,支持在网页上投放合法广告。网页应以满足用户需求为主要目的,最好的状态是“内容为主,广告满足用户需求,内容为主,广告为辅”,广告不应成为页面的主体。

  我们通过一个例子来感受一下百度的搜索引擎是如何对网页的浏览体验进行分类的。基于此,站长可以对比测试自己网站的浏览体验:1、browsing 体验好:页面布局合理,用户获取主要内容的成本低,一般具有以下特点: •布局合理,布局美观,便于阅读和浏览; • 用户需要的内容在网页上占据最重要的位置; • 页面标签或页面布局可以清楚地区分哪些广告;• 广告不占据主要内容的位置,不妨碍用户获取主要内容;

  示例参考:

  示例

  浏览体验

  说明

  案例3.2.1-1

  好

  招聘、房产等。网站homepage也有很多广告,但都是和招聘相关的,浏览体验还可以。

  案例3.2.1-2

  好

  文章page,页面布局合理,无广告,布局好,结构合理

  案例3.2.1-3

  好

  游戏首页,布局精美,布局合理,无广告,浏览体验极佳

  2、浏览体验差:页面布局和广告投放影响用户对主要内容的访问,增加用户获取信息的成本,让用户反感。包括但不限于以下情况: • 正文内容没有换行或分段,导致用户阅读困难; • 字体和背景颜色相似,难以区分内容; • 页面布局不合理,页面首屏看不到有价值的主要内容;• 广告遮挡了主要内容;或者一般分辨率下,首屏全是广告,看不到主要内容; • 弹出式广告太多; • 太多影响阅读的浮动广告 • 单击链接时出现意外弹出窗口; • 广告和内容混淆,不易区分;

  衡量网页质量的维度——可访问性

  用户希望从搜索引擎快速获取他们需要的信息。百度搜索引擎试图为用户提供一次可以直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取主要内容的网页对用户不友好,会根据情况调整显示概率。

  百度搜索引擎会从正常打开、权限限制、有效性三个方面判断网页的可访问性。对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,可以通过其他维度查看。观察;对于无效网页,其展示机制将被降低甚至从数据库中删除。

  1、 可以正常访问的网页没有权限限制,可以直接访问所有主要内容的网页。

  2、有权限限制的网页有两种类型的网页:打开权限和资源获取权限

  1)Open 权限:表示需要登录权限才能打开网页。未经许可,您根本看不到具体内容。普通用户无法获取或获取成本高。百度搜索引擎会降低其显示概率。不包括以登录为主要功能的网页。

  2)资源访问权限:指访问网页的主要内容,如文档、软件、视频等,需要权限或需要安装插件才能获取完整内容。这时候会出现三种情况: •网站,提供优质正版的内容。由于内容建设成本高,虽然查看全文或下载需要权限或安装插件,但在用户的预期范围内,百度搜索引擎不认为权限行为对用户造成伤害,并将其视为正常的可访问页面。 • 对于一些非优质、非正版资源,来自用户转载甚至机器采集,成本低,内容不唯一。用户访问资源也有限制——用户需要注册登录或付费查看,百度搜索引擎会根据具体情况决定是否调整其显示。 • 还有一些视频和下载资源页面。或许他们自己的资源质量还不错,但是需要安装一个非常冷门的插件才能正常访问。例如,当需要安装“xx大片播放器”时,百度搜索引擎就会怀疑其存在恶意倾向。

  示例参考:

  示例

  可访问性

  说明

  案例3.2-1

  好

  CNKI上的一篇论文可以付费下载,但是有版权,浏览体验不错

  案例3.2-2

  好

  优酷新电影,需要付费观看,浏览体验不错。

  案例3.2-3

  中

  内容已复制,但需要登录才能查看更多

  案例3.2-4

  差

  入党申请表本身是转载的,网上到处都是,但是这个页面下载还是要收费的。

  3、Failed 网页通常是指带有死链接和无效主要资源的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长设置此类网页,及时登录百度站长平台,并使用死链提交工具通知百度搜索引擎。

  无效网页包括但不限于: • 404、403、503 等网页; • 程序代码错误网页; • 打开后提示内容已删除,或内容已不存在而跳转到首页的网页; • 已删除内容的论坛帖子、已删除的视频页面(主要出现在 UGC 网站上)互联网网络资源状态

  CNNIC 2014年初发布的《中国互联网发展状况统计报告》称:截至2013年12月,中国网页数据为1500亿,较2012年同期增长22.2%。 2013年中国单个网站的平均网页数和单个网页的平均字节数均保持增长,说明中国互联网内容更加丰富:网站的平均网页数@达到4.6900万,比去年同期增加了2.3%。

  为了保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但是,从过去一年的评测数据中,我们发现优质网页的绝对数量非常少,几乎没有增加;普通网页的比例在下降,相应地,低质量网页的比例显着增加。截至2014年5月,统计数据显示,在百度网络搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占71.6%。

  

  百度搜索通过一系列的筛选、识别、分析和赋能工作,力求将更多优质的网页呈现给用户。它每天都会命中数以万计的劣质网站,涉及数百万个网页。尽量减少低质量网页对用户的干扰。从2014年5月的网页展示分析数据来看,下图显示在当前展示在用户面前的网页质量分布中,优质网页占比40%,劣质网页占比降至11% ——虽然这个变化已经很明显了,但百度网搜索还是希望能和广大站长一起,把质量差的比例降到更低。

  互联网上的所有网页

  百度搜索中显示的网页

  质量网页

  7.4%

  41%

  普通网页

  71.6%

  49%

  质量差的网页

  21%

  11%

  上述低质量网页包括两部分:低质量网页和垃圾网页。低质量网页问题分布如下图所示:

  从上图可以看出,目前低质量网页最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,出现意外弹窗,内容为短,网页需要权限获取资源,过时的信息也是低质量网页的重要组成部分。

  除低质量网页外,无质量垃圾网页的低质量网页问题分布如下图所示:

  

  从上图可以看出,目前低质量网页最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,出现意外弹窗,内容为短,网页需要权限获取资源,过时的信息也是低质量网页的重要组成部分。

  除低质量网页外,无质量垃圾网页的低质量网页问题分布如下图所示:

  

  死链接对用户、网站和搜索引擎毫无意义,垃圾网页占比最大。二是对用户和搜索引擎有害的作弊网页。无效的资源、未回答的问题和不相关的搜索结果页面都是浪费用户时间的网页。搜索引擎不想向用户展示它们。百度搜索引擎给站长的建议

  以上介绍了百度搜索引擎判断网页质量的标准。对应这些标准,站长在实际工作中应该遵循几个原则: • 在设计网页时,主要考虑的是用户,而不是搜索引擎。 • 永远把用户体验放在首位 • 根据用户需求创造内容 • 多思考如何让你的网站 具有独特价值 • 着眼长远,过度广告弊大于利 用户和搜索引擎

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线