百度搜索引擎优化白皮书(百度搜索引擎在衡量网页质量时的维度特征及特征分析)
优采云 发布时间: 2021-11-20 11:19百度搜索引擎优化白皮书(百度搜索引擎在衡量网页质量时的维度特征及特征分析)
网页质量是衡量一个网页满足用户需求的能力,是搜索引擎确定结果排名的重要依据。基于网页资源的内容与用户需求的相关性,内容完整、页面美观、用户友好、来源权威专业等因素都决定了网页的质量。对于搜索引擎来说,呈现给用户的网页质量的好坏直接影响到最终的搜索结果和用户需求的满足程度;对于广大站长来说,整体网页质量的提升有助于在搜索引擎中获得良好的排名和展示,从而吸引更多的用户,获得更多的流量。百度搜索综合用户对不同网页的实际感受,制定了一套网页质量的评判标准。在此标准的基础上,对百度搜索的收录、排名、展示环境进行了调整,给优质网页更多的收录展示机会,抑制部分不良、低质量的网页影响用户体验和欺骗搜索引擎。目前,互联网上只有7%的网页可以达到高质量标准。百度作为中国最大的搜索引擎,希望从互联网生态的角度,与站长一起,构建良好的互联网生态,更好地为网民服务。, 这也可以更好地开发具有高质量内容的 网站。此外,搜索引擎以前相对封闭。长期以来,站长需要通过不断的探索,找出搜索引擎对网页的判断标准,指导网站内容的建设。此次发布《网页质量白皮书》,旨在公开百度对网页质量的判断标准,为站长提供参考。我们希望能产出更多更好的内容来满足搜索引擎用户的需求,同时为站长们提供指导。来流量,实现双赢。
百度搜索引擎在衡量网页质量时,会综合考虑以下三个维度,给出一个质量分数。下面将介绍这些影响网页质量判断的维度特征:
访问流畅、内容质量高、浏览体验好的网页质量高;相反,任何维度的任何问题都会影响网页的整体质量。下面我们将详细介绍这三个维度。
衡量网页质量的维度——内容质量 网页的主要内容是网页的价值,是满足用户需求的前提。百度搜索引擎主要根据主要内容的质量和主要内容是否能够满足用户来评估网页内容的质量。
不同类型的网页的主要内容是不同的。百度搜索引擎在判断不同网页的内容价值时,需要注意的点也存在差异,例如:
百度搜索引擎从多个维度考虑网页内容的质量,最重要的是:成本;完整的内容;信息真实有效且安全。让我们通过一个例子来感受一下百度的搜索引擎是如何对网页的内容质量进行分类的。请从搜索引擎和用户的角度对比自己网站的页面,给自己打分:1、内容质量好:百度搜索引擎认为,内容质量好的网页在上面花费了大量的时间和精力编辑,并贡献了编辑的经验和专业知识;内容清晰、完整、丰富;资源有效且优质;信息真实有效;安全无毒;不包括任何作弊行为和意图,对用户有很强的积极利益。
用户面前的概率。例如:
2、内容质量中等:内容质量中等的网页往往能满足用户需求,但在制作和编辑上花费的时间和精力并不多,无法体现编辑者的经验和专业知识;内容完整但不丰富;资源 有效但质量差;该信息真实有效,但来源于采集;安全无毒;不收录作弊行为和意图。在互联网中,中等质量的网页实际上是一个比较大的类型和面孔的集合。百度搜索引擎在评估此类网页时通常会考虑许多其他因素。在这里,我们只举几个例子,让大家感受一下:
论坛类普通帖子网站;
示例参考:
3、内容质量差:百度搜索引擎认为主要内容的内容信息量少,或者没有有效信息,信息无效过期都是内容质量差的页面,不提供对用户的任何实质性帮助,都应该减少他们的展示机会。同时,如果此类网页在网站中所占比例过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电子商务网站@ >、黄页网站要特别注意过期失效网页的管理。例如:
示例参考:
4、 没有内容质量可言:没有内容质量可言的网页是制作成本低,制作以次充好;来自别处采集的内容被放到网上,没有最少的编辑和整理;*敏*感*词*木马和其他病毒;收录作弊行为或意图;完全无法满足用户的需求,甚至收录欺骗性内容的网页。例如:
示例参考:
除了上述网页之外,欺骗用户和搜索引擎的网页在完全没有内容质量的集合中占有很高的比例。百度搜索引擎对作弊网页的定义是:不满足用户需求的网页,通过不正当手段欺骗用户和搜索引擎牟利。目前,这部分网页在互联网上的数量还很少,但作弊网页的价值是负的,对用户的危害很大。搜索引擎对此类网页采取坚决打击的态度。示例参考:
2.2个维度衡量网页的质量——不同质量的网页的浏览体验会给用户的浏览体验带来很大的差距。一个高质量的网页应该给用户一个积极的浏览体验。用户希望看到干净且易于阅读的网页。混乱的版式和过多的广告会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户对网页主要内容的获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相似的网页,浏览体验更好的网页更有可能获得更高的排名。对于浏览体验不佳的网页,百度搜索引擎会根据情况降低显示的概率甚至拒绝收录。影响用户浏览体验质量的因素有很多。目前,百度搜索引擎主要影响内容布局和广告。
考虑网页。
网页应以满足用户需求为主要目的,最好的状态是“主要内容和广告共同满足用户需求,以内容为主要内容,以广告为补充”,广告不应成为页面的主体。我们以一个例子来体验一下百度搜索引擎是如何对网页浏览体验进行分类的。基于此,站长可以对比测试自己网站的浏览体验:1、良好的浏览体验:页面布局合理,获取用户。主要内容成本低,一般具有以下特点:
示例参考:
2、浏览体验差:页面布局和广告投放影响用户对主要内容的访问,增加用户获取信息的成本,让用户反感。包括但不限于以下情况:
2.3 衡量网页质量的维度——可访问性 用户希望从搜索引擎快速获取他们需要的信息。百度搜索引擎为用户提供了一次可以直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取主要内容的网页对用户不友好,会根据情况调整显示概率。百度搜索引擎会从正常打开、权限限制、有效性三个方面来判断网页的可访问性。对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,通过其他维度观察;对于无效的网页,其展示机制将被降低甚至从数据库中删除。
1、 可以正常访问的网页没有权限限制,所有主要内容的网页都可以直接访问。
2、 有权限限制的网页 网页有打开权限和资源获取权限两种
1) 打开权限是指所有网页都需要登录权限。未经许可,您根本看不到具体内容。普通用户无法获取或获取成本高。百度搜索引擎会降低其显示概率。不包括以登录为主要功能的网页。
2) 资源获取权限是指获取网页的主要内容,如文档、软件、视频等,需要权限或需要安装插件才能获取完整内容。
这时候会出现三种情况:
示例参考:示例可访问性
3、 无效网页通常是指有死链接和无效主要资源的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长设置此类网页,及时登录百度站长平台,并使用死链提交工具通知百度搜索引擎。无效网页包括但不限于:
3 互联网网络资源现状
CNNIC于2014年初发布的《中国互联网发展状况统计报告》称,截至2013年12月,中国网页数据为1500亿,较2012年同期增长22.2% . 2013年,单个网站的平均网页数和单个网页的平均字节数保持增长,说明中国互联网内容更加丰富:网站的平均网页数网站达到4.69万,比去年同期增长2.3%。为了保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但从过去一年的评价数据来看,我们发现优质网页的绝对数量非常少,几乎没有增长;普通网页的比例在下降,相应地,低质量网页的比例显着增加。截至2014年5月,统计数据显示,在百度网络搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占71.6%。
通过一系列的筛选、识别、分析和赋能工作,百度搜索力求将更多优质网页呈现给用户,每天点击数万个劣质网站,涉及数百万个网页. 可以减少劣质网页对用户的干扰。从下图2014年5月的网页展示分析数据可以看出,当前展示在用户面前的网页质量分布中,优质网页的占比为40%,劣质网页的占比为降低到11%——虽然这个变化已经很明显了,但百度网搜索还是希望能和广大站长一起,把质量差的比例降到更低。
上述低质量网页包括两部分:低质量网页和垃圾网页。低质量网页问题分布如下图所示:
从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:
死链接对用户、网站 和搜索引擎毫无意义,垃圾网页占比最大。二是对用户和搜索引擎有害的作弊网页。无效的资源、未回答的问题和不相关的搜索结果页面都是浪费用户时间的网页。搜索引擎不想向用户展示它们。
4 百度搜索引擎给站长的建议 以上介绍了百度搜索引擎判断网页质量的标准。对应这些标准,站长在实际工作中应该遵循几个原则: