衡量网页质量的维度百度搜索引擎的三个维度特征
优采云 发布时间: 2021-04-03 05:02衡量网页质量的维度百度搜索引擎的三个维度特征
文章目录
网页质量是衡量网页满足用户需求的能力的指标,并且是搜索引擎确定结果排名的重要依据。根据Web资源的内容与用户需求之间的相关性,完整的内容,漂亮的页面,用户的友好程度以及权威和专业的资源等因素都决定了Web页面的质量。
对于搜索引擎,呈现给用户的网页质量直接影响最终的搜索结果和用户需求的满足;对于大多数网站管理员而言,整体网页质量的提高有助于获得对搜索引擎的访问权限。良好的排序和显示方式,从而吸引了更多的用户并获得了更多的流量。
百度搜索将用户在不同网页上的真实感受整合在一起,并开发出一套判断网页质量的标准。在此标准的基础上,调整了百度搜索的收录,排名和显示环境,以提供更多高质量的网页。 收录,展示机会,并压制一些不良和低质量的网页,这些网页会影响用户体验并欺骗搜索引擎。
当前,Internet上只有7%的网页可以满足高质量标准。百度作为最大的中文搜索引擎,希望与网站管理员合作,从互联网生态的角度构建良好的互联网生态系统。服务于网民还可以更好地开发具有高质量内容的网站。
此外,搜索引擎之前相对关闭。长期以来,网站管理员需要通过不断的探索找出网页上搜索引擎的判断标准,并指导网站内容的建设。这次发布“网页质量白皮书”的目的是公开百度关于网页质量的判断标准,并为网站管理员提供参考。我们希望将产生更多更好的内容,以满足搜索引擎用户的需求,并为网站管理员提供指导。来交通,实现双赢。
衡量网页质量的维度
当百度搜索引擎测量网页质量时,它将从以下三个维度给出质量得分。下面将逐一介绍影响网页质量判断的这些维度特征:
访问流畅,内容质量高,浏览体验好的网页质量高;相反,任何维度上的任何问题都会影响网页的整体质量。下面我们将详细介绍这三个维度。
内容质量
网页的主要内容是网页的价值,是满足用户需求的前提。百度搜索引擎主要根据主要内容的质量以及主要内容是否可以满足用户的需求来评估网络内容的质量。不同类型网页的主要内容是不同的。当百度搜索引擎判断不同网页的内容价值时,需要注意的地方也存在差异,例如:
百度搜索引擎从多个维度考虑网络内容的质量,其中最重要的是:成本;完整的内容;信息是真实,有效和安全的。让我们以一个例子来了解一下百度的搜索引擎如何对网页的内容质量进行分类。请比较您自己网站的页面,并从搜索引擎和用户的角度对自己进行评分:
1、内容质量很好:
百度搜索引擎认为,具有良好内容质量的网页已花费大量时间和精力进行编辑,并投入了编辑的经验和专业知识;内容清晰,完整,丰富;资源是有效的和高质量的;该信息是真实有效的;安全无毒;不含任何作弊和意图,对用户有很强的积极意义。对于网页的这一部分,百度搜索引擎将增加其在用户面前显示的机会。例如:
参考示例:
示例
内容质量
说明
案例3. 1. 1-1
好
由专业医学网站出版的大量医学专题页面
案例3. 1. 1-2
好
由高级工程师释放的专业人员,他们可以完全解决某些技术问题文章
案例3. 1. 1-3
好
在专业视频网站上,播放清晰流畅的正版电影完整版页面
案例3. 1. 1-4
好
京东完整有效的产品购买页面
案例3. 1. 1-5
好
权威新闻台原创的热点新闻报道
案例3. 1. 1-6
好
网民精心编辑后内容丰富的百科全书
case 3. 1. 1-7
好
百度之行,一个完全解决用户问题的问答页面
?2、内容质量:
具有中等内容质量的网页通常可以满足用户需求,但不会花费大量时间和精力进行制作和编辑,也无法反映编辑者的经验和专业知识;内容完整但不丰富;资源有效但质量不好;尽管该信息是真实有效的,但它是从采集中获得的;它是安全且无毒的;它不收录作弊行为和意图。在Internet中,中等质量的网页实际上是相对较大的类型和面孔集合。百度搜索引擎在评估此类网页时通常会考虑许多其他因素。在这里,我们仅举一些例子让您感到:
示例参考:
示例
内容质量
说明
案例3. 1. 2-1
中等
网易直接转载了来自中国新闻网的新闻。
案例3. 1. 2-2
中等
网民在图书馆上传的“国庆假期安排”新闻
案例3. 1. 2-3
中等
采集盗版小说网的小说网站
案例3. 1. 2-4
中等
*敏*感*词*中的普通帖子
?3、内容质量差:
百度搜索引擎认为,主要内容的内容是较少的信息,或者没有有效的信息,或者该信息已过时。所有页面都是内容质量较差的页面,不会为用户提供任何实质性帮助,因此应减少其显示的机会。同时,如果此类网页在网站中所占的比例过大,也会影响百度搜索引擎对该网站的评级,尤其是UGC 网站,电子商务网站和*敏*感*词*页网站。 ,管理无效网页。例如:
4、完全没有内容质量:
根本没有内容质量的网页是那些生产成本低,伪劣的网页;在线采集中的内容无需进行最少编辑就可以在线放置;悬挂*敏*感*词*木马和其他病毒;收录作弊或意图;根本无法满足用户需求甚至收录欺骗性内容的网页。例如:
除了上述网页外,欺骗用户和搜索引擎的网页占全部无内容质量的百分比很高。百度搜索引擎作弊网页的定义是:不满足用户需求,通过不正当手段欺骗用户和搜索引擎的网页,以牟取暴利。目前,Internet上的这部分网页数量仍然很少,但作弊网页的价值是负面的,对用户非常有害。搜索引擎采取坚决态度打击此类网页。
浏览体验
不同质量的网页的浏览体验会有很大的差距。高质量网页的浏览体验应该是积极的。用户希望看到干净且易于阅读的网页。混乱的版面和过多的广告将影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,网页主要内容的用户获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相似的网页,浏览体验更好的网页更有可能获得更高的排名。对于浏览体验较差的网页,百度搜索引擎会根据情况降低其呈现的可能性,甚至拒绝它们的出现收录。
有很多因素会影响用户浏览体验的质量。目前,百度搜索引擎主要从内容布局和广告影响两个方面来考虑网页:
内容布局:用户进入网页时首先看到的是内容布局。布局确定了用户对网页的第一印象,还确定了用户获取内容的成本。
广告影响:百度搜索引擎了解网站的生存和发展需要资金支持,并支持在网页上放置合法广告。网页应满足用户的需求为主要目的,最好的状态是“主要内容和广告以内容为主要内容,以广告为补充,一起满足用户的需求。”
让我们通过一个例子来了解百度的搜索引擎如何对网页的浏览体验进行分类。基于此,网站管理员可以比较和测试他们自己网站的浏览体验:
1、良好的浏览体验:
页面布局合理,用户获取主要内容的成本较低。通常,它具有以下特征:
广告不会占据主要内容的位置,也不会阻碍用户获取主要内容;
?参考示例:
示例
浏览体验
说明
案例3. 2. 1-1
好
招聘,房地产等。网站主页上也有很多广告,但它们都与招聘有关。浏览体验还可以。
案例3. 2. 1-2
好
文章页面,页面布局合理,没有广告,布局良好,结构合理
案例3. 2. 1-3
好
游戏首页,美观的布局,合理的布局,没有广告,出色的浏览体验
?2、糟糕的浏览体验:
页面布局和广告放置会影响用户对主要内容的访问,增加了用户访问信息的成本,并使用户感到反感。包括但不限于以下情况:
可访问性
用户希望从搜索引擎中快速获取所需信息。百度搜索引擎试图为用户提供可以直接直接获得所有信息的Web结果。百度搜索引擎认为,无法直接获取主要内容的网页对用户不友好,并会根据情况调整其显示概率。
百度搜索引擎将从三个方面来判断网页的可访问性:正常打开,权限限制和有效性。对于可以正常访问的网页,它可以参与正常排序;对于具有权限限制的网页,可以通过其他维度进行查看。观察;对于无效的网页,其展示机制将被降低甚至从数据库中删除。
通常可以访问的网页没有权限限制,所有具有主要内容的网页都可以直接访问。具有权限限制的网页有两种:打开权限和资源获取权限
1)打开权限:这意味着您需要登录权限才能打开网页。未经许可,您根本看不到特定内容。普通用户无法获得它或获取成本很高。百度搜索引擎将降低其显示概率。不包括主要功能是登录的网页。
2)资源访问权限:指对网页主要内容的访问,例如文档,软件,视频等,这些内容需要许可或需要安装插件才能获取完整内容。此时将出现三种情况:
参考示例:
示例
可访问性
说明
案例3. 2-1
好
有关CNKI的论文只能付费下载,但已获得版权,浏览体验也很好
案例3. 2-2
好
优酷上的一部新电影,您需要付费才能观看,浏览体验也不错。
案例3. 2-3
中等
内容已复制,但您需要登录才能查看更多
案例3. 2-4
差
加入聚会本身的申请表已重印,并且在Internet上无处不在,但是此页面仍然需要付费才能下载。
?3、无效的网页
它通常是指链接无效且主要资源无效的网页。百度搜索引擎认为,这些页面无法提供有价值的信息。如果网站上的此类页面太多,也会影响百度搜索引擎的收录和评级。建议网站管理员设置此类网页,及时登录百度网站管理员平台,并使用失效链接提交工具通知百度搜索引擎。
失败的页面包括但不限于:
Internet网络资源的现状
CNNIC在2014年初发布的《中国互联网发展状况统计报告》中指出,截至2013年12月,中国的网页数据为1500亿,比2006年同期增长2 2. 2%。 2012年。2013年,单个网站的平均网页数量和单个网页的平均字节数均保持增长,这表明中国互联网上的内容更加丰富: k14]的网页达到4. 690,000,比去年同期增长2. 3%。
?为了确保搜索质量并提高用户满意度,百度搜索引擎每周都会对网页质量进行一次示例评估。但是,根据过去一年的评估数据,我们发现高质量网页的绝对数量很小,几乎没有增加;普通网页的比例在下降,相应地,劣质网页的比例也大大增加。截至2014年5月,统计数据显示,在百度网络搜索中找到的海量网页中,高质量网页仅占7. 4%,劣质网页占21%,其余普通网页占7 1. 6%。
百度网络搜索通过一系列的筛选,识别,分析和授权工作,努力为用户提供更多高质量的网页,每天涉及成千上万个质量不佳的网页网站。尽可能减少由于质量差的网页对用户造成的干扰。从2014年5月的网页显示分析数据来看,下图显示在当前显示在用户面前的网页质量分布中,高质量网页的比例为40%,劣质网页的比例降至11% -尽管这种变化已经非常明显,但百度网络搜索仍然希望与大多数网站管理员合作,以将质量较差的比例降低到更低的水平。
Internet上的所有网页
百度搜索中显示的网页
高质量网页
7. 4%
41%
普通网页
7 1. 6%
49%
网页质量不佳
21%
11%
上述质量较差的网页包括两个部分:低质量网页和垃圾邮件网页。下图显示了低质量网页问题的分布:
从上图可以看出,目前低质量网页中最严重的问题是广告过多,占据网页的主要位置以及意外弹出窗口导致的不良浏览体验,其内容是简短,该网页需要获得资源的许可,而过时的信息也是劣质网页的重要组成部分。
除低质量的网页外,下图显示了没有任何质量垃圾邮件页面的质量较差的网页的问题分布:
从上图可以看出,目前低质量网页中最严重的问题是广告过多,占据网页的主要位置以及意外弹出窗口导致的不良浏览体验,其内容是简短,该网页需要获得资源的许可,而过时的信息也是劣质网页的重要组成部分。
除低质量的网页外,下图显示了没有任何质量垃圾邮件页面的质量较差的网页的问题分布:
无效链接对用户,网站和搜索引擎以及最大比例的垃圾邮件网页没有意义。第二种是欺骗对用户和搜索引擎有害的网页。无效的资源,未回答的问题以及不相关的搜索结果页面是浪费用户时间的网页。搜索引擎不想将其显示给用户。
百度搜索引擎对网站站长的建议
以上介绍了百度搜索引擎确定网页质量的标准。符合这些标准的网站管理员在实际工作中应遵循以下原则: