百度搜索引擎优化白皮书(质量差网页包括低质网页和垃圾网页的问题分布图)

优采云 发布时间: 2021-12-04 19:25

  百度搜索引擎优化白皮书(质量差网页包括低质网页和垃圾网页的问题分布图)

  CNNIC 2014年初发布的《中国互联网发展状况统计报告》称:截至2013年12月,中国网页数据1500亿,比2012年同期增长22.2% . 2013年单个网站的平均网页数和单个网页的平均字节数保持增长,说明中国互联网内容更加丰富:网站@的平均数量> 网页达到4.6900万,比去年同期增长2.3%。

  为了保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但是,从过去一年的评测数据中,我们发现优质网页的绝对数量非常少,几乎没有增长;普通网页的比例在下降,相应地,低质量网页的比例显着增加。截至2014年5月,统计数据显示,在百度网络搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占71.6%。

  通过一系列的筛选、识别、分析和赋能工作,百度搜索力求将更多优质网页呈现给用户,每天点击数万个劣质网站,涉及数百万个网页. 可以减少劣质网页对用户的干扰。从2014年5月的网页展示分析数据来看,下图显示,在目前向用户展示的网页质量分布中,优质网页占比40%,劣质网页下降至11%——虽然这种变化已经很明显。不过,百度网页搜索还是希望能与广大站长共同努力,将劣质的比例降到更低。

  上述低质量网页包括两部分:低质量网页和垃圾网页。低质量网页问题分布如下图所示:

  从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。

  除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:

  从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。

  除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:

  死链接对用户、网站 和搜索引擎毫无意义,垃圾网页占比最大。其次,对用户和搜索引擎造成极大伤害的作弊网页。无效的资源、未回答的问题和不相关的搜索结果页面都是浪费用户时间的网页。搜索引擎不希望呈现给用户。

  文章标题:百度搜索引擎网页质量白皮书3:互联网Web资源现状

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线