百度搜索引擎优化白皮书(互联网全部网页在百度搜索得到展现的网页优质网页(组图))
优采云 发布时间: 2021-10-12 14:24百度搜索引擎优化白皮书(互联网全部网页在百度搜索得到展现的网页优质网页(组图))
CNNIC 2014年初发布的《中国互联网发展状况统计报告》称:截至2013年12月,中国网页数据1500亿,同比增长22.2% 2012. 2013年,单个网站的平均网页数和单个网页的平均字节数保持增长,表明中国互联网内容更加丰富:网站的平均网页数@网站达到4.69万,比去年同期增长2.3%。
为保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但是,从过去一年的评测数据来看,我们发现优质网页的绝对数量非常少,几乎没有增加;普通网页的比例在下降,相应地,低质量网页的比例显着增加。截至2014年5月,统计数据显示,在百度网络搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占71.6%。
通过一系列的筛选、识别、分析、赋能工作,百度搜索力求将更多优质网页呈现给用户,每天命中数万个劣质网站,涉及数百万个网页. 可以减少劣质网页对用户的干扰。从2014年5月的网页展示分析数据来看,下图显示在当前展示在用户面前的网页质量分布中,优质网页的占比为40%,劣质网页的占比降低至11%——虽然这个变化已经很明显了,但是百度网搜索还是希望能和广大站长一起,把质量差的比例降到更低。
互联网的所有页面
百度搜索中显示的网页
质量网页
7.4%
41%
普通网页
71.6%
49%
质量差的页面
二十一%
11%
上述低质量网页包括两部分:低质量网页和垃圾网页。低质量网页问题分布如下图所示:
从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。
除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:
从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。
除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:
死链接对用户、网站 和搜索引擎没有意义,垃圾网页占比最大。二是对用户和搜索引擎有害的作弊网页。无效的资源、未回答的问题和不相关的搜索结果页面都是浪费用户时间的网页。搜索引擎不想向用户展示它们。