长沙益新网络()推出《网页质量白皮书》(图)
优采云 发布时间: 2021-07-03 04:01长沙益新网络()推出《网页质量白皮书》(图)
《百度搜索引擎网页质量白皮书》官方完整版下载 长沙易新网() 长沙西洋洋网() 简介 网页质量是衡量一个网页满足用户需求的能力,是衡量一个网页的重要指标。搜索引擎决定结果排名的依据。基于网页资源的内容与用户需求的相关性,内容完整、页面美观、对用户好、来源权威专业等因素都决定了网页的质量。对于搜索引擎来说,呈现给用户的网页质量直接影响最终的搜索结果和用户需求的满足;对于广大站长来说,整体网页质量的提升有助于在搜索引擎中获得良好的排名和展示,从而吸引更多的用户,获得更多的流量。百度搜索综合了用户对不同网页的真实感受,制定了一套网页质量的评判标准。在此标准的基础上,对百度搜索的收录、排名、展示环境进行了调整,以提供更多@k19优质网页。 @。展示机还压制了一些影响用户体验、欺骗搜索引擎的不良低质量网页。目前,互联网上只有7%的网页可以达到高质量标准。百度作为最大的中文搜索引擎,也让拥有优质内容的网站更好的发展。此外,搜索引擎以前相对封闭。长期以来,站长需要通过不断的探索,找出搜索引擎对网页的判断标准,指导网站内容的建设。此次发布《网页质量白皮书》,旨在打开百度衡量网页质量的维度。百度搜索引擎衡量网页质量时,会从以下三个维度给出质量评分。
下面将一一介绍这些影响网页质量判断的维度特征: 内容质量浏览体验可访问性 访问流畅、内容质量高、浏览体验好的网页质量高;相反,任何维度都有问题。 ,会影响页面的整体质量。下面我们将详细介绍这三个维度。 2.1 衡量网页质量的维度——内容质量 网页的主要内容是网页的价值,是满足用户需求的前提基础。百度搜索引擎对网页内容的质量进行评价,主要看主要内容的质量和主要内容能否满足用户。不同类型的网页的主要内容是不同的。百度搜索引擎在判断不同网页的内容价值时,需要注意的点也存在差异,比如:首页:导航链接和推荐内容是否清晰有效。搜索结果页:搜索结果是否与标题相关。百度搜索引擎从多个维度考虑网页内容的质量,最重要的是:成本;完整的内容;信息归类,请站长和站长对比一下自己网站的页面,从搜索引擎和用户的角度给自己打分:1、内容质量好:百度搜索引擎认为内容质量好的网页花了很多时间和精力在编辑上,贡献了编辑的经验和专业知识;内容清晰、完整、丰富;资源有效且优质;信息真实有效;安全毒药;不收录任何作弊行为和意图,对用户具有很强的正面利益。对于这部分网页,百度搜索引擎会增加它展示在用户面前的概率。
例如:专业医疗机构发布的丰富医学专题页面;专业的文章,彻底解决了高级工程师发布的技术问题;专业视频网站上,播放清晰流畅的原片或完整的电影页面;知名B2C网站,完整有效的产品购买页面;权威新闻台原创或编辑整理的热点新闻报道;网友精心编辑,词条丰富; Q&A网站,回答内容可以完美解决提问者的问题。 2、内容质量:内容质量中等的网页往往能满足用户需求,但在制作和编辑上花费的时间和精力并不多,无法体现编辑的经验和专业知识;内容完整但不丰富;资源有效但质量不好;虽然信息是真实的,但它有很多因素。在这里,我们只举一些例子让大家感受一下:论坛网站一个普通的帖子;一个普通的问答网页;未经任何编辑,直接转载其他网站新闻;没有版权信息的普通电影播放页面采集全球小说网站的盗版小说页面。 3、内容质量差:百度搜索引擎认为主要内容的内容信息较少,或者没有有效信息,或者信息过时。都是内容质量较差的页面,对用户没有任何实质性帮助,应减少其呈现的机会。同时,如果一个网站内分类网页占比过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电商网站、页面网站,并特别注意过期、无效网页的管理。
例如:已下架的产品页面,或已过期的团购页面;已过期的招聘和交易页面;资源已过期,如视频被删除,软件下载后无法使用。 4、无内容质量可言:无内容质量可言的网页是指制作成本极低、制作以次充好的网页;来自采集别处的内容直接放到网上,没有经过最少的编辑整理;木马与其他病毒有关联;含有作弊行为或意图;完全无法满足用户需求,甚至含有欺骗性内容。例如:内容短,内容少,但不能支持页面的主要意图;问答页面有问题没有答案,或者答案根本解决不了问题;网站上的搜索结果页面,但除上述页面外没有提供相关信息,欺骗用户和搜索引擎的网页在完全没有内容质量的集合中占很高的比例。百度搜索引擎将作弊网页定义为:不满足用户需求,通过不正当手段欺骗用户和搜索引擎牟利的网页。目前,这些网页在互联网上仍然是少数,但作弊网页的价值是负面的,对用户的危害很大。搜索引擎对此类网页采取坚决打击的态度。 2.2 衡量网页质量的维度——浏览体验。不同质量的网页浏览体验会有很大的差距。一个高质量的网页应该给用户一个积极的浏览体验。用户希望看到干净且易于阅读的网页。混乱的布局和过多的广告会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户对网页主要内容的获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。
面对内容质量相似的网页,浏览体验更好的网页更有可能获得更高的排名。对于浏览体验较差的网页,百度搜索引擎会视情况降低其呈*敏*感*词*支持的认识,以及对在网页上投放合法广告的支持。网页应满足用户的需求。最好的状态是“主要内容和广告一起满足用户需求,内容为主,广告次要”,广告不应该是页面的主体。我们举个例子来感受一下百度的搜索引擎对网页浏览体验进行分类,站长可以在此基础上对比测试自己的网站浏览体验:1、浏览体验好:页面布局合理,用户获取主要内容成本低,一般具有以下特点: 布局合理,布局美观,易于阅读浏览; 用户所需的内容占据网页最重要的位置; 页面标签或页面布局可以清楚地区分哪些广告; 广告不抢占主要内容 位置不妨碍用户获取主要内容;2、浏览体验差:页面布局和广告投放影响用户访问主要内容nt,增加用户获取信息的成本,让用户反感。
包括但不限于以下情况: 正文内容没有换行或分段,用户阅读困难;字体和背景颜色相似,内容难以区分;页面布局不合理,页面首屏看不到有价值的主要内容;广告掩盖了主要内容;或者一般分辨率下,首屏全是广告,看不到主要内容;弹出广告太多;浮动广告太多影响阅读点击链接时出现意外弹窗;广告和内容混淆,不易区分; 2.3 衡量网页质量的维度——可访问性 用户希望从搜索引擎快速获取自己需要的信息,而百度搜索引擎为用户提供了一次直接访问所有信息的机会,尽可能多的网页结果。百度搜索引擎认为无法直接获取主要内容的网页对用户不友好,会根据情况调整其显示概率。百度搜索引擎会从正常打开、权限限制、有效性三个方面来判断网页的可访问性。对于无效的网页,其呈现机制将被减少甚至从数据库中删除。 1、 可正常访问的网页 没有权限限制,所有主要内容的网页都可以直接访问。 2、权限受限的网页 有两种类型的网页:打开权限和资源获取权限。 1)opening 权限表示所有网页都需要登录权限。没有权限,他们根本看不到具体内容,普通用户也无法获取或获取。成本高,百度搜索引擎会降低其展示机会。不包括以登录为主要功能的网页。2)资源获取权限是指访问网页的主要内容,如文档、软件、视频等,需要权限或需要安装插件ins获取内容。
此时会出现三种情况:网站提供优质、正版的内容。由于内容构建成本高,虽然查看全文或下载需要权限或插件安装,但在用户的预期之内。百度搜索引擎也不认为许可行为会对用户造成伤害,将其视为正常可访问页面。对于一些非优质、非正版的资源,来自用户转载甚至机器采集,成本低,内容不唯一。对用户访问资源也有限制——用户需要注册登录或付费查看,百度搜索引擎会根据具体情况决定是否调整其显示。还有一些视频和下载资源页面。或许他们自己的资源质量还不错,但是他们需要安装非常冷门的插件才能正常访问。例如,当需要安装“xx大片播放器”时,百度搜索引擎就会怀疑其有恶意倾向。 3、Failed 网页通常是指带有死链接和无效主要资源的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长设置此类网页,及时登录百度站长平台,并使用死链提交工具通知百度搜索引擎。无效网页包括但不限于:404、403、503等网页;程序代码错误的网页;打开后提示内容被删除,或者因为内容不存在而跳转到首页的网页;删除内容的论坛帖子、删除的视频页面(主要出现在 UGC 网站上) 互联网网络资源现状 CNNIC 2014 年初发布的《中国互联网发展状况统计报告》指出,截至 2013 年,中国网页为1500亿,较2012年同期增长。22.2%。
2013年,中国单个网站网页平均数和单个网页平均字节数保持增长,显示中国互联网内容更加丰富:平站达到4.6900万。比去年同期增加了2.3%。为保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但是,从过去一年的评测数据中,我们发现优质网页的绝对数量非常少,几乎没有增加;网页的比例在下降,相应地,劣质网页的比例显着增加。截至2014年,据统计,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占71.6%。