百度搜索引擎优化白皮书(采集知名小说网站的盗版小说页有哪些?(图))
优采云 发布时间: 2021-12-16 04:47百度搜索引擎优化白皮书(采集知名小说网站的盗版小说页有哪些?(图))
采集知名小说网站的盗版小说页。
3、内容质量差:
百度搜索引擎认为主要内容的内容是信息较少,或没有有效信息,或信息无效并已过期。它是一个内容质量较差的网页,对用户没有任何实质性帮助,应减少其显示的机会。同时,如果此类网页在网站中所占比例过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电子商务网站@ >、黄页网站要特别注意过期失效网页的管理。例如:
3、内容质量差:
百度搜索引擎认为主要内容的内容是信息较少,或没有有效信息,或信息无效并已过期。它是一个内容质量较差的网页,对用户没有任何实质性帮助,应减少其显示的机会。同时,如果此类网页在网站中所占比例过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电子商务网站@ >、黄页网站要特别注意过期失效网页的管理。例如:
已下架的商品页面,或已过期的团购页面;
已过期的招聘和交易页面;
资源已过期,如视频被删除、软件下载后无法使用等。
4、没有内容质量可言:
根本没有内容质量的网页,就是制作成本低,以次充好;来自别处 采集 的内容无需编辑即可在线放置;挂木马等病毒;收录作弊或意图;完全不能满足用户需求甚至收录欺骗性内容的网页。例如:
内容短,内容少,但不能支持页面的主要意图;
问答页面有问题没有答案,或者答案根本解决不了问题;
网站上的搜索结果页面,但没有给出相关信息
除了上述网页之外,欺骗用户和搜索引擎的网页在完全没有内容质量的集合中占了很高的比例。百度搜索引擎对作弊网页的定义是:不满足用户需求的网页,通过不正当手段欺骗用户和搜索引擎牟利。目前,这部分网页在互联网上的数量还很少,但作弊网页的价值是负的,对用户的危害很大。搜索引擎对此类网页采取坚决打击的态度。
2.2 衡量网页质量的维度——浏览体验
不同质量的网页浏览体验会有很大的差距。一个高质量的网页应该给用户一个积极的浏览体验。用户希望看到干净且易于阅读的网页。混乱的版式和过多的广告会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户对网页主要内容的获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相似的网页,浏览体验更好的网页更有可能获得更高的排名。对于浏览体验较差的网页,百度搜索引擎会视情况降低其显示概率,甚至拒绝收录。
影响用户浏览体验质量的因素有很多。目前,百度搜索引擎主要从内容布局和广告影响力两个方面考虑网页。
内容布局
用户进入网页时首先看到的是内容布局。布局决定了用户对网页的第一印象,也决定了用户获取内容的成本。
广告影响力
百度搜索引擎明白网站的生存和发展需要资金支持,并支持在网页上投放合法广告。网页应以满足用户需求为主要目的,最好的状态是“主要内容和广告共同满足用户需求,内容为主,广告为辅”,广告不应是网页的主体。
举个例子来体验一下百度搜索引擎是如何对网页浏览体验进行分类的,站长可以以此为基础对比测试自己网站的浏览体验:
1、良好的浏览体验:
页面布局合理,用户获取主要内容的成本低。一般来说,它具有以下特点:
布局合理,布局美观,便于阅读浏览;
用户需要的内容占据网页最重要的位置;
能够通过页面标签或页面布局清楚地区分哪些是广告;
广告不占据主要内容的位置,不妨碍用户获取主要内容;
2、糟糕的浏览体验:
页面布局和广告投放影响用户对主要内容的访问,增加用户获取信息的成本,让用户反感。包括但不限于以下情况:
正文内容不换行、不拆分,用户阅读困难;
字体和背景颜色相似,内容难以区分;
页面布局不合理,页面首屏看不到有价值的主要内容;
广告掩盖了主要内容;或者一般分辨率下,首屏全是广告,主要内容不可见;
弹出广告太多;
浮动广告太多影响阅读
当点击链接时,会出现一个意想不到的弹出窗口;
广告和内容混淆,难以区分;
3、无效网页
它通常指具有死链接和主要资源故障的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长设置此类网页,及时登录百度站长平台,并使用死链提交工具通知百度搜索引擎。
无效网页包括但不限于:
404、403、503等网页;
程序代码错误网页;
打开后提示内容被删除,或者因为内容不存在而跳转到首页的页面;
收录已删除内容的论坛帖子、已删除的视频页面(主要出现在 UGC 网站上)
3 互联网网络资源现状
CNNIC 2014年初发布的《中国互联网发展状况统计报告》称,截至2013年12月,中国网页数据为1500亿,比2012年同期增长22.2% . 2013年,单个网站的平均网页数和单个网页的平均字节数保持增长,说明我国互联网内容更加丰富:网站的平均网页数网站达到4.69万台,比去年同期增长2.3%。
为了保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但是,从过去一年的评测数据中,我们发现优质网页的绝对数量非常少,几乎没有增加;普通网页的比例在下降,相应地,低质量网页的比例显着增加。截至2014年5月,统计数据显示,在百度网络搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占7个。 1.6%。
通过一系列的筛选、识别、分析、赋能工作,百度搜索力求将更多优质网页呈现给用户,每天命中数万个劣质网站,涉及数百万个网页. 可以减少劣质网页对用户的干扰。从2014年5月的网页展示分析数据来看,下图显示,在当前展示在用户面前的网页质量分布中,优质网页占40%,劣质网页减少到11%——尽管这一变化已经很明显了,百度网搜索还是希望能和广大站长一起,把质量差的比例降到更低。
上述低质量网页包括两部分:低质量网页和垃圾网页。低质量网页问题分布如下图所示:
从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。
除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:
死链接对用户、网站 和搜索引擎毫无意义,垃圾网页占比最大。二是对用户和搜索引擎有害的作弊网页。无效的资源、未回答的问题和不相关的搜索结果页面都是浪费用户时间的网页。搜索引擎不想向用户展示它们。
4 百度搜索引擎给站长的建议
以上介绍了百度搜索引擎判断网页质量的标准。对应这些标准,站长在实际工作中应该遵循几个原则:
设计网页时主要考虑的是用户,而不是搜索引擎
永远把用户体验放在第一位
根据用户需求创建内容
多思考如何让自己的网站独一无二的价值
着眼长远,乱做广告弊大于利
及时删除低质量内容
不要试图以任何方式欺骗用户和搜索引擎
原文由站长信息撰写
百度白皮书地址: