百度搜索引擎优化白皮书(知名小说网站的盗版小说页实例参考:示例内容质量说明)
优采云 发布时间: 2021-11-18 10:15百度搜索引擎优化白皮书(知名小说网站的盗版小说页实例参考:示例内容质量说明)
•采集知名小说网站的盗版小说页面。
示例参考:
例子
内容质量
阐明
案例3.1.2-1
中间
网易直接转载了中新网的一条新闻。
案例3.1.2-2
中间
网友上传图书馆“国庆放假安排”消息
案例3.1.2-3
中间
采集 启典小说网盗版小说网站
案例3.1.2-4
中间
百度普通帖子贴吧
3、内容质量差:
百度搜索引擎认为主要内容的内容是信息较少,或者没有有效信息,或者信息已经过时。都是内容质量较差的页面,对用户没有任何实质性的帮助,应该减少他们展示的机会。同时,如果此类网页在网站中所占比例过大,也会影响百度搜索引擎对该网站的评分,尤其是UGC网站、电子商务网站@ >、黄页网站要特别注意过期无效网页的管理。例如:
• 已下架的产品页面,或已过期的团购页面;
• 已过期的招聘和交易页面;
• 资源已过期,如视频被删除、软件下载后无法使用等。
4、没有内容质量可言:
根本没有内容质量的网页,就是制作成本低,以次充好;来自别处 采集 的内容无需编辑即可在线放置;挂木马等病毒;收录作弊或意图;完全不能满足用户需求甚至收录欺骗性内容的网页。例如:
• 内容短,内容少,但不能支持页面的主要意图;
• 问答页面有问题且无答案,或答案根本无法解决问题;
• 站点搜索结果页面,但未提供相关信息
除了上述网页之外,欺骗用户和搜索引擎的网页在完全没有内容质量的集合中占有很高的比例。百度搜索引擎对作弊网页的定义是:不满足用户需求的网页,通过不正当手段欺骗用户和搜索引擎牟利。目前,这部分网页在互联网上的数量还很少,但作弊网页的价值是负的,对用户的危害很大。搜索引擎对此类网页采取坚决打击的态度。
二、衡量网页质量的维度——浏览体验
不同质量的网页浏览体验会有很大的差距,优质网页的浏览体验应该是积极的。用户希望看到干净且易于阅读的网页。混乱的版式和过多的广告会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户对网页主要内容的获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相似的网页,浏览体验更好的网页更有可能获得更高的排名。对于浏览体验较差的网页,百度搜索引擎会视情况降低其显示概率,甚至拒绝收录。
影响用户浏览体验质量的因素有很多。目前,百度搜索引擎主要从内容布局和广告影响力两个方面考虑网页:
内容布局:用户进入网页时首先看到的是内容布局。布局决定了用户对网页的第一印象,也决定了用户获取内容的成本。
广告影响力:百度搜索引擎明白网站的生存和发展需要资金支持,支持在网页上投放合法广告。网页应以满足用户需求为主要目的,最好的状态是“内容为主,广告满足用户需求,内容为主,广告为辅”,广告不应成为页面的主体。
下面我们通过一个例子来感受一下百度搜索引擎是如何对网页浏览体验进行分类的。基于此,站长们可以对比测试一下自己的网站浏览体验:
1、浏览体验不错:
页面布局合理,用户获取主要内容的成本低。一般来说,它具有以下特点:
• 布局合理,布局美观,易于阅读和浏览;
• 用户需要的内容占据页面最重要的位置;
• 能够通过页面标签或页面布局清楚地区分哪些是广告;
• 广告不占据主要内容的位置,不妨碍用户获取主要内容;
示例参考:
例子
浏览体验
阐明
案例3.2.1-1
好的
招聘、房产等。网站的首页也有很多广告,但都是和招聘相关的,浏览体验还可以。
案例3.2.1-2
好的
文章页面,页面布局合理,无广告,布局好,结构合理
案例3.2.1-3
好的
游戏首页,布局精美,布局合理,无广告,浏览体验极佳
2、糟糕的浏览体验:
页面布局和广告投放影响用户对主要内容的访问,增加用户获取信息的成本,让用户反感。包括但不限于以下情况:
• 正文内容不换行、不拆分,用户阅读困难;
• 字体和背景颜色相似,内容难以区分;
• 页面布局不合理,网页首屏看不到有价值的主要内容;
•广告掩盖了主要内容;或者在万能分辨率下,首屏全是广告,主要内容不可见;
• 弹出广告太多;
• 太多影响阅读的浮动广告
• 单击链接时,会出现意外的弹出窗口;
• 广告和内容混淆,难以区分;
三、 衡量网页质量的维度——可访问性
用户希望从搜索引擎中快速获取他们需要的信息。百度搜索引擎为用户提供了一次可以直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取主要内容的网页对用户不友好,会根据情况调整显示概率。
百度搜索引擎会从正常打开、权限限制、有效性三个方面来判断网页的可访问性。对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,通过其他维度观察;对于无效的网页,其展示机制将被降低甚至从数据库中删除。
1、一个可以正常访问的网页
没有权限限制,您可以直接访问所有主要内容网页。
2、权限受限的网页
此类网页有两种类型:打开权限和资源访问权限
1)打开权限:表示需要登录权限才能打开网页。未经许可,您根本看不到具体内容。普通用户无法获取或获取成本高。百度搜索引擎将减少其出现的机会。不包括以登录为主要功能的网页。
2) 资源获取权限:指获取网页的主要内容,如文档、软件、视频等,需要权限或需要安装插件才能获取完整内容。这时候会出现三种情况:
• 网站 提供优质正版内容,由于内容建设成本高,虽然查看全文或下载需要权限或插件安装,但在用户预期之内,百度搜索引擎不认为权限行为对用户造成危害,将其视为正常的可访问页面。
• 对于一些非优质、非正版资源,来自用户转载甚至机器采集,本身成本低,内容不唯一,用户访问资源有权限限制——用户需要注册并登录或付费才能查看。百度搜索引擎会根据具体情况决定是否调整显示。
• 还有一些视频和下载资源页面。或许他们自己的资源质量还不错,但是他们需要安装非常冷门的插件才能正常访问。例如,当需要安装“xx大片播放器”时,百度搜索引擎就会怀疑其有恶意倾向。
示例参考:
例子
无障碍
阐明
案例3.2-1
好的
CNKI上的一篇论文只能付费下载,但是有版权,浏览体验好
案例3.2-2
好的
优酷看新电影需要付费,浏览体验不错。
案例3.2-3
中间
内容已复制,但需要登录才能查看更多
案例3.2-4
区别
入党申请表本身是转载的,网上到处都是,但是这个页面还是需要付费下载。
3、无效网页
它通常指具有死链接和主要资源故障的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长设置此类网页,及时登录百度站长平台,并使用死链提交工具通知百度搜索引擎。
无效网页包括但不限于:
•404、403、503等网页;
• 程序代码错误网页;
• 打开后提示内容被删除,或内容已不存在而跳转到首页的页面;
• 收录已删除内容的论坛帖子、已删除的视频页面(主要出现在 UGC 网站上)