技术文章:百度算法大盘点——网站内容质量
优采云 发布时间: 2020-11-06 09:00百度算法广告资源-网站内容质量
1.1飓风算法2.0——严重打击采集不良行为
百度搜索于2017年7月4日发布了飓风算法,以解决严峻的采集问题,并于2018年9月13日宣布,飓风算法已升级到2.0版本。
飓风2.0算法主要针对以下四种采集不良行为:
1.来自其他站点或官方帐户以及其他内容生产者的许多内容采集。内容已传输。信息不集成,布局混乱,文章可读性差,有明显的采集痕迹,对用户没有任何增值。
问题示例1:文章带有明显的采集痕迹
2.具有多段文章拼接内容,文章逻辑欠佳,不能满足用户需求,阅读体验也很差。
问题示例2:文章内容拼接
3.网站上有大量采集内容,网站自己的内容生产力非常差。
4.网站收录大量采集内容,这些内容与该网站的主题无关,而且域名集中度很低,恶意流量也很大。例如:科学技术网站 采集很多娱乐八卦,社交新闻等。
问题示例3:学习网站发布食物内容
有关飓风算法的更多信息,请参阅:
2018.9.20 [官方声明]飓风算法2.0解释
2018.9.13百度搜索将启动飓风算法2.0,严厉打击不良的采集行为
2017.7.4百度启动了飓风算法以严厉打击严酷性采集
1.2细雨算法——B2B领域的受益行为
2018年6月,百度搜索发布了细雨算法,以规范和指导B2B行业中的网站利益问题。
毛毛雨算法主要解决以下问题:
1.该页面的标题具有欺骗性和误导性,主要表现在以下四个类别中:
(1)不是公司的官方网站,标题中收录诸如“官方网站”之类的字眼,误导搜索用户以为它是官方网站
问题示例4:
([2)页面标题类似于关键词;
问题示例5:
([3)页面标题中插有火星文字或特殊符号,这会影响正常阅读;
问题示例6:
([4)页面标题散布着许多有益的方式。
问题示例7:
2.页面的正文内容中收录有收益信息,主要包括以下三种类型的问题:
(1)正文内容不完整,经常散布着变形的好处。