百度历年搜索打击算法及SEO应对措施建议

优采云 发布时间: 2020-06-19 17:05
        近日,百度搜索把历年来出台的个个算法重新整理归纳,最新上线《百度搜索算法规范详解》,并按照页面内容质量、用户需求满足、用户体验友好、搜索公正及用户安全等常见网站违规问题将算法分为了四个维度,解述每个算法重点打击的违规问题,本文逐个解释,并提供一定的应对措施,以供参考。


关于页面内容质量
1.1 飓风算法 3.0 ——主要针对页面内容质量问题
       飓风算法主要针对网站恶劣采集文章问题和跨领域采集问题,还有站群问题。
       应对措施:a.用智能伪原创应对恶劣采集,同时控制采集量和范围,不要短时间大批量采集,不要集中采集某一个网站。b.注意采集紧扣网站主题,做游戏的不要采卖衣服的文章,做美容的不要做财经类的文章。。。

1.2 劲风算法 ——主要针对恶劣聚合页问题
       劲风算法主要打击恶意构造聚合页,页面不提供文章主体内容,大量采集拼凑内容,页面内容与标题及页面中标记的标签不符等问题对搜索用户的影响。
       应对措施:只要网站有真实的文章内容,聚合页面来自真实的文章聚合,链接指向实际的文章页,标题、Tags与所展示的内容相关度高,就不会触发该算法。这也是优采云采集要计算文章相关度的原因。

1.3 细雨算法2.0 ——主要针对B2B领域低质问题
       细雨算法主要打击B2B行业企业网站:标题作弊及误导,title中堆砌相近关键词,title中穿插特殊符号,title中穿插广告信息,正文大量采集,空白页内容不完整,随意拼凑,乱排版,利用字符大量穿插广告,配图附带水印广告,商品信息价格不对称,虚假功能等问题。
       应对措施:稍微考虑一下页面的可读性,做广告不要丧心病狂,确保是一个正常的标题,正常的正文内容,就可以了吧。

1.4 蓝天算法 ——针对目录交易问题
       蓝天算法主要打击新闻类站点售卖软文、目录等问题。
       应对措施:这个打击可能口号大于效果,卖二级目录的情况,如果二级目录做的内容与主站差异大,那就跟上面飓风3.0说的“跨领域采集”差不多的意思;但是卖软文,这个东西应该没那么容易被检测到,之所以叫软文,就是因为它够“软”,虽然算法上确实可以从文章中检测出一些营销意图,但要以此为依据判定站点违规,是需要非常谨慎的。

2. 用户需求满足
2.1 清风算法1.0——主要针对页面标题违规问题
       清风算法1.0主要打击通过页面标题作弊,标题和页面内容不相符,欺骗诱导用户点击,非官方网站但标题为官网,标题关键词大量重复 标题大量堆砌语义相近的关键词标签,标题表述部分虚假,欺骗用户并获得点击的行为。
       应对措施:这里主要说的两个问题,一是标题党,二是关键词堆砌。对采集来说,通过计算标题与正文的相关度,再适当伪原创就可以了。关键词堆砌问题,尽量不要用几个关键词拼凑在一起做标题。

2.2 清风算法3.0——主要针对下载站违规问题
       清风算法3.0主要打击下载站点及智能小程序的欺骗下载、捆绑下载,诱导下载,虚假软件和窃取用户隐私等伤害用户的行为。
       应对措施:从算法实现上来说,除非百度对这些下载站点进行抽样,自动下载对应的文件,然后在他们的沙盒中运行,检查所下载的资源是否合规,但是个人认为可操作性不高,比如加密的怎么办?其他方面就更不容易拿到证据。

2.3 信风算法——针对虚假翻页诱导问题
       信风算法主要打击网站或智能小程序利用翻页键诱导用户跳转网站目录页和站外广告的行为。
       应对措施:虚假翻页算是比较好检测的,通过人工智能算法,训练一个模型来判断两个页面属于同一篇文章的概率,容易实现。因此,好好做分页就对了,或者干脆不分页。

3.用户体验友好
3.1 冰桶算法5.0——主要针对移动落地页体验问题
       冰桶算法5.0主要打击落地页加载速度过慢,排版布局不规范,落地页乱插入虚假广告,色情广告,网站未做移动适配自适应、小程序功能不符合用户习惯等问题
应对措施:
        速度问题,这是有前后端一起来协同保障的。硬件配置、带宽配置、程序和数据库逻辑、缓存和cdn、页面加载的js、css、图片等等都有影响,百度MIP本身是为解决这个问题而生的,不过死掉了。
        排版就不说了,稍微规范一点就是了。
        落地页广告问题,因为现在的蜘蛛都是会渲染js的(所谓的渲染蜘蛛),所以不要以为js加载的广告就检测不到。解决的话,其实深入研究百度蜘蛛,完全可以把蜘蛛的一些特征记录下来,比如IP、UA、甚至一些其他HTTP参数,然后做一个过滤,当渲染蜘蛛来访时,不要展示任何广告代码给它。不过即便如此,还是有风险的,风险在于手机百度APP或者百度浏览器,个人猜测,如果用户用手机百度APP浏览某网站,渲染出了广告,APP有没有可能把这个信息反馈给搜索部门?无从验证。。。
        移动适配问题,在现在这个年代,应该已经没有人忽视了,都知道需要适配,需要注意的是,正确处理好页面之间的跳转关系。
        顺便说一下转码问题,百度转码也是一个专门的蜘蛛,只要把它识别出来,不让它抓取,那就不会转码。

3.2 内容权限规范——针对用户权限问题
       关于权限问题主要打击 强制用户完成网站注册或登录 强制用户下载相关APP 强制用户在APP内查看内容 强制用户完成其他要求行为。
       应对措施:这个问题是普遍存在的,只是程度不同,特别是粉丝经济盛行的当下,动不动就需要注册登录,或者安装APP,包括很多百度系的网站,也在肆无忌惮的要求你安装各种APP。不过我倒是觉得,强扭的瓜不甜,让用户自己决定吧。

4.搜索公正及用户安全
4.1 惊雷算法2.0 ——主要针对恶意刷点击问题
       惊雷算法主要打击刷网站恶意制造作弊超链”和“恶意刷点击”的作弊行为。针对作弊的网站,将会受到限制搜索展现、清洗作弊链接、清洗点击的处理,并会将站点作弊行为计入站点历史,严重者将永久封禁。
       应对措施:这样的操作之所以存在,就是因为这是搜索引擎本身的软肋,不管怎么讲,搜索引擎必定需要统计点击行为来调整页面排序,也必须考虑链接投票问题。不过,算法上可以进行一些识别,比如访问者的地域分布、时间分布、停留时间、用户cookie等等。总的来说,这不会是一个一刀切的算法,必定有所权衡,有所宽容。也正因如此,快排行业才能经久不衰。

4.2 烽火算法3.0 ——主要针对恶意劫持行为
       烽火算法3.0主要打击网站“窃取用户数据”,跳转劫持,后退劫持等恶意劫持站点的行为,针对作弊的网站将会,进行限制站点在搜索结果中的展现,严重的永久限制站点展现。
       应对措施:我个人也做过跳转劫持和后退劫持,操作方式还是先要识别蜘蛛,只要是蜘蛛在访问页面,我就不劫持它,事实证明这样的做法在很多时候都是有效的,但不绝对。后来,也是手机百度APP,干脆关掉了后退功能。因此不得不说,百度也不是万能的。

4.3 被黑相关——针对网站被黑问题
       网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面,出现以上页面说明网站安全存在严重问题或漏洞,需要及时处理防范。
       应对措施:网站漏洞是一方面,但是想要省心的话,上一个cdn也不错,一般能防止大部分漏洞探测和恶意执行。还有什么云锁、D盾等等。如果一定要自己做防护,或者漏洞修补,我个人跟织梦斗智斗勇多年,对织梦比较有体会,操作也不复杂,各个文件夹的权限设置好,再把不需要的提交都过滤掉,比如,我一个普通文章站,又不需要投稿不需要评论,那直接把前台所有POST都禁用不就好了。。。
 
 
以上就是近年来百度算法和一些应对措施,个人想法,欢迎探讨。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线