2018百度飓风算法2.0剖析,采集不行了?
优采云 发布时间: 2020-08-11 01:38导读:
百度将在9月下旬推出飓风算法2.0,打击低质量站点,细化四类采集行为,进一步提高用户阅读浏览体验,保护原创内容。
一、下面回顾一下飓风算法
百度在2017年7月,推出飓风算法的内容
打击目标:大量进行恶劣采集低质量内容的网站。打击通过大量采集的行为快速降低内容,以推动收录的做法,以保护原创内容。净化搜索引擎索引。
主要是针对站群的严打,批量群发,利用工具批量采集并发布的站点。
2018百度飓风算法2.0来了
二、飓风算法的主要内容
飓风算法主要收录以下四类恶劣采集行为
2018百度飓风算法2.0剖析
1、采集痕迹显著
详细说明:站点存在大量从其他站点或公众号采集、搬运而至的内容,信息未经整合,排版混乱,部分功能缺位或文章可读性差,有显著采集痕迹,用户阅读体会太差。
直接搬运第三方平台的内容,无排版,用户体验差
2、内容拼接
详细说明:采集多篇不同文章进行拼接,整体内容未产生完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。
内容拼接,无逻辑,无价值
3、站点存在大量采集内容
详细说明:网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。
大量采集,也就是飓风算法1.0严打的目标
4、跨领域采集