免规则采集器列表算法(百度搜索飓风算法2.0所覆盖的问题点以及站长们应该怎么做)

优采云 发布时间: 2022-04-09 15:09

  免规则采集器列表算法(百度搜索飓风算法2.0所覆盖的问题点以及站长们应该怎么做)

  2018年9月20日,百度正式发布公告,为营造良好的互联网内容搜索生态,保护用户的搜索阅读和浏览体验,保护百度搜索引擎中优质内容生产者的合法权益,百度官方网站将于2018年9月发布。飓风算法将于6月下旬升级。

  一周前,百度发布公告“百度搜索将上线飓风算法2.0,严厉打击不良采集行为”,今天我们将详细讲解飓风算法的覆盖范围2.0 个问题,站长应该怎么做。

  飓风算法主要包括四种不良采集行为,如下:

  1、更明显的采集跟踪行为

  网站收录大量内容采集,是从其他网站、公众号、自媒体等转来的。采集后面的信息没有整理排版混乱,结构差,缺少一些功能,文章可读性差,有明显的采集痕迹,用户阅读体验特别差。

  示例:采集文章的内容收录不可点击的超链接,功能缺失,采集痕迹明显。如下所示

  

  整改建议:网站发布的内容,要注意文章内容的排版和排版,不得出现与文章主题弱相关或无关的信息。不允许使用@文章 或不可用的功能。干扰用户的浏览体验。

  2、body内容有拼接行为

  网站采集多个不同的文章拼接或叠加。文章整体内容没有形成完整的逻辑,阅读不流畅,段落不连贯,文章话题多等问题无法正常满足用户需求。

  例子:文章正文前后的内容没有关系,逻辑不连贯。如下所示

  

  整改建议:百度严禁使用采集器、采集软件等编辑工具采集随意制作拼接内容。制作大量对用户有价值的优质原创内容。

  3、广泛的内容采集行为

  网站中文章的大部分内容都是采集。质量较低。

  整改建议:百度鼓励网站运营商大力制作优质原创内容,对原创内容给予保护。如需转载,需注明内容出处(如:转载内容注明新闻、政策等出处将不视为采集内容)。

  4、跨域采集内容行为

  网站通过采集大量与本站域名不一致的内容获取流量的行为。

  示例:Education 网站 发布与食品行业相关的内容。如下所示

  

  整改建议:百度鼓励网站制作文章和该领域的内容,通过专注于该领域获得更多搜索用户的青睐。不要试图采集跨域内容来获取短期利益。这样做会降低域焦点并影响 网站 在搜索引擎中的表现。

  总结:

  综上所述,飓风算法2.0旨在保障搜索用户的浏览体验,保障搜索生态的健康健康发展。对于任何违反网站的行为,百度搜索将使用网站对存在问题的严重性进行相应的限制搜索展示,情节严重的将给予永久停牌处分。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线