免规则采集器列表算法( 百度新推出劲风算法,打击恶意获取流量的聚合页)
优采云 发布时间: 2021-11-07 13:17免规则采集器列表算法(
百度新推出劲风算法,打击恶意获取流量的聚合页)
强风算法后网站如何整改恢复
近期,百度推出金峰算法,主要打击恶意获取流量的聚合页面。当一个算法在百度上线时,站长可以通过过去的历史数据趋势图或者网站监测到的一些功能来了解这些算法对自己的影响网站。
1、对于网站领域太分散
建议确定一个主要领域,去除其他领域的内容机器人,屏蔽搜索引擎抓取,不再参与搜索引擎排名;
或者删除其他字段的内容,将删除内容的URL提交到百度搜索资源平台404,确保网站安全。
2、对于不一致的文字
您可以查看每个聚合页面的主题,以确保聚合页面下的内容与当前聚合页面主题的扩展相关。
通过内容相似度计算的方式提取和计算网页中的正文。获取当前聚合页面的主题和内容之间的相似度分数。
并且通过实际观察,确保相似度得分在哪个值,才能解决搜索用户的需求。
3、用于搜索批量生成
大大提高了搜索检索到的内容的相关性,从而增强了用户体验。
使用相似度判断方法,让编辑辅助聚合页面的内容编写(规划的相似度分值)。
如果最终还是不能保证满足用户需求,建议删除或者操作机器人。
4、对于内容为空或太少,甚至无效
首先,搜索和整理更多类别的内容,提高聚合页面下内容的整体丰富度,保证前期的相关性。
其次,可以对聚合页面关键词进行分类。
例如:爬虫爬虫、爬虫算法、搜索引擎爬虫、baiduspider,都被认为是一种聚合页面。
当内容为空或少于X项时,可以通过展开检索到的维度来完成。
另外,由于404页面已经被收录或者爬虫爬过,建议提交百度搜索资源平台的死链接提交工具,以确保搜索引擎不认为有很多 网站 死链接。