【干货】智能采集组合文章搜索技术探究(组图)

优采云发布时间: 2021-06-23 19:01

　　智能采集组合文章搜索技术探究智能采集+推荐就是有很多条件不断的触发你的采集任务。在这些条件触发的时候，你去组合它的内容，最终你的推荐内容很可能就和这些条件相关联。我对人工智能的未来抱有很多的憧憬，甚至把它看成未来的一个赛道。这篇文章能够给我这样的憧憬一个新的平台。同时，未来将会有更多的细分赛道被开发出来。

　　下面我们将解析了智能采集+推荐中，一个细分领域。本系列文章重点分析，在采集+推荐系统方面的一些理论。然后是hci的应用案例。数据挖掘这一章我们讲了，最近很火的一个平台数据挖掘。关于这一点，我也做了非常多的努力，包括和kdd竞赛的技术合作以及对其他图书馆的研究。数据挖掘，是在开发过程中，把相应的数据挖掘规则或机器学习算法，串起来形成的一个规则。并且把原始的数据和机器学习算法串起来。基于这个目的来做数据挖掘和机器学习，也是一个相对不错的方向。

　　其实，我的理解，与题主有些相似，可以分享一下我的一些思考。对于机器学习的理解，我觉得按照有没有监督的分，主要可以分为两种：监督的机器学习和无监督的机器学习。监督机器学习，相当于是有一定的目标输入与输出，最终得到某一种数据分布形态。无监督机器学习，顾名思义，像你没有固定的目标与输入，而是固定的任务与输出。

　　那么我们会经常遇到分类、聚类、关联分析等这些问题，在这里我就不再过多描述。同样，还可以把无监督机器学习分为两类：强监督与弱监督，也就是regularization与warmup。我认为，在强监督的基础上加入warmup，能够帮助强监督的机器学习效果更佳。另外，我觉得弱监督与监督不能够区分好坏，因为这取决于我们的研究方向、现实需求。

　　举个栗子：比如，如果只能够判断电动汽车的一些安全性问题，或者是机器学习只能有一些性能指标，那么做监督就无法达到我们想要的效果。但若是针对是如果对电动汽车的机械性能改进，并且大范围的加入新的电机等部件，利用超参数调节的方法，根据里面的知识构建更加通用的机器学习模型，作为弱监督来学习，可能就能够达到比监督更好的效果。

　　另外，我想说的是，对于弱监督，其实是可以挖掘出电动汽车的一些奥秘的。另外，我们可以将弱监督机器学习的分类看作如下图所示，所谓的在弱监督基础上加入warmup，主要就是为了挖掘出我们曾经忽略或者未知的状态、描述等。下面是弱监督的分类：机器学习在我看来是包含几个主要方面的：分类（instancesegmentation）聚类（clustering）模型不同大小、不同数量的状态需要的训练数据量是不同的，根据我们的研究方向。

0

2021-06-23

智能采集组合文章

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

【干货】智能采集组合文章搜索技术探究(组图)

0 个评论

发起人

AI时代内容工厂

【干货】智能采集组合文章搜索技术探究(组图)

0 个评论

发起人

相关问题