【干货】智能采集组合文章搜索技术探究(组图)
优采云 发布时间: 2021-06-23 19:01【干货】智能采集组合文章搜索技术探究(组图)
智能采集组合文章搜索技术探究智能采集+推荐就是有很多条件不断的触发你的采集任务。在这些条件触发的时候,你去组合它的内容,最终你的推荐内容很可能就和这些条件相关联。我对人工智能的未来抱有很多的憧憬,甚至把它看成未来的一个赛道。这篇文章能够给我这样的憧憬一个新的平台。同时,未来将会有更多的细分赛道被开发出来。
下面我们将解析了智能采集+推荐中,一个细分领域。本系列文章重点分析,在采集+推荐系统方面的一些理论。然后是hci的应用案例。数据挖掘这一章我们讲了,最近很火的一个平台数据挖掘。关于这一点,我也做了非常多的努力,包括和kdd竞赛的技术合作以及对其他图书馆的研究。数据挖掘,是在开发过程中,把相应的数据挖掘规则或机器学习算法,串起来形成的一个规则。并且把原始的数据和机器学习算法串起来。基于这个目的来做数据挖掘和机器学习,也是一个相对不错的方向。
其实,我的理解,与题主有些相似,可以分享一下我的一些思考。对于机器学习的理解,我觉得按照有没有监督的分,主要可以分为两种:监督的机器学习和无监督的机器学习。监督机器学习,相当于是有一定的目标输入与输出,最终得到某一种数据分布形态。无监督机器学习,顾名思义,像你没有固定的目标与输入,而是固定的任务与输出。
那么我们会经常遇到分类、聚类、关联分析等这些问题,在这里我就不再过多描述。同样,还可以把无监督机器学习分为两类:强监督与弱监督,也就是regularization与warmup。我认为,在强监督的基础上加入warmup,能够帮助强监督的机器学习效果更佳。另外,我觉得弱监督与监督不能够区分好坏,因为这取决于我们的研究方向、现实需求。
举个栗子:比如,如果只能够判断电动汽车的一些安全性问题,或者是机器学习只能有一些性能指标,那么做监督就无法达到我们想要的效果。但若是针对是如果对电动汽车的机械性能改进,并且大范围的加入新的电机等部件,利用超参数调节的方法,根据里面的知识构建更加通用的机器学习模型,作为弱监督来学习,可能就能够达到比监督更好的效果。
另外,我想说的是,对于弱监督,其实是可以挖掘出电动汽车的一些奥秘的。另外,我们可以将弱监督机器学习的分类看作如下图所示,所谓的在弱监督基础上加入warmup,主要就是为了挖掘出我们曾经忽略或者未知的状态、描述等。下面是弱监督的分类:机器学习在我看来是包含几个主要方面的:分类(instancesegmentation)聚类(clustering)模型不同大小、不同数量的状态需要的训练数据量是不同的,根据我们的研究方向。