关键字采集文章(【干货】如何利用机器学习来*敏*感*词*地学习更多特征间的关系)
优采云 发布时间: 2021-09-25 19:11关键字采集文章(【干货】如何利用机器学习来*敏*感*词*地学习更多特征间的关系)
关键字采集文章详情地址和域名以及.haosite目前搜索了几篇paper,formerlyadoptedongithub。虽然我对svm也没有特别多的经验,但是从模型讲解到数据集准备到文章解读以及各种对比数据集列一下,应该足够了。
核心在于1.正确理解attention原理2.数据处理与模型设计的平衡
相比特征工程技术,attention在end2end过程中更重要,这两年人工智能的持续发展与attention相关的算法越来越多。paper的看点应该是怎么利用机器学习来*敏*感*词*地学习更多特征间的关系,这里有几个关键点可以讲讲。1.什么是好的特征?这里有几个需要说明的东西。首先,一个特征是否能够解决一个相同的问题,是很难衡量的,一个相同的特征可能面对不同的问题会是不同的特征。
所以第一,要清楚自己的业务模式里对特征的需求。即,明确对同一问题在不同环境下有不同的需求,请考虑不同的特征可能带来的业务价值。其次,特征是否有用?这里包括如何获取,如何解释,如何交叉组合,单一特征是否足够。比如,如果需要*敏*感*词*地关联多个社交关系,那么这样的特征是否可以被其他维度提取出来使用。2.特征的好坏如何判断。
一个好的特征是否有区分度,是否带来模型的性能提升,是否能提升最大化预测精度。目前考虑更多的还是分类问题。我个人推荐先验的纬度比较重要,个人认为。特征的数量和类别越少越好,比如k维,特征可以选择的维度并不多。3.如何优化特征,让其能够被提取出来。特征需要有交叉组合,这样的特征可以通过相对多的特征或者多个特征进行组合解决问题。
数据的话,一个好的特征可以有用模型的价值,或者有的能给模型带来意外的好处。比如有的可以很好地帮助决策树整体提升预测准确率。