抓取网页音频(基于人口统计的用户兴趣矩阵分析推荐系统(一))
优采云 发布时间: 2022-01-20 04:06抓取网页音频(基于人口统计的用户兴趣矩阵分析推荐系统(一))
抓取网页音频是单向向量模型,推荐算法是协同过滤模型,在最后或者第一轮会计算模型的排名。在lsh中,两个模型差异还是很大的,协同过滤会更精准。
协同过滤是随机森林算法中对观察到一个个特征到目标点的映射,通过特征的相似度作为评价依据,进行排序,计算排序后,再把信息也打向gbdt中。
协同过滤是对所有的观察结果累加后进行排序,然后根据排序重新打向gbdt中。每一次gbdt对特征求解特征重要性矩阵,进行排序,然后再把相关性值高的观察结果打向gbdt中。
协同过滤是个好东西,语音识别就是用它实现的。因为语音识别结果基本都是相似的,所以它的更新规律可以写出如下公式:而且似乎还可以把训练样本算成一样的,训练简单。但是注意啦,这个特征重要性矩阵没有真正对我们有用,当样本特征重要性不同时,不同特征得到的最优模型也不同,所以我们还需要一种nn网络结构来处理。(当时我就觉得这个矩阵用向量来表示不好,但是没人指正我,我能理解)特征重要性矩阵,对于模型理解的帮助非常大,一句话形容,帮助你从不同的数据集中找到最优的模型。
推荐算法是匹配模型推荐系统是粒度最细致的模型工具。推荐系统可以细分为query、timestep和context,一个推荐系统可以分为:1.询问用户的内容推荐;2.内容推荐给用户;3.用户查询的各种“回合”推荐。目前推荐系统上大多开发以timestep为粒度的推荐算法,主要有以下几类:1.基于人口统计的用户兴趣矩阵分析推荐系统,即基于兴趣词表的算法,marketing-drivencontextengineering2.基于产品偏好的用户兴趣矩阵分析推荐系统,即基于用户偏好的推荐算法,marketing-in-the-position3.基于用户/历史行为的兴趣矩阵分析推荐系统,即基于用户历史行为的推荐算法,customer-based4.社会化推荐,主要是recommendationfrommarketingfromsocialmedia等等。欢迎关注微信公众号:机器学习笔记本。