方法描述基于内容的推荐(Content-basedRecommendation)是什么?
优采云 发布时间: 2021-03-21 02:12方法描述基于内容的推荐(Content-basedRecommendation)是什么?
方法说明基于内容的推荐是基于项目的内容信息进行推荐,而不是基于用户对项目的评估意见,
Xi的方法从示例中获取有关内容字符描述的用户兴趣信息。
内容过滤主要使用自然语言处理,人工智能,概率统计和机器学习等技术。
通过相关特征的属性定义项目或对象。该系统根据用户评估对象的特征来学习用户的兴趣,根据用户*敏*感*词*与要预测的项目之间的匹配程度提出建议,并努力将其推向客户
推荐与您之前喜欢的产品类似的产品。
在基于内容的推荐系统中,项目或对象由相关特征的属性定义。系统根据用户评估对象的特征,学习用户的兴趣,并检查用户数据和要预测的项目
匹配程度。用户的数据模型取决于所使用的学习方法,常用的是决策树和神经。
基于网络和矢量的表示方法等。基于内容的用户信息需要用户的历史数据,
用户*敏*感*词*模型可能会随着用户偏好设置的改变而改变。
要实现内容推荐系统,通常需要执行4个主要步骤:
1、采集数据,
2、过滤数据,
3、分析数据,4输出结果。
技术难题1:如何实现新闻文本的过滤和下载。
难题2:如何量化新闻,提取关键词,最后完成数学建模。
难题3:如何使用基于内容的推荐技术为每个用户建立用户模型。
难题4:如何以编程语言实现这些软件功能?这是软件设计过程中最困难的部分。
一个难题。
通常,在个性化推荐系统中,用户会根据其关注程度对已查看的对象进行评分。推荐系统根据用户对观看对象的评分来预测用户对未观看对象的评分,然后根据预测分数对未观看对象进行排序,并呈现给用户。
摘要中,推荐系统是一种可以预测用户对未查看对象的评分的系统。推荐系统对未查看对象的评分方法是推荐算法。主要有三种推荐算法:①,协同过滤推荐方法,②,基于内容的推荐方法,③,混合推荐方法。
①。协同过滤是一种使用集体智慧的典型方法。
协作过滤通常是为了发现大量与您相似的用户中的一小部分。在协作筛选中,这些用户成为邻居,然后根据他们喜欢的其他内容将它们组织到一个分类目录中,作为对您的推荐。
例如,如果您想现在看电影,但又不知道看哪部电影,该怎么办?大多数人会问周围的朋友最近是否有好的电影推荐,我们通常更喜欢从口味相似的朋友那里获得推荐。这是协作过滤的核心思想。
与集体智慧相比,协同过滤在一定程度上保留了个人特征,即您的喜好,因此它可以更多地用作个性化推荐的算法思想。
二、协作过滤的实现步骤:
1),采集用户偏好设置
有必要从用户的行为和喜好中发现模式,并据此提出建议。如何采集用户的偏好信息成为系统推荐效果的最基本决定因素。用户可以通过多种方式向系统提供自己的偏好信息,并且不同的应用程序可能会非常不同,例如:
用户行为类型的作用
评分是通过用户对商品的评分明确显示的,并且可以准确地获得用户的喜好
通过用户对项目的投票明确投票,可以更准确地获得用户的偏好
通过用户对该项目的投票明确地重新发布,您可以准确地获得用户的偏好。
如果它在网站上,您还可以推断转发者的偏好(不准确)
保存书签表明可以通过用户对项目的投票来准确获得用户的偏好。
标签标签显示可以通过分析用户标签来获得用户对项目的理解,同时可以分析用户的标签。
情感:喜欢或讨厌
评论显示,通过分析用户的评论,您可以了解用户的情绪:喜欢还是讨厌
2),找到相似的用户或项目
在分析用户行为并获得用户首选项之后,我们可以根据用户首选项计算相似的用户和项目,然后根据相似的项目进行推荐。这是最典型的基于CF分支项目的CF之一。
3),基于计算推荐项的CF
例如,对于商品A,根据所有用户的历史偏好,喜欢商品A的用户喜欢商品C,可以得出结论,商品A和商品C相似,并且用户C喜欢商品A,然后用户C可以推断出也可以像商品C一样。商品C相似,并且用户C喜欢商品A,那么可以推断出用户C也可能喜欢商品C。
基于项目的CF的基本原理
②,基于内容的推荐方法
推荐与用户过去感兴趣的对象相似的对象。这种方法是协作过滤的延续和发展。它主要借鉴信息提取和信息过滤的研究成果,并根据推荐项目的内容特点。提出建议。
③,推荐的混合方法。
这是以上两种方法的组合。
可以看出,如果要构建个性化的新闻推荐系统,最理想的方法是使用协作过滤推荐方法。
但是,明智的建议主要基于大量数据的计算和处理。但是,对海量数据运行高度复杂的算法(例如协作过滤算法和其他推荐策略)非常困难。
与智能推荐相比,基于内容的推荐方法更适合只需要基本推荐功能的新闻推荐系统。在使用该方法的系统中,推荐对象由其内容的特征表示,并且推荐系统通过学习用户的兴趣并比较用户模型与推荐对象之间的相似性来实现特征提取。文本内容的特征相对容易提取,最常见的在线新闻是文本新闻。
因此,在本文所述的网络新闻系统中,基于内容的推荐方法相对有效。
基于内容推荐机制的基本原理
首先,我们需要对新闻元数据进行建模。在这里,我们仅简要描述新闻的类型;然后使用新闻元数据查找新闻之间的相似性,因为类型均为“文化,科学和教育”新闻A和C都被视为相似新闻;最后,实现建议。对于用户A,他喜欢看新闻A,然后系统可以向他推荐类似的新闻C。
这种基于内容的推荐机制的优势在于,它可以很好地模拟用户的口味并提供更准确的推荐。但是它也存在以下问题:
1需要对商品进行分析和建模,建议的质量取决于商品模型的完整性和全面性。在当前应用程序中,我们可以观察到关键词和标签(标签)被认为是描述项目元数据的一种简单有效的方法。
2对项目相似性的分析仅取决于项目本身的特征,这里不考虑人们对项目的态度。
3因为有必要根据用户的过去偏好历史记录进行推荐,所以新用户会遇到“冷启动”问题。
新闻推荐系统的*敏*感*词*
新闻采集模块:
主要负责来自Internet的采集新闻信息,主要使用国内知名新闻门户网站作为其新闻源。例如:搜狐,新浪,新华网,凤凰网等。在此项目中,仅凤凰网将用作新闻源。 采集到达新闻后,它将从页面中提取正文内容并将其保存在数据库中。作为一个更实用的新闻推荐系统,有必要使推荐新闻保持最新,也就是说,该模块还应负责管理系统中的活动新闻。如果新闻发布时间超过某个时间限制,则将其视为过期。并将其标记为已存档,并且不会出现在以后的推荐列表中。
新闻推荐模块:
主要负责响应用户请求,生成新闻推荐列表,并将列表返回给用户。修改模块中使用的算法是基于内容的推荐算法。另外,在推荐结果中,由于最新消息按时间排序且内容是随机的,因此最新消息将被整合到推荐列表中。
资源调度模块:
主要负责监视系统的当前负载,根据算法调整新闻数据的保存及时性,从而保证新闻的实时性,并控制新闻的数量;另外,有必要调用推荐算法进行相似度计算和计算。
在浏览新闻的过程中,用户的使用习惯主要包括诸如使用时间,阅读新闻类别(国际,社会,科学,教育,IT,医疗等),每日新闻阅读时间和频率等信息。 。,并且此信息全部应记录在用户数据库中。然后,由用户建模模块执行数据分析,最终生成用户模型并将其存储在用户模型数据库中。
该模块还必须定期运行以不断更新用户模型,以便可以将兴趣转移实时反映在用户模型中。
监控系统资源,根据负载情况实时调整计算资源的分配,以保持系统稳定的响应时间。
分类用户对不同主题的兴趣特征。
计算并使用用户关注某个新闻的时间长度,并将其用作用户对该新闻的关注
度数指标。
用户兴趣挖掘:用户数据获取的语义预处理,文本分类,用户兴趣模型,文本分类技术:文本分割关键词特征值离散化关键词提取和分类新闻推荐模块