免规则采集器列表算法(推荐引擎示例教程:*敏*感*词*创建体验业务21天搭建个性化推荐系统)

优采云 发布时间: 2021-09-07 10:25

  免规则采集器列表算法(推荐引擎示例教程:*敏*感*词*创建体验业务21天搭建个性化推荐系统)

  推荐引擎产品介绍

  推荐引擎示例教程:手工打造体验业务

  21天打造个性化推荐系统

  为什么选择推荐引擎?

  1 接入简单方便,快速实现APP或WEB网站的个性化功能,内置多种算法模板,节省90%的程序体积;

  2 算法开放,支持企业集成自己的算法。您的数据团队将实际参与业务算法的开发,帮助企业人才的培养和成长。

  3 无需算法即可优化。建议算法流程白盒化,不懂算法的业务人员也可以参与配置。

  概述

  推荐引擎(Recommendation Engine,以下简称RecEng,特指阿里云推荐引擎)是建立在阿里云计算环境中的推荐服务框架。目标是让广大中小型互联网公司能够快速使用这个框架。构建满足您自己业务需求的推荐服务。

  推荐服务通常由日志采集、推荐计算和产品对接三部分组成。推荐服务首先需要将采集产品中记录的用户行为日志离线存储,然后在离线环境中使用推荐算法进行用户和物品的匹配计算,找到可能匹配的物品集合后每个用户感兴趣的,这些是预先计算的结果推送到在线存储,最终产品,当用户访问时,通过在线API向推荐服务发起请求,获取可能感兴趣的物品用户,完成推荐服务。

  

  RecEng的核心是推荐算法的定制化。 RecEng 为推荐业务定义了一套完整的规范。从输入,到计算,再到输出,客户可以在这个框架下自定义算法和规则,满足各个行业的需求,包括电商、音乐、视频、社交、新闻、阅读等。同时,RecEng还为客户提供相应的方法,方便客户访问用户访问日志,定制在线API以满足自身业务需求。

  

  离线计算

  离线计算模块包括推荐服务、场景、离线算法流程的创建、编辑、删除,支持算法流程任务的启动、停止、日志查看,提供默认离线推荐算法模板,创建自定义算法模板。在推荐引擎中,离线过程和效果过程是离线计算的,这两种过程的数据规范在离线数据规范中定义。一般离线计算的输入输出都是MaxCompute(原ODPS)表,所以离线数据规范其实就是一套MaxCompute表格式规范,包括访问数据、中间数据、输出数据三种数据格式规范。访问数据是指客户离线提供的用户、物品、日志等数据。中间数据是指离线算法过程中产生的各种中间结果数据表。输出数据参考推荐结果数据表。结果最终会导入在线存储,供在线计算模块使用。

  在线计算

  推荐引擎在线计算的任务是在推荐API收到API请求时,对离线和近线修正产生的推荐结果进行实时过滤、排序和补充;后者主要处理用户行为的变化,当推荐项目更新时,离线推荐结果也随之更新。

  近线计算

  推荐引擎的近线计算主要处理用户行为变化和推荐项目更新时离线推荐结果的更新。与离线算法自然使用MaxCompute(原ODPS)表作为输入输出不同,近线程序的输入数据可以来自多个数据源,例如在线表存储(原OTS)、用户API请求或变量在节目中;输出可以是程序变量,或者写回在线存储,或者返回给用户。出于安全考虑,推荐引擎提供了一套SDK供客户自定义在线代码读写在线存储(表格存储),不允许直接访问,所以需要定义每种在线类型的别名和格式贮存。对于需要频繁使用的在线数据,无论是来自在线存储还是用户的API请求,RecEng都会提前读取并保存在在线程序的变量中。客户自定义代码可以直接读写这些变量中的数据。

  A/B 测试

  支持推荐算法流程的A/B测试,协助推荐算法的优化和改进。一个场景中允许多个推荐流程(rec_path)。对属于同一场景的不同推荐流程也进行 A/B 测试。在进行A/B测试时,同一场景下的每个推荐流程都会分配一定的流量,可以在产品界面进行配置。在执行推荐API时,推荐引擎会按照第一步的比例随机分配流量,将当前用户分配到某个推荐流程,然后执行这个推荐流程的在线流程。 RecEng分配流量时,完全是随机的,不遵循任何规则。例如,某个用户必须被分配到某个推荐流程。

  API

  推荐引擎提供多种API供客户用于业务系统连接,包括:启动数据预处理任务API、启动离线任务API、启动效果计算任务API、查询任务状态API、在线获取推荐结果(推荐API) ) )、在线数据更新API、系统日志采集API(日志API)。这些 API 需要客户集成。 RecEng 建议客户将这些 API 集成到自己的服务器上。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线