解决方案:采集与分析用户行为数据的意义
优采云 发布时间: 2022-11-22 06:26解决方案:采集与分析用户行为数据的意义
本文是用户行为数据领域的入门文章。适合对用户行为数据有一定了解,但又对这个话题很感兴趣的同学。
1个
什么是用户行为数据?
“用户行为数据”,顾名思义,是指用户在APP、小程序、WEB端等平台的行为(浏览、点击、滑动、长按等),通过数据上报给数据库embedding,记录一段时间内用户在不同平台上的Actions。
2个
采集
和分析用户行为数据的意义
公司内部存储的数据一般分为业务数据和用户行为数据,其中业务数据是与公司业务本身相关的数据,如订单支付数据(商品名称/ID、购买次数等)在电商行业、汽车行业 在线教育行业的销售数据(购买车型、经销商名称、车辆价格等)和在线教育的课程付费数据(课程名称、课程类别、课程价格等)行业; 用户行为数据反映了用户在不同平台的行为。
在数据分析和应用的过程中,两者是相辅相成的:用户行为数据需要辅之以业务数据,这样可以看到一笔订单支付了多少钱,买了什么商品;而业务数据也是离不开用户行为数据的载体,因为用户行为数据串起了用户在各个平台的行为序列,这样就可以看到用户在购买/转化之前做了什么动作。
此外,用户行为数据能够真实反映用户在平台上的行为,并可据此推断出用户的想法,从而及时进行相关的运营动作。
例如,很多APP为了优化用户体验,要求用户填写问卷,但真正愿意填写的用户却寥寥无几。如果用户对应用程序不感兴趣,他们就会离开并失去。退一步说,即使很多用户在优惠券等奖励的驱动下填写了问卷,结果也不一定代表用户的真实想法。有些用户可能为了获得奖励而随意填写,或者用户误解了选项的含义。导致有偏差的结果。
通过采集
和分析用户行为数据,我们可以观察到流失的用户在APP中做了什么,是什么导致流失的,从而帮助产品经理优化产品,降低用户流失的风险。
3个
采集
和分析用户行为数据的步骤
3.1
指标体系建设
很多公司在搭建自己的用户行为数据平台的时候忽略了这一步,以为采集
到行为数据就可以给我用,其实不然。一个好的指标体系具有以下优点:
" />
(1) 统一的指标体系可以避免数据指标定义模糊、逻辑混乱,降低数据解读成本;
(2)好的指标体系可以在一个核心指标出现问题的时候迅速进行维度拆分,从而定位问题,帮助产品/运营持续改进,甚至发现新的业务增长点;
(3)领导层平时很关注指标体系,尤其是核心业务指标。指标体系可以帮助领导层从全局出发制定战略目标。
指标体系的构建方法包括Polaris指标法、UJM(User Journey Map)模型和OSM模型。
其中,北极星指标法是指业务人员首先找到一个与业务目标强相关的核心指标(也称“北极星指标”,像北极星一样指引着未来的行动方向),然后逐步拆解指标向下。
比如电商场景,我们可以选择GMV作为“北极星指标”,然后按照新购/复购用户或者用户旅程步数等维度进行拆解,最后得到类似的东西to GMV=客单价**敏*感*词*数=客单价*(首次购买者+复购用户)=客单价*(APP上线/激活数*商品详情页渗透率(触屏率)*购买转化率+之前下单的老用户*留存率*商品详情页渗透率(reach rate)*购买转化率)。
在这个连续方程的第二步中,首先使用购买/复购用户维度进行拆分,第三步使用用户旅程步骤(开始-浏览商店页面-购买)维度进一步拆解。
3.2
数据采集
数据采集
也称为数据嵌入、代码嵌入或打点。就是在APP/小程序/WEB页面中嵌入一组数据采集代码,用户在触发事件(浏览、点击等)时会上报行为数据,从而形成用户行为数据表。
埋葬方法有以下几种:
(1)全埋点/无埋点:通过调用SDK(Software Development Kit)采集页面行为数据。该方案的优势在于无需开发人员编写代码,降低人工成本。一些通用数据(操作系统/版本、浏览器名称、设备型号...)无法采集
业务特定数据;而且对代码规范要求比较高(比如页面标题/按钮名称值必须规范)。
在笔者的工作经验中,经常会遇到这样的情况,某公司的代码非常不规范,导致通过全埋点自动抓取的数据非常乱,无法使用的情况。
(2)自定义埋点/手动埋点:这种方式需要开发同事手动埋点。优点是可以灵活覆盖各种个性化的业务数据,缺点是需要大量的人力成本。
(3)可视化全埋点:该方法只需要在页面上圈出你要监控的元素(操作位置、按钮等),无需植入代码即可埋点。优点是对不懂代码的业务人员非常友好。缺点是只能采集
浏览/点击等最基本的事件,不能采集
相对复杂的事件。
另外,一般而言,埋点需要遵循“将同一类型的事件合并到同一个埋点,不同类型的事件分别埋”的原则,以方便后续埋点的迭代和查找。错误的演示是把每个按键都上报为埋点,那么随着后续的产品迭代,按键会越来越多,埋点的数量也会随着按键的增加而增加。
比如某电商平台首页有两个操作槽,分别叫做“新品”和“猜你喜欢”。两个操作槽有新品和通过算法推荐给用户的商品的轮播展示。轮播显示。
" />
业务人员提出,想看点击次数和两个操作岗位的人数,区分用户点击的是哪个产品。由于“点击新品”和“点击推荐品”这两个事件都是点击,所以在设计追踪点的时候,需要将这两个事件合并为一个追踪点,并结合操作的名称location和“Product name/ID”属性放入该埋点作为事件属性上报,以区分用户点击的操作位置信息和商品信息。
3.3
数据分析
用户行为分析有一套独特的分析模型:
(1)事件分析:“事件”就是上面说的用户行为,是对用户行为最基本的描述,比如“打开app的次数”、“点击xxx按钮的人数”等,在电商场景中常见的是代表用户粘性的“新用户注册数”、“订单支付成功人数”、“用户在整个站点的平均停留时长”。这三个指标对应的用户行为(事件)分别为“注册”、“支付订单”和“APP浏览页面”。要想看到这三个指标,需要将对应的三个事件做成埋点进行监控。
(2)漏斗分析:用户整体的用户旅程就像一个漏斗。迈出第一步的用户数量最多。随着用户的流失,进行下一步的用户会越来越少。在电商场景下,用户通常会经历“浏览商品列表页-浏览商品详情页-加入购物车/立即购买-提交订单-支付订单”的漏斗。通过分析漏斗的整体转化率和步骤间的转化率,找出异常的转化率,进而洞察某个步骤流失的用户,发现他们的共性,为后续反击提供依据-丢失警告。
(3) 留存分析:指用户在进行某种行为后第n天继续进行某种行为的概率。电商场景中最典型的就是复购,即用户第一次购买后第n天再次购买的可能性有多大。
(4) 分布分析:类似于统计学中频率分布的直方图,分布分析观察的是某种行为被执行的次数的分布情况。比如我们可以查看过去30天内购买过1次、2次、3次商品的用户数量,也可以根据需要自定义区间查看相应区间的人数。
(5) 归因分析:一个目标事件的达成(支付订单、邮寄转发……),我们不能仅仅将其归因于某个事件(点击运营站点、点击推荐商品、分享商品、保存产品……),而是应该“按劳分配”,按照一定的计算规则公平分配信用。归因分析模型可以提供这样的计算方法,比如按照时间衰减规则(越接近转化事件,功劳越大)或者按照first/last touch point(行为中的first/last event)序列获得 100% 的信用)作出归因。
3.4
数据应用
分析数据的最终目的是驱动业务发展,否则只是躺在数据分析报告中的冷冰冰的结论。在笔者的*敏*感*词*中,“营销自动化”和“用户标签系统”是两个主要使用用户行为数据的场景。
(1)营销自动化:简称MA(Marketing Automation)。传统的营销模式要么是“拍脑袋”、基于业务体验的营销,要么无法做到精准营销、“千人千面”,一套营销方案可以面向所有用户。通过营销自动化,我们可以精准触达不同的用户。例如,我们可以使用RFM模型,从最近购买时间、购买次数、购买金额三个维度对用户进行分层,在不同时间向不同级别的用户发送不同的SMS/PUSH,从而获得最大的收益以最低的成本获得价值。转化率和收入。
(2)用户标签系统:当我们购买产品时,会看到产品的标签,标签上会标明价格、材质、生产日期等信息。同样,我们也可以对用户进行标签,比如性别、年龄、城市、职业、收入、产品偏好、用户生命周期等。用户标签系统可以与营销自动化结合使用,对特定标签的用户进行精准营销。
4个
结语
用户行为数据分析领域在商业应用的广度和深度以及在企业内部的重要程度等方面都需要提升。可以说,谁最先占领了用户行为数据分析和应用的制高点,谁就能最先以最低的成本获得最有效的用户洞察。
解读:一篇文章让你看懂数据采集
车牌采集、商品采集、命令词采集、英文采集、粤语采集……凡凡相信大家对这些数据采集项目都不陌生吧~
是你们的支持与付出,默默推动着人工智能的发展。这不是让你赚了很多钱吗?(傲娇~
)
如何使用采集
到的数据?
在电影《钢铁侠》中,智能助手贾维斯的出色表现让大家对智能语音助手充满期待。
本节以语音采集为例,具体采集到的语言数据如何被机器使用?
" />
语音识别
语音识别技术就是让机器人听懂你在说什么。它就像“机器的听觉系统”。该技术允许机器通过识别和理解将语音信号转换为相应的文本或命令。
语音识别系统本质上是一个模式识别系统,包括:特征提取、模式匹配、参考模式库等单体基本单元。
语音识别系统
它由“训练”和“识别”两部分组成。
训练:大量的未知语音(也就是我们用户提供的语言数据)被麦克风转换成电信号,然后加到识别系统的输入中。首先经过预处理,根据人类语音的特点建立语音模型,对输入的语音信号进行分析,提取所需的特征,在此基础上建立语音识别所需的模板。
识别:识别过程通常可以分为“前端”和“后端”两个模块。“前端”模块的主要功能是进行端点检测(去除多余的静音和非语音)、降噪、特征提取等;“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户语音的特征向量进行统计模式识别(也称为“解码”),得到文本信息它收录
。
数据采集
应用在哪里?
本节仍以语音采集为例。
小米电视推出的全球首款人工智能语音电视小米电视4A主打“高性价比”,只需一个语音按键即可实现搜索关键词搜索、人气搜索等10种语音交互功能排名、打开应用程序和游戏。
小米还有其他使用语音识别的产品,比如人工智能(AI)音箱,其唤醒词和二维人物“小爱同学”深入人心。
长虹推出CHiQ人工智能电视Q5N和OLED电视Q5A系列,主要功能还是语音控制。海尔、TCL等也推出了可以进行语音搜索的人工智能电视。
看这里
大家有没有数据采集的大纲
有一个大概的了解?
既然明白了,还等什么呢?
赶紧拿数据采集项目来练练手吧~
过去的推荐
右下角有你喜欢的
+“观看”
编辑的工资涨了一毛钱