优采集平台(数据埋点的重要性在现实工作中思考要埋哪些点)
优采云 发布时间: 2021-11-25 21:30优采集平台(数据埋点的重要性在现实工作中思考要埋哪些点)
1、数据嵌入的重要性
在实际工作中,数据的整体流程是:数据生产-数据采集-数据处理-数据分析挖掘-数据可视化。其中,数据采集是一个非常重要的环节,数据采集都是不完整的,对错的,直接决定了数据的广度和质量,影响了后续的所有环节。如果采集的数据维度很少,那么我们要深入分析就无处可去。比如我们想分析某个APP的某个功能的使用情况,但是没有采集相关数据,那么就无法进行后续分析。如果数据采集是错误的,比如漏报、误报等,那么这肯定是致命的,会误导我们基于数据的决策。
在互联网行业,数据采集的方式主要根据采集的数据终端不同,主要分为网页数据采集和APP数据采集。网页数据采集主要使用JS采集,常用的数据分析工具主要是Google Analytics,APP数据采集主要是通过埋点采集,主要是前端埋点和后端埋点对应的移动数据分析厂商有很多。随着越来越多的用户倾向于在移动端上网和使用APP,APP数据采集变得更加重要。
2、什么是数据埋点
做好APP数据分析,让数据支持决策、产品和运营,首先要有数据,就像做饭需要大米一样,用户数据必须嵌入APP数据中。产品人员在规划产品的时候一定要考虑数据嵌入的问题。如果他们在产品发布后考虑如何嵌入积分,则不会采集之前版本用户的数据。当他们想查看某个数据时,他们只能等待新的数据。版本是完美的弥补它。在考虑埋点时,将产品和运营需求紧密结合,与数据分析、ETL人员等充分沟通,比如哪些指标需要监控,哪些埋点需要落实,以及埋点如何在统计上更加一致。需求,这是一个头脑风暴的过程。
数据埋点包括客户端前端埋点和服务器端后端埋点。客户端前端埋点是用户在客户端的操作记录,服务器后端埋点是用户对服务器的在线请求的日志。两者各有优缺点,最好把两者的点都埋起来,可以相得益彰。
数据埋点其实就是在产品功能码后加入统计码,记录用户操作行为。当用户进行某项操作时,如点击某个按钮、呈现某个页面等,开发者会在相应的地方添加统计代码。埋点会生成日志记录。
3、如何掩埋数据
3.1、数据嵌入技术
目前业界的客户端嵌入一般采用key-value的形式。key代表一个事件,value代表对应的参数值。嵌入逻辑大致如下:用户产生一个点击行为,产生一个点击事件。当页面显示在屏幕前时,会产生一个页面事件。
目前SDK上报埋点事件主要分为两类:1)点击事件,主要描述用户在应用中的点击行为,如点击标签页、点击按钮等。同时,一些参数事件也被归类为点击事件。比如页面描述、试听时长等,将这些参数事件归类为点击事件主要是为了方便页面事件计算用户应用使用时间;2)页面事件主要描述用户浏览过的页面,如首页、详情页等,同时根据页面停留时间计算用户的应用使用时间。
常见的埋葬技术有以下三种:
代码埋点:当发生控制操作时,通过预先编写好的代码发送数据。优点:控制发送数据的时间,事件自定义属性的详细记录;缺点:时间和人工成本大,数据传输的及时性。
可视化埋点:采用可视化交互方式,通过可视化界面配置控件操作与事件操作的关系,并使用后台截屏方式对采集数据进行处理。优点:成本低,速度快;缺点:行为记录信息较少,支持的分析方法较少。
无埋点:当用户显示界面元素时,通过控件绑定触发事件。当事件被触发时,系统会有相应的接口供开发者处理这些行为。目前市场上主流的无埋点方法有两种,一种是提前跟踪所有渲染信息,另一种是滞后跟踪渲染信息。优点:无需埋点,方便快捷;缺点:行为记录信息少,传输压力大。
3.2、 数据埋藏的优缺点
3.2.1、客户端埋点的优缺点
APP客户端埋点的好处是:
1)可以采集更全面的用户数据,可以在客户端的每一次点击和页面埋点;
2) 可以采集不需要服务器请求的数据,比如本地音乐播放、页面停留时间等。
APP客户端数据嵌入的主要问题有:
1)数据上报需要手机网络。如果用户的手机没有连接到互联网,数据上报会出现延迟。同时,数据上报一般都有相应的规则,不会实时上报。一般来说,报告和漏报有大约15%的延迟;
2) 如果用户删除了自己的APP操作记录,则不会有举报记录。
3)当需要更改埋点时,需要更新版本,但是会有部分用户不更新版本,影响数据质量。
3.2.2、 服务端埋点的优缺点
APP服务器后端嵌入点的优点是:
1) 实时采集,数据非常准确,上报无延迟;
2) 当你想改变埋点时,只要改变,上报的数据就会改变;
3)可以采集APP中没有发生的行为,只要服务端请求,客户端只能采集客户端中的操作行为,比如统计其他APP的安装量。
服务器后端埋点的缺点是:
1)不能采集不需要请求服务器的数据;
2)用户在未连接到 Internet 时无法采集数据。
3.2.3、服务端和客户端的结合
结合客户端前端埋点和服务器后端埋点的优缺点,服务端数据实时性高,准确率高。用户请求服务器的关键服务最好使用服务器的后端埋点,比如在线玩游戏。安装等,在中奖用户的统计中,显然服务器数据更合理,客户端数据可能会漏掉一些中奖用户,引起用户投诉;客户端数据非常完整,记录了大部分用户的操作行为,其他非关键业务量或者不需要请求服务器的行为,都是用来埋点在客户端前端的。服务器端埋点和客户端埋点各有优缺点。两类数据应同时存在,可以相互确认。当一方的数据出现重大问题时,另一方可以发现。同时数据也可以互补,比如data采集突然有问题,可以用对方的数据代替。
3.3、数据嵌入内容
数据嵌入主要针对采集用户行为数据。根据用户应用使用行为,每个应用嵌入主要包括以下几个方面:
3.3.1、 功能键埋点
功能按键的埋点主要是了解用户对应用中按键、功能、入口等的使用情况,从而洞察用户的内容偏好、功能偏好、使用路径等。主要包括以下几个方面:
1) 用户点击应用的顶部选项卡、底部选项卡、内容过滤选项卡等,了解用户对应用程序各版块的偏好和内容偏好;
2) 用户点击应用内的入口和渠道,了解用户的内容偏好、产品使用路径等;
3) 用户点击应用中的特定内容,如点击某款游戏、某款产品、某款视频等,了解用户内容偏好、产品使用路径等;
4) 用户点击应用设置中的选项,比如是否打开推式开关,了解用户应用的基本设置。
5) 用户点击了其他功能按钮,例如音乐播放器中的暂停和下一个按钮。
3.3.2、 主要行为埋点
用户应用行为的重点是了解用户的应用内使用行为,从而洞察用户内容偏好、产品使用习惯、用户忠诚度、用户活跃度等。用户应用中的主要行为包括:
1)用户的核心行为,包括下载、安装、试听、播放、阅读等,每个业务根据其产品的性质有不同的核心业务行为,比如视频播放、音乐试听,你可以了解用户的内容偏好、业务活动等。