解读:干货 | 数据埋点采集,看这一篇文章就够了!
优采云 发布时间: 2022-10-01 17:08解读:干货 | 数据埋点采集,看这一篇文章就够了!
数据仓库蓝图:
本文目录:
一、数据采集及常见问题二、埋点是什么与方式三、埋点的框架与设计四、指标体系与可视化
一、数据采集 和常见数据问题
1.1 数据采集
数据采集的方式有很多种,埋点采集是其中非常重要的一环。它是c端和b端产品的主要采集方式。Data采集,顾名思义,就是采集对应的数据,是整个数据流的起点。采集的不完整性,对与错,直接决定了数据的广度和质量,影响到后续的所有环节。在数据采集有效性和完整性较差的公司中,企业经常会发现数据发生了重大变化。
数据的处理通常包括以下5个步骤:
1.2常见数据问题
在大致了解了data采集及其结构之后,我们再来看看工作中遇到的问题,有多少与data采集链接有关:
1、数据与背景差距较大,数据不准确——统计口径不同,埋点定义不同,采集方法带来误差
2、想用的时候没有我要的数据--我没提数据采集要求,埋点不对,不完整
3、事件太多,意思不清楚——埋点设计的方式,埋点更新迭代的规则和维护
4、分析数据的时候不知道要看哪些数据和指标——数据的定义不明确,缺乏分析思路
我们需要根本原因:将采集视为独立的研发业务,而不是产品开发的附属品。
二、埋葬点是什么?
2.1 什么是埋葬
所谓埋点,是data采集领域的一个名词。它的学名应该叫event tracking,对应的英文是Event Tracking,是指捕获、处理和发送特定用户行为或事件的相关技术和实现过程。数据埋点是数据分析师、数据产品经理和数据运营商,他们根据业务需求或产品需求,针对用户行为对应的每个事件开发埋点,通过SDK上报埋点数据结果,记录汇总数据。分析、推动产品优化和指导运营。
该过程伴随着规范。根据定义,我们看到具体的用户行为和事件是我们采集关注的焦点,需要处理和发送相关的技术和实现流程;,所以和产品息息相关,重点在于具体的实战过程,这关系到大家对底层数据的理解。
2.2 你为什么要埋头苦干?
埋点的目的是对产品进行全方位的持续跟踪,通过数据分析不断引导和优化产品。数据埋点的质量直接影响数据质量、产品质量和运营质量。
1、数据驱动——Embedding将分析深度下钻到流量分布和流量层面,通过统计分析,对宏观指标进行深度分析,发现指标背后的问题,洞察潜力用户行为与价值提升关联之间
2、产品优化——对于产品,用户在产品中做什么,在产品中停留的时间,有哪些异常需要注意。这些问题可以通过埋点来解决。
3、精细化运营-买点可以实现产品全生命周期、不同来源的流量质量和分布、行为特征和人的关系,洞察用户行为与商业价值提升的潜在关系。
2.3种埋点方法
埋点方法有哪些?大多数公司目前使用客户端和服务器的组合。
准确度:代码掩埋 > 视觉掩埋 > 完全掩埋
三、埋点架构与设计
3.1埋点采集顶层设计
所谓顶层设计,就是想清楚怎么埋点,用什么方式埋点,上传机制是什么,怎么定义,怎么实现等等;我们遵循唯一性、可扩展性、一致性等,需要设计一些常用的字段和生成机制,比如:cid、idfa、idfv等。
用户识别:用户识别机制的混乱会导致两个结果:一是数据不准确,比如UV数据不匹配;二是漏斗分析过程出现异常。因此,应该这样做:严格规范ID自身的识别机制;湾。跨平台用户识别
同构抽象:同构抽象包括事件抽象和属性抽象。事件抽象是浏览事件和点击事件的聚合;属性抽象,即结合大部分复用场景,增加源差异化
采集一致:采集一致包括两点:一是跨平台页面命名一致,二是按钮命名一致;制作嵌入点的过程本身就是对底层数据进行标准化的过程,所以一致性尤为重要,只有这样才能真正使用
渠道配置:渠道主要指推广渠道、落地页、网页推广页、APP推广页等,这个落地页的配置必须有统一的规范和标准
3.2埋点采集活动及物业设计
在设计属性和事件时,我们需要知道哪些是经常变化的,哪些是不变化的,哪些是业务行为,哪些是基本属性。基于基本的属性事件,我们认为属性一定是采集项,但是属性中的事件属性会根据不同的业务进行调整。因此,我们可以将埋点采集分为协议层和业务层Bury。
业务分解:梳理确认业务流程、操作路径和不同的细分场景,定义用户行为路径
分析指标:定义特定事件和核心业务指标所需的数据
事件设计:APP启动、退出、页面浏览、事件曝光点击
属性设计:用户属性、事件属性、对象属性、环境属性
3.3 数据采集事件和属性设计
Ev 事件的命名也遵循一些规则。当相同类型的函数出现在不同的页面或位置时,根据函数名进行命名,并在ev参数中区分页面和位置。只有当按钮被点击时,它才会以按钮名称命名。
ev事件格式:ev分为ev标志和ev参数
规则:
在 ev 标识符和 ev 参数之间使用“#”(一级连接符)
在 ev 参数和 ev 参数之间使用“/”(辅助连接器)
ev参数使用key=value的结构。当一个key对应多个value值时,value1和value2之间用“,”连接(三级连接符)
当埋点只有ev标志而没有ev参数时,不需要#。
评论:
ev identifier:作为埋点的唯一标识符,用来区分埋点的位置和属性。它是不可变的和不可修改的。
ev参数:埋点需要返回的参数,ev参数的顺序是可变的,可以修改)
调整app埋点时,ev logo不变,只修改以下埋点参数(参数值改变或参数类型增加)
一般埋点文档中收录的工作表名称和功能:
A. 暴露埋点汇总;
B、点击浏览埋点汇总;
C、故障埋点汇总:一般会记录埋点的故障版本或时间;
D、PC和M侧页面埋点对应的pageid;
E、各版本上线时间记录;
在埋点文档中,都收录了列名和函数:
3.4 基于埋点的数据统计
如何使用埋点统计找到埋藏的 ev 事件:
1、明确埋点类型(点击/曝光/浏览)——过滤类型字段
2、明确按钮subbed点所属的页面(页面或功能)-过滤功能模块字段
3、明确跟踪事件的名称——过滤名称字段
4、如果知道ev标志,可以直接用ev过滤
如何根据ev事件进行查询统计:当点击查询按钮进行统计时,可以直接使用ev标志进行查询。因为ev参数的顺序不要求是可变的,所以查询统计信息时不能限制参数的顺序。
四、应用——数据流的基础
4.1 指标系统
系统化的指标可以整合不同的指标、不同的维度进行综合分析,可以更快的发现当前产品和业务流程中存在的问题。
4.2可视化
人类解释图像信息比文本更有效。可视化对于数据分析非常重要。使用数据可视化可以揭示数据中固有的复杂关系。
4.3 埋点元信息API提供
data采集服务会将采集收到的埋点写入Kafka。针对各个业务的实时数据消费需求,我们为各个业务提供单独的Kafka,流量分发模块会定时读取。取埋点管理平台提供的元信息,将流量实时分发到各个业务的Kafka。
Data采集 就像设计产品一样,不能过头。不仅要留有扩展的空间,还要时刻考虑有没有数据,是否完整,是否稳定,是否快。
解读:自媒体怎么写出爆文?四个小工具帮助你!
自媒体操作-爆文技能-干货只讲
做自媒体的朋友应该注意到了之前微信官方“点赞”功能的变化,从原来的点赞文章变成了“点赞作者”,也就是说打赏的收入将回到 文章 的原作者。
自媒体 社区对这个新功能的发布有着复杂的感受。拥有原创能力的作者自然很乐意接受这种变化,而依赖自媒体平台赚钱的“伪原创”人则非常担心。
其实我觉得没有必要因为这个小改动就完全放弃自媒体这个领域。只要努力工作,在任何领域都可以获得可观的利润。三天打鱼两天晒网是浪费时间和机会成本。
既然平台支持原创,也支持原创,那我们就努力学习,做好原创的内容,其实这个问题就迎刃而解了。
我们仍然可以借助各种平台上流行的文章来选择话题,其内容也可以作为参考。只是尽量放弃写法中原来的“carrying”+“伪原创”,自己写吧。
今天给大家分享几个超级好用的工具,可以用来写爆文:
01 / 自媒体咖啡
这个平台的URL是几乎所有采集所有主要自媒体平台的爆文。而这个网站可以根据你需要的,也就是你的字段来搜索。例如,如果你写了一个情感文章,你可以点击情感类别,它会显示对应的文章。您也可以根据自己的要求进行过滤,例如发布的事件和阅读量。
另外,这个网站可以满足自媒体从业者的基本需求。在网站的常用工具中,可以看到伪原创工具、视频地址解析、关键词订阅、作者订阅、爆文标题、原创度数检测、等。非常实用和方便。
02 / 蜘蛛侠爆文平台
平台网址是,本平台主要是采集分析今日头条、百度、大鱼。常用的工具也有,但功能比WeMedia少。如果你平时写文章涉及的内容不多,可以用这个平台,很简洁。
03 / 乐观
像往常一样,把这个平台的 URL 放在第一位。这个网站和上面两个相比,过滤功能不够全面和详细,但是可以绑定自媒体平台的一些账号。也就是说,你在今日头条这样的自媒体平台上发布后,可以通过这个直接同步到其他你想发布的自媒体平台。这大大减少了工作量。同时,网站自带的伪原创检测功能也很有用。
04 / 轻松写作
网址是,这个平台是今天推荐的几个网站中,唯一需要注册会员的,但不是强制的,但不是网站里面的素材都是免费的,有些素材只能注册并付费成为会员即可使用。
它的平台很齐全,分类很详细,过滤功能也做得很好。总体来说是非常实用的网站,还推出了自媒体在线教学,可以报名学习操作自媒体。一个功能比较全面的网站,对于自媒体的创建非常有用。
工具的作用是提高效率。文章,本来要一个小时写的,用工具可能半小时就搞定了。这些平台在基本功能方面实际上是相似的。您可以一一了解它们,并选择最容易使用的一种。
虽然很多人都在高呼自媒体,但我还是觉得基于文字的自媒体还是有市场的。从博客到微博再到公众号,平台变了,但信息分享的本质没有变。未来,究竟会发生什么变化,让我们拭目以待。