文章采集api(数据埋点采集到底包括哪些问题？作者从什么是埋点、埋点的应用)

优采云发布时间: 2021-09-12 21:15

　　Data采集是数据分析的基础，埋点是最重要的采集方法。那么，数据埋点采集涉及哪些问题呢？本文作者从什么是埋点、埋点如何设计、埋点的应用三个方面梳理了这个问题，与大家分享。

　　一、数据采集及常见数据问题

　　1.data采集

　　数据采集的方式有很多种，埋点采集是其中非常重要的一部分。这是c端和b端产品的主要采集方式。

　　数据采集，顾名思义采集，对应的数据是整个数据流的起点。采集不完整，对不对，直接决定数据的广度和质量，影响后续所有环节。在数据采集有效性和完整性较差的公司中，业务中发现的数据通常会发生重大变化。

　　数据处理通常包括以下 5 个步骤：

　　2. 常见数据问题

　　大体了解了data采集及其结构之后，我们来看看我们工作中遇到的问题，有多少是与data采集链接相关的：

　　数据与背景差距大，数据不准确——统计口径不同，埋点定义不同，采集方法带来误差；

　　想用的时候，没有我想要的数据——没有数据采集需求，埋点不正确，不完整；

　　事件太多，含义不明确——埋点设计的方法，埋点更新迭代的规则和维护；

　　分析数据，不知道看哪些数据和指标——数据定义不明确，缺乏分析思路。

　　我们要从根本上解决问题：把采集当作一个独立的研发企业，而不是产品开发中的附属品

　　二、什么是埋点

　　1.什么是埋点

　　所谓的埋点是data采集领域的一个术语。它的学名应该叫事件跟踪，对应的英文是Event Tracking，指的是捕获、处理和发送特定用户行为或事件的相关技术和实现过程。

　　数据埋点是数据分析师、数据产品经理和数据运营。根据业务需求或产品需求，开发用户行为的每个事件对应的位置和埋点，通过SDK上报埋点的数据结果，汇总记录。数据分析后，推动产品优化，指导运营。

　　流程附有规范。通过定义，我们可以看到具体的用户行为和事件是我们采集关注的焦点。我们还需要处理和发送相关的技术和实施流程；数据嵌入的意义在于服务于产品，它来自于产品。因此，它与产品密切相关。埋点在于具体实战过程，关系到每个人对底层数据的理解。

　　2.为什么要埋地

　　埋点的目的是对产品进行全方位的持续跟踪，通过数据分析不断引导和优化产品。数据埋点的好坏直接影响到数据质量、产品质量、运营质量等。

　　数据驱动的埋点将分析深度下钻到流量分布和流量级别。通过统计分析，对宏观指标进行深入分析，发现指标背后的问题，洞察用户行为与价值提升的潜在关系；

　　产品优化——对于产品，用户在产品中做了什么，用户在产品中停留了多久，有什么异常需要注意。这些问题都可以通过埋点来解决；

　　精细化的运营-购买点可以实现整个产品生命周期、流量质量和不同来源的分布、人群的行为特征和关系，以及用户行为与提升商业价值之间的潜在关联。

　　3.如何埋点

　　埋点的方法有哪些？目前，大多数公司采用客户端和服务器的组合：

　　准确度：代码埋点>可视化埋点>全埋点

　　三、Median 的框架和设计

　　1.埋点采集的顶层设计

　　所谓顶层设计，就是搞清楚怎么埋点，用什么方法，上传机制是什么，怎么定义，怎么实现等等；我们在遵循唯一性、可扩展性、一致性等的基础上，我们要设计一些通用的字段和生成机制，比如：cid、idfa、idfv等

　　用户识别：用户识别机制的混乱会导致两种结果：一种是数据不准确，比如UV数据不正确；另一种是漏斗分析环节异常。因此，它应该是： a．严格规范ID自身的识别机制；湾跨平台用户识别；

　　相似抽象：相似抽象包括事件抽象和属性抽象。事件抽象是指浏览事件和点击事件的聚合；属性抽象意味着合并大部分重用场景以增加源区分；

　　采集一致性：采集一致性包括两点：一是跨平台页面的一致命名，二是按钮命名的一致；建立嵌入点本身的过程就是对底层数据进行标准化的过程，因此一致性尤为重要。只有这样才能真正用上；

　　渠道配置：渠道主要是指推广渠道、落地页、网页推广页、APP推广页等，这个落地页的配置必须有统一的规范和标准。

　　2.埋点采集事件与属性设计

　　在设计属性和事件时，我们需要知道哪些是经常变化的，哪些是不变的，哪些是业务行为，哪些是基本属性。

　　基于基础属性事件，我们认为属性必须是采集items，但是属性中的事件属性会根据不同的业务进行调整。因此，我们可以将埋点采集分为协议层和业务层。点。

　　业务分解：梳理确认业务流程、运营路径和不同细分场景，定义用户行为路径

　　分析指标：定义核心业务指标所需的具体事件和数据

　　事件设计：APP启动、退出、页面浏览、事件曝光点击

　　属性设计：用户属性、事件属性、对象属性、环境属性

　　3.Data采集事件与属性设计

　　EV 事件的命名也遵循一些规则。当同一类型的函数出现在不同的页面或位置时，根据函数名进行命名，在ev参数中区分页面和位置。仅点击按钮时，按按钮名称命名。

　　ev事件格式：ev分为ev标识和ev参数

　　规则：

　　ev标识符和ev参数之间用“#”连接（一级连接器）；

　　ev参数和ev参数之间用“/”连接（二级连接器）；

　　ev 参数使用 key=value 的结构。当一个key对应多个value值时，value1和value2之间用“,”连接（三级连接器）；

　　当埋点只有ev标志没有ev参数时，不需要带#;

　　备注：

　　ev identifier：作为埋点的唯一标识符，用于区分埋点的位置和属性，不可变，不可修改；

　　ev参数：埋点需要返回的参数，ev参数的顺序是可变的，可以修改；)

　　调整app嵌入点时，ev标志保持不变，只修改后续嵌入点参数（参数值改变或参数类型增加）

　　eg：通用嵌入点文档中收录的sheet的名称和功能：

　　A.曝光埋点总结；

　　B.点击浏览埋点汇总；

　　C.故障埋点汇总：一般会记录埋点的故障版本或时间；

　　D、PC、M页面嵌入点对应的pageid；

　　E。各版本上线时间记录；

　　在嵌入点文档中，收录了所有的列名和函数：

　　4.基于埋点的统计

　　如何使用隐藏的统计数据找到隐藏的 ev 事件：

　　指定埋点类型（点击/曝光/浏览）-过滤类型字段

　　明确按钮所属的页面（页面或功能）-过滤功能模块字段

　　指定埋藏事件的名称-过滤名称字段

　　知道ev标识符，可以直接用ev过滤

　　如何根据ev事件进行计数统计：当查询按钮点击统计时，可以直接使用ev标志进行查询。有区别时，可以限制埋点参数的取值；因为ev参数的顺序不需要可变，所以在查询统计时，不能限制参数的顺序；

　　四、Application-数据流的基础

　　1.指标体系

　　系统性指标可以将不同指标、不同维度串联起来进行综合分析，快速发现当前产品和业务流程中存在的问题。

　　2. 可视化

　　人类对图像信息的解释比文本更有效。可视化对于数据分析极其重要。使用数据可视化可以揭示数据中固有的复杂关系。

　　3.埋点元信息api提供

　　data采集服务会将采集的埋点写入Kafka。针对各个业务的实时数据消费需求，我们为各个业务提供了单独的Kafka，流量分发模块会定时读取埋点管理平台提供的元信息，将流量实时分发给各个业务卡夫卡。

　　Data采集就像设计一个产品。不能过分，留有扩展的余地，但要时刻考虑数据是否完整、详细、不稳定、快速。

0

2021-09-12

文章采集api

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

文章采集api(数据埋点采集到底包括哪些问题？作者从什么是埋点、埋点的应用)

0 个评论

发起人

AI时代内容工厂

文章采集api(数据埋点采集到底包括哪些问题？作者从什么是埋点、埋点的应用)

0 个评论

发起人

相关问题