通过关键词采集文章采集api(什么是埋点，埋点怎么设计，以及埋点的应用？)

优采云发布时间: 2022-03-31 08:10

　　数据采集是数据分析的基础，跟踪是最重要的采集方法。那么数据埋点采集究竟是什么？我们主要从三个方面来看：什么是埋点，埋点如何设计，埋点的应用。

　　一、数据采集和常见数据问题

　　1.数据采集

　　任何事情都必须有目的和目标，数据分析也不例外。在进行数据分析之前，我们需要思考为什么需要进行数据分析？您希望通过此次数据分析为您的业务解决哪些问题？

　　数据采集的方式有很多种，埋点采集是其中非常重要的一环。它是c端和b端产品的主要采集方式。Data采集，顾名思义，就是采集对应的数据，是整个数据流的起点。采集的不完整性，对与错，直接决定了数据的广度和质量，影响到后续的所有环节。在数据采集有效性和完整性较差的公司中，企业经常会发现数据发生了重大变化。

　　数据的处理通常包括以下5个步骤：

　　2.常见数据问题

　　在大致了解了data采集及其结构之后，我们再来看看工作中遇到的问题，有多少与data采集链接有关：

　　（1)数据与背景差距较大，数据不准确——统计口径不同，埋点定义不同，采集方法带来误差；

　　（2)想用的时候没有我要的数据——没提数据采集要求，埋点不正确，不完整；

　　（3)事件太多，意思不清楚——埋点设计的方式，埋点更新迭代的规则和维护；

　　（4)分析数据的时候不知道要看哪些数据和指标——数据的定义不明确，缺乏分析思路

　　我们需要根本原因：将采集视为独立的研发业务，而不是产品开发的附属品。

　　二、埋葬点是什么？

　　1.葬礼是什么？

　　所谓埋点，是data采集领域的一个名词。它的学名应该叫事件追踪，对应的英文是Event Tracking，是指捕获、处理和发送特定用户行为或事件的相关技术和实现过程。

　　数据埋点是数据分析师、数据产品经理和数据运营商，他们根据业务需求或产品需求，针对用户行为对应的每个事件开发埋点，并通过SDK上报埋点数据结果，并记录汇总数据。分析、推动产品优化和指导运营。

　　流程附有规范。通过定义，我们可以看到具体的用户行为和事件是我们采集关注的焦点，我们还需要处理和发送相关的技术和实现过程；数据嵌入服务于产品，来自产品。，所以和产品息息相关，重点在于具体的实战过程，这关系到大家对底层数据的理解。

　　2.你为什么要埋葬

　　埋点的目的是对产品进行全方位的持续跟踪，通过数据分析不断引导和优化产品。数据埋点的质量直接影响数据质量、产品质量和运营质量。

　　（1)数据驱动埋点将分析深度下钻到流量分布和流量层面，通过统计分析，对宏观指标进行深度分析，发现指标背后的问题，提供洞察深入用户行为与价值提升潜在关联的关系。

　　（2)产品优化——对于产品来说，用户在产品中做什么，在产品中停留多长时间，需要注意哪些异常。这些问题可以通过埋点来实现。

　　（3)精细化运营——买点可以对产品全生命周期、不同来源的流量质量和分布、人群的行为特征和关系进行深入洞察，洞察用户行为与商业价值提升的潜在关系。

　　3.如何埋点

　　埋点方法有哪些？大多数公司目前使用客户端和服务器的组合。

　　准确度：代码掩埋 > 视觉掩埋 > 完全掩埋

　　三、埋点架构与设计

　　1.埋点采集的顶层设计

　　所谓顶层设计，就是想清楚怎么埋点，用什么方式埋点，上传机制是什么，怎么定义，怎么实现等等；我们遵循唯一性、可扩展性、一致性等，需要设计一些常用的字段和生成机制，比如：cid、idfa、idfv等。

　　用户识别：用户识别机制的混乱会导致两个结果：一是数据不准确，比如UV数据不匹配；二是漏斗分析过程出现异常。因此，应该这样做：严格规范ID自身的识别机制；湾。跨平台用户识别。

　　同构抽象：同构抽象包括事件抽象和属性抽象。事件抽象是浏览事件和点击事件的聚合；属性抽象是大多数重用场景的组合，以增加源差异化。

　　采集一致：采集一致包括两点：一是跨平台页面命名一致，二是按钮命名一致；制定嵌入点的过程就是对底层数据进行标准化的过程，所以一致性尤为重要，只有这样才能真正使用它。

　　渠道配置：渠道主要指推广渠道、落地页、网页推广页、APP推广页等，这个落地页的配置必须有统一的规范和标准

　　2.埋点采集活动与物业设计

　　在设计属性和事件时，我们需要知道哪些是经常变化的，哪些是不变化的，哪些是业务行为，哪些是基本属性。基于基本的属性事件，我们认为属性一定是采集项，但是属性中的事件属性会根据不同的业务进行调整。因此，我们可以将埋点采集分为协议层和业务层Bury。

　　业务分解：梳理确认业务流程、操作路径及不同子场景，定义用户行为路径分析指标：定义具体事件、核心业务指标所需数据事件设计：APP启动、退出、页面浏览、事件曝光点击属性设计：用户属性、事件属性、对象属性、环境属性

　　3.数据采集事件和属性设计

　　Ev 事件的命名也遵循一些规则。当相同类型的函数出现在不同的页面或位置时，根据函数名进行命名，并在ev参数中区分页面和位置。只有当按钮被点击时，它才会以按钮名称命名。

　　ev事件格式：ev分为ev标志和ev参数

　　规则：

　　在 ev 标识符和 ev 参数之间使用“#”（一级连接符）

　　在 ev 参数和 ev 参数之间使用“/”（辅助连接器）

　　ev参数使用key=value的结构。当一个key对应多个value值时，value1和value2之间用“,”连接（三级连接符）

　　当埋点只有ev标志而没有ev参数时，不需要#。

　　评论：

　　ev identifier：作为埋点的唯一标识符，用来区分埋点的位置和属性。它是不可变的和不可修改的。

　　ev参数：埋点需要返回的参数，ev参数的顺序是可变的，可以修改）

　　调整app埋点时，ev logo不变，只修改以下埋点参数（参数值改变或参数类型增加）

　　一般埋点文档中收录的工作表名称和功能：

　　A. 暴露埋点汇总；

　　B、点击浏览埋点汇总；

　　C、故障埋点汇总：一般会记录埋点的故障版本或时间；

　　D、PC和M侧页面埋点对应的pageid；

　　E、各版本上线时间记录；

　　在埋点文档中，都收录了列名和函数：

　　4.基于埋点的数据统计

　　如何使用埋点统计找到埋藏的 ev 事件：

　　(1)明确埋点类型(点击/曝光/浏览)——过滤类型字段

　　(2)明确按钮埋点所属的页面（页面或功能）-过滤功能模块字段

　　(3)澄清跟踪事件的名称-过滤名称字段

　　(4)知道ev标志的可以直接用ev过滤

　　如何根据ev事件进行查询统计：当点击查询按钮进行统计时，可以直接使用ev标志进行查询。因为ev参数的顺序不要求是可变的，所以查询统计信息时不能限制参数的顺序。

　　四、Apps——数据流的基础

　　1.指标系统

　　系统化的指标可以整合不同的指标、不同的维度进行综合分析，可以更快的发现当前产品和业务流程中存在的问题。

　　2.可视化

　　人类解释图像信息比文本更有效。可视化对于数据分析非常重要。使用数据可视化可以揭示数据中固有的复杂关系。

　　3.提供埋点元信息API

　　data采集服务会将埋点到 Kafka 写入 Kafka。针对各个业务的实时数据消费需求，我们为各个业务提供单独的Kafka，流量分发模块会定时读取。取埋点管理平台提供的元信息，将流量实时分发到各个业务的Kafka。

　　Data采集就像设计产品一样，不能过头。不仅要留有扩展的空间，还要时刻考虑有没有数据，是否完整，是否稳定，是否快。

0

2022-03-31

通过关键词采集文章采集api

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

通过关键词采集文章采集api(什么是埋点，埋点怎么设计，以及埋点的应用？)

0 个评论

发起人

AI时代内容工厂

通过关键词采集文章采集api(什么是埋点，埋点怎么设计，以及埋点的应用？)

0 个评论

发起人

相关问题