采集自动组合(捕捉用户数据,管理数据——埋点是一种客户端行为采集方式 )
优采云 发布时间: 2021-12-13 03:24采集自动组合(捕捉用户数据,管理数据——埋点是一种客户端行为采集方式
)
2018-12-0115:56:22
埋点是一种用于分析用户行为的数据分析工具。捕获用户数据并管理数据。嵌入是客户端行为的一种方式采集。
分为代码埋点、全埋点、视觉埋点。
我为什么要把它埋起来?
互联网应用(网站,APP)在开发过程中往往不专门记录用户身份和行为数据,也不收录专业的数据分析功能。但有时为了分析用户产生某些动作或不产生某些动作的深层原因,需要详细的用户数据进行分析。这时候就需要使用专业的用户分析工具和埋点。
数据采集是任何数据平台的初始动作。对于互联网应用来说,用户行为的捕捉和获取是重中之重。如果没有准确全面的用户身份和行为数据作为输入,在后续分析中获得准确洞察的可能性存在不确定性,闭环营销也会缺乏流程数据的基础,难度会更大开展精细化经营。
▌埋点原理
对于基于用户行为的数据平台来说,用户界面上发生的、能够获取用户信息的接触点是用户数据的直接来源,而建立这些接触点的方式就是埋点。这些联系人获取用户行为和身份数据后,会通过网络传输到服务器进行后续处理。
从准确性的角度来看,埋点分为客户端埋点和服务器端埋点。客户端埋点,即在客户操作界面,记录客户产生动作时的用户行为。这些行为只会发生在客户端,不会传输到服务器端;而服务器端的埋点通常在程序和数据库的交互界面中进行埋点。这时,埋点会更加准确地记录数据变化,同时会降低由于网络传输等原因造成的不确定性风险。
从分析的角度来看,数据越准确和全面,就越能达到理想状态;但在实际生产过程中,必须考虑数据采集的可行性等问题。因为数据分析工具的最终用户可能是企业内部的各种角色,比如工程师、产品运营、营销甚至其他业务人员;每个人都会在不同的时间、不同的产品模块中以不同的规则将自己注入到产品中。关注采集代码。按照传统方法,常见的工作流程如下:
文件以帮助每个人熟悉此工作流程。
▌传统埋点的缺点
反复迭代,行为采集和埋点管理这两个动作构成了这个工作流的一个闭环,但是这个闭环有几个明显的弊端。因此,它们也被用于实际工作中。大家都很苦恼的地方:
在实际工作过程中,有的公司一方面强调了数据采集的重要性,但另一方面却还没有真正把重点放在这上面。
对于行业从业者来说,数据的获取和管理从来都不是一个足以达到一定水平的问题,但只要数据业务还在发展,他们就必须不断地迭代自己,探索更好的获取和管理。路的问题。时至今日,Mixpanel等国外知名厂商仍在努力提供更高效、更准确的埋点方法;国内厂商也有很大的提升空间。
说完“埋点”这个大概念,马上就会出现它的细分概念,比如“无埋点”、“全埋点”、“无标记埋点”、“未编码埋点”、“可视化埋点”点”等。等等。从用户的角度来看,如果你还没有很好地理解这些概念,将很难整合业务数据采集,也无法选择适合你的团队和团队的埋点方法。商业...
下面我将整理出所有可能的埋点方式及其名称,并简要说明一下,希望对大家的工作有所帮助。
▌代码埋点:最可控的埋点方式
代码嵌入是最经典的嵌入方法,可以帮助工程师了解用户如何使用产品。因为工程师手动将埋点集成到代码逻辑中,理论上只要是客户端操作,即使复杂也可以采集可达。常见的包括:页面停留时间、页面浏览深度、视频播放时间、用户鼠标轨迹、表单项停留和终止等,尤其是一些非点击和不可见的行为,需要埋下代码来实现。所以如果我们需要对嵌入点有更精确的控制,那么代码嵌入点是最好的选择。
可能你还是分不清融合点和埋点。为了埋点,厂商通常会提供一个代码包,可以理解为一个工具包,里面收录了常用的工具。如果要埋点,首先得有这个工具包,也就是集成的SDK。然后用这个工具包按照里面的说明制作各种东西,也就是埋点。
当然,缺点也很明显。上面描述的苦恼几乎都与代码埋点有关。为了使掩埋过程更加高效,制造商付出了很多努力。
▌买全积分:让我开心,让我担心
全埋点,国内有的车队也称“无埋点”、“无痕埋点”、“自动埋点”。是对全自动埋地方式的探索,从名字上看似乎是一劳永逸的解决方案,接下来我们来看看什么是“全埋”。
客户端埋点一般分为访问级别、页面级别、页面内行为级别。当用户访问网站或启动移动应用时,几乎所有厂商都会自动采集报告用户的访问;当用户访问不同的页面时,有的厂商会选择不自动采集@默认>,并作为选项提供给用户;对于用户在某个页面的详细操作行为,只有少数厂商支持自动采集上报。实现了后两种自动采集的厂家通常会说,都被埋没了。但是,页面中行为层面的采集还可以进一步探索其采集的范围。最常见的就是自动采集的区别
交互元素包括:链接、表单项(如按钮、输入框等)、HTML对象级元素等。非交互元素太多了,大部分页面元素都属于这一类。其实大家在网页和手机应用中看到的很多界面都不是标准元素,所以实际上界面上很多看似交互的元素是无法自动上报的采集。这是一个遗憾。
但是让我们来看看优点。
首先,全埋点确实会自动采集很多数据,以后在使用数据的时候,可以直接从数据库中查询。想看的时候不会面对,因为没有埋葬点。采集 得不到的情况。这是一种很受分析师欢迎的方法,所以我经常听到“如果可以采集,尝试采集,后续分析总是可以用的。” 其次,埋点是一项比较耗时的工作,需要业务方提供解决方案,埋点工程师,以及测试团队进行测试。但由于实际工作中埋点较多,每次发布新功能或新活动时,都需要新的埋点。因此,埋点不仅费时,但错误率也难以控制。对于全埋点,无论使用与否,都会首先检索数据。因为程序是自动完成的,业务人员要A,工程师埋B的错误几乎不存在。
然而,任何企业都有其两个方面。
首先,所有点的“全部”并不是真正的全部。在基本的计算机浏览器和移动应用程序中,用户对页面的常见操作包括鼠标行为、键盘行为和手指行为。例如,常见的鼠标点击、鼠标滑动、屏幕滚动、键盘输入、光标选择,甚至网页上的静态。移动终端除了有点击式按压外,还有多指开合、拉动、用力按压。然而,这些操作并不都是“埋点”。可以被埋没的通常只有点击或按下。这显然还远远不够,我们甚至不能称它们为全埋点。
其次,所有埋点的“满”是以采集上报的数据量为代价的。随着数据量的增加,客户端崩溃的概率也会增加。尤其是在移动端,更多的数据量意味着更多的功耗、流量和内存消耗。从这个角度来说,现阶段也很难做到真正的“丰满”。
第三,即使能把所有的行为数据都收回来,具体分析时的二次整理和处理也不可避免,甚至是痛苦的。因为当 采集 时机器不能以我们想要的方式有意义地命名所有事件,所以不能保证来自 采集 的事件是完全正确的。所以前期埋点省下来的人工费,这次加了。
第四,现阶段,全埋点对于用户身份信息和行为附加的属性信息几乎无能为力。
那么这个功能正是我需要的吗?这其实是个度的问题。关于这个问题,只能结合你的实际情况了。如果你需要随机探索过去点击行为的趋势,那么这个功能还是合适的,否则有更好的选择。
▌Visualized embedding:一种所见即所得的嵌入方法
代码埋点和全埋点没有在易用性和准确性之间取得平衡。可视化埋点在很多情况下也称为“未编码埋点”。如上所述,代码嵌入的缺点对于网站来说是好事,但对于移动应用来说无疑是极其低效的。为了解决这个问题,在一些厂家选择全埋点的同时,大量厂家也选择了WYSIWYG的埋点路,即可视化的埋点。
可视化埋点的优点是可以直接在网站的真实界面或者手机端对埋点进行操作,并且可以在埋点后立即验证埋点是否正确。这还没有结束,埋点可以部署到所有客户终端也几乎是实时生效的。由于可视化埋点的好处,分析的需求方、业务人员、没有权限接触代码或不会编程的人,可以以很低的门槛获取数据进行分析。可以说是向前迈进了一大步。
可视化埋点部署原理
支持可视化埋点的SDK会在被监控的网站或移动端应用访问时,与服务器核对是否有新的埋点。如果发现更新的埋点,将从服务器下载并立即生效。这样就可以保证服务器收到最新的埋点后,下次访问时可以部署所有客户端。
可视化埋点和全埋点对于埋点和分析的追求完全不同。可视化埋点的思路是为了提高原有工作流的效率——还需要梳理需求,设计埋点;全埋点是为了简化工作流程——反正数据会被采集返回,这两个步骤的必要性很容易被忽视。这里不能说哪个是最好的策略,因为事先的严谨计划和事后的探索是不同的分析角度。而且,这两种埋点根本不排斥,可以同时使用。
可视化埋点也有很多局限性。
首先,视觉埋点只是针对可见元素的点击,最常见的可见元素就是点击行为。点击操作的埋点确实是当前可视化埋点的主要攻击点。但从实际情况来看,复杂页面、非标准页面、动态页面都增加了视觉埋点不可用的风险。一旦遇到,代码只能埋点。
其次,对于点击操作附带的业务属性,虽然也可以通过进一步选择属性所在的元素来获取属性信息,但国内厂商支持的比较少。
第三,为了保证埋点的准确性,视觉埋点逐渐集成了更复杂的高级设置,比如:“同页”、“同版本”、“同级别”、“同文本”……,加上这些复杂设置的视觉埋点是否也是效率的视觉埋点?
▌标签管理器:低调大师
你可能不熟悉标签,但你熟悉用于采集网页数据的SDK。这些嵌入在网页中,可以是采集网页、移动应用程序或视频的数据正在监控。班级的标签。但标签的用途远不止于此。通过在 网站 中嵌入代码,工程师可以为 网站 提供许多附加功能。除了刚才提到的数据监控,它可能还会为网站提供一些额外的功能,最常见的就是推送个性化的内容,比如:A/B测试、消息推送、个性化广告等。
如果网站或者移动应用依赖标签的能力来实现很*敏*感*词*,那么就需要大量的标签,标签也可能需要频繁的更新或者变化。网页也是如此。上网很容易,但移动应用就难了。如果有错误或遗漏,更正将有一个很长的修正周期。在这种情况下,标签管理器就派上用场了。
标签管理器提供了一个容器。工程师只需将该容器正确嵌入到网页或移动应用程序中即可。之后,不懂技术的团队可以通过在线管理将后续标签发布到网页或移动应用程序中。这样,技术人员和业务人员独立工作。这听起来与可视化的埋点相似吗?是的,它们的原理几乎完全相同。只是视觉埋点更倾向于为用户在客户端的点击行为提供直观的方法,而标签管理器在代码层面,可以做的更多。
标签管理器非常强大,可以避免代码嵌入,可以通过DataLayer获取页面中的变量,如不同的用户ID、用户级别、登录状态、购买产品的名称和价格等;只有当这些变量达到一定水平时,触发器才能触发事件上报。是不是很赞!
目前最著名的标签管理器是谷歌推出的Google Tag manager,简称GTM,占据了83%的市场份额。*敏*感*词*是免费的,但还是提供了极其强大的功能,一般团队使用已经足够了。如果想进一步了解GTM的功能,可以阅读它的官网,里面有非常丰富的讲解和案例。
综上所述,目前在客户端获取用户数据还没有简单通用的方案。您应该在合适的场景中选择相应的嵌入方法来平衡成本和收益。好在现在厂商基本都支持以上多客户端行为的采集方法。未来,对于客户端埋点来说,集成标签管理器某些特性的可视化埋点必将取代更多的代码埋点,解决工作中所有常见的客户端行为采集需求。
就像早期论坛的编辑框一样,帖子的效果只能通过发布或预览功能才能看到,但是后来出现了所见即所得的编辑器,让编辑文字变得非常高效和愉快。目前开源社区中流行的 Markdown 格式仍然采用这种方式。在许多流行的 Markdown 编辑器中,它仍然是一侧编辑,另一侧实时预览,或直接以最终格式编辑。
随着物联网时代的到来,越来越多的用户界面会出现在电脑和手机之外,越来越多的内容会因人而异。到时候,未来越来越多的SDK集成,会自动采集更多标准的用户行为,对于非标准的强业务意义,需要根据具体情况进行计算,或者需要有效,那么就可以通过视觉嵌入点来完成。但现阶段,恐怕最好的组合还是GTM结合visual embedding。