智能采集组合文章( 如何采集数据,形成服务再到供给运营,看效果)

优采云 发布时间: 2022-04-15 21:06

  智能采集组合文章(

如何采集数据,形成服务再到供给运营,看效果)

  

  “用户画像”、“用户标签”、“大数据”这些词是我们这几年经常听到的词,但这些词很难直接产生价值。我们都知道大数据有用,人像也有用,但到底怎么用?怎么可能体现为产品,却很少有人能解释清楚。

  如何采集数据,形成服务,然后提供操作,这也是本文章想要分享的核心。

  在市场上,申策和易观将其称为智能用户运营平台。本期文章将和朋友一起讲解用户运营平台的产品设计,帮助大家了解其底层支持和产品性能。

  产品设计讲解将分为3个部分,分别是:选择用户、做操作、看效果。

  一、产品搭建背景

  

  产品建设背景如下:

  1. 数据不可用

  数据不可用的原因有很多,更容易理解是数据库没有埋点。

  其次,数据分散,分散在不同业务中的用户数据没有关联,会导致用户三维画像不足,甚至无法识别是否是同一用户。

  假设我们无法在关闭前识别出用户的关键路径,将很难分析他们的决策偏好和流失过程,操作的深度也会受到限制。

  然而,许多数据使用方法只停留在浅层的报表应用中。数据分析很重要,但分析后也应该应用到操作中。

  2. 操作无法管理

  这是指大多数企业运营管理严重依赖人力,缺乏平台沉淀的运营逻辑。人事变动时,依赖人力和代码维护的旧逻辑很容易被忽视,运营策略的跟踪和改进可能会丢失。

  如何让不同的角色快速了解自己业务的运营策略和对用户的影响,也是建设的目标之一。

  3. 运营成本高

  运营成本高,因为对交付和干预的需求很高,但每一个需求都需要经过产品、研发、测试和发布的过程。即使上线效率高,上线周期也会滞后。

  低重用率是由于难以扩大依赖研发的运营策略。

  4. 效果跟踪很困难

  结果难以追踪的主要原因是难以形成统一的业务标准,不同的评价标准无法进行比较。我们之前听说过一个故事,每个部门都有正的投资回报率,但公司却在亏损。这是一个笑话,但这是真的。

  有不同的标准,只看正面指标不看负面指标,那当然大家都是好消息。每个业务的形式都不一样,很难制定标准。你能尝试找到类似的项目进行操作吗?

  这四点是用户运营平台想要解决的问题。接下来,我们将解读产品的核心结构。

  二、产品架构解读

  用户运营平台的产品分解为:选择用户、做操作、看效果。

  分解为产品术语是:圈定目标用户并设置操作规则,根据操作渠道发送指定操作内容,跟踪效果后进行自助优化调整。

  

  上图解释如下:

  用户圈选:在访问产品页面时选择一个没有交易且有工作的人。操作规则:今晚8点对用户进行风控评判。例如,通过A/B实验,一组由推荐算法确定推荐产品,另一组由操作设置,设置渠道和产品。操作频道:选择弹出的资源频道。操作内容:设置弹窗登陆页面跳转到商家详情页面。效果评估:跟踪上线后的漏斗数据和交易数据。

  

  选择用户对应的用户数据平台,操作对应的规则引擎和用户交互平台,看效果就是分析中心。

  在对所提供的运营服务有一个大致的了解后,我们会逐渐了解这个核心服务所对应的底层支持和产品性能。

  三、用户操作平台:选择用户

  上一篇对应的选择用户的痛点是数据不可用。我们必须使数据可用,解决数据分散的问题。我们会将分散在不同业务中的用户数据关联起来,以识别是否是同一用户。

  最后实现了目标用户的可视化选择。

  1. 底层支持:用户数据平台

  

  要让数据可用,需要建设的是用户数据平台,这是一切的开始。即便不用于实际干预用户的操作,也离不开画像分析和个性化推荐。

  从用户运营平台的角度来看,我们需要采集整个站点的数据,使数据多样化和客观,然后过滤掉无效和异常值,关联起来成为同一个用户以确保更立体的肖像。

  最后,将详细数据处理成可用的圆选择条件并提供给操作。

  在了解表现层之前,首先要了解它的底层支持,并知道为什么会这样。

  1)数据采集

  使用数据的前提是要有数据,而采集数据是第一环节。手动采集是上传数据并导入数据库,而自动采集是埋点上报和第三方数据传输相关的工作。

  2)数据处理

  第二个环节是数据处理,主要包括数据入库后的清洗、合并、去重、处理四个步骤。

  

  清洗是指发现和纠正数据中可识别的错误,包括检查数据一致性、处理无效和缺失值等。

  

  关于合并和去重的概念,对数据的理解可以参考这篇文章:《Tableau Basics How to Merge Your Data?理解与逻辑(上篇)》,Tableau已经描述的很全面了。

  合并有两个目标。一方面是关联不同业务的核心数据,让用户画像更加立体。另一方面,离线查询大批量时,查询速度可以更快。

  不同的数据存储在不同的表中。我们希望在查询订单的同时查询到用户的关注数据。常用的方法是查询表。

  但是,这种方法只适用于少量数据。当数据量达到百万时,开始连接表和查询会很慢。这时候会用到宽表,可以理解为一个收录大量数据字段的表。. 例如,在订单表中增加用户的公众号关注数据。

  处理逻辑涉及条件的组合。

  我们的原子数据,比如年龄、性别,是可以直接使用的查询条件,但是如果我们想要“中年男性”这个条件,就涉及到处理,这让我们在查询数据的时候更加敏捷。

  3)数据管理

  数据采集,处理后的下一步就是数据管理,这是数据服务的基础,负责定义数据标准,管理数据权限,保证数据质量。

  

  标准是指我们如何定义一个完整的数据,它需要名称、取值类型、取值范围、处理逻辑等。权限决定了谁控制数据,安全级别决定了不同角色的操作,包括读、写和采用。

  最后的质量部分是通过相应的监控措施来保证数据质量,数据是否及时更新,更新进度和速度是否符合预期,生成的数据是否符合规范,幅度波动是否达到警戒线。

  假设一切正常,下游是否正常消费,消费过程是否阻塞。

  4)数据服务

  数据服务,这个词泛指数据采集、处理、管理都是服务。这里特指提供实际运营的服务,如众包服务、风控服务、运营服务等。

  

  ①风控服务

  借助数据,可以针对不同场景制定不同的风控评分规则,用于黑品识别、金融产品预售评估、金融产品定价等。异常监控是指当号码或账户被冻结时,可能导致用户违约,并在金融产品层面进行预警。

  ② 运营服务

  智能推荐的本质也依赖于数据平台,通过用户特征输出推荐结果。RTA用于广告,根据特征决定是否参与定价。

  ③ 人群服务

  用户运营平台的“用户选择”环节将使用众包服务,数据管理可以为前端渲染提供可选择的用户条件。

  选择好条件后,涉及到数据的去重、不同组间的计算,以及最终应用环节的加解密。这部分将在下面详细描述。

  说完底层支持,接下来就是用户运营平台表现层的“用户圈选”。数据平台如何提供“用户圈选”能力?

  2. 产品表现:用户圈子

  选择用户时必须考虑的产品功能有:圈选方式、圈选频次、圈选条件和人群服务。本质上,这四个功能的底层支持来自于用户数据平台,用户运营平台负责服务的应用和性能。

  

  1)圈选方法

  

  ① 条件选择

  

  这是一种在可视化、自助选择用户情况后,通过比较其取值范围,计算生*敏*感*词*群数据包的一种形式。

  一般来说,可视化抽象条件下的数据使用频率更高,数据准确性更高。其底层原理是将条件和计算标准化,然后拼接出类似SQL的数据查询语句。

  ② 智能选择&独立上传&SQL提取

  

  智能选择、独立上传、SQL选择是对“条件选择”的补充。

  智能选型的主流分为两类。第一类是在用户规模不能满足要求时计算用户的相似度,从而扩大用户规模。

  另一个应用场景是利用算法模型选择用户,根据运营效果数据优化模型,不断寻找最优的高响应人群。

  SQL 选择的原理与条件选择类似。主要用于数据不规范,无法直观选择的场景。

  另一种场景是追求更快的查询速度,因为标准化的查询语句追求通用性,查询速度大多比自写语句慢。

  2)圈选频率

  

  ① 单次提取

  单次抽取是指一次性抽取数据,当前时间抽取后数据不会发生变化。

  使用的场景多为操作实验,操作实验效果不够好,暂时没有标准操作方案;另一种场景是用户操作规模大,数据量过大。long,提前提取数据。

  ② 动态提取

  动态抽取是指在不同时间抽取相同条件。在这种情况下,基于数据的及时性,其数据可能会发生变化。在常规和固定的运营计划中很常见,例如:用户将在交易后​​ 10 天获得积分。

  自上传没有动态提取,是一次性操作。

  3)圈选标准

  下面的交互只是条件选择,而SQL、上传、智能交互都是不同的表达方式。

  

  条件的来源主要有四种,除了界面上报,应该都是来自用户数据平台管理的数据,然后根据其数据标准渲染到前端页面。

  这里补充说明一下“用户特征”和“宽表字段”的区别,如下图:=

  

  非实时查询条件主要分为宽表字段和用户特征。

  为了快速查询更多的用户数据,会根据userId将用户数据整合到一张数据表中。因为存储了大量不同的业务字段,所以也称为宽表,比如添加用户年龄、性别等字段。

  宽表字段是详细数据,数据量大意味着查询速度会受到限制,但也可以快速提取其相关数据;当您需要快速执行点查询并且不需要用户相关数据时,将使用用户特征。.

  例如,如果您需要向前一天关注公众号的用户发送短信,则会使用具有详细数据属性的宽表字段来获取他们的手机号码。但是,如果是在活动页面上,则需要实时判断用户是否在关注,引导用户的注意力,才会用到用户特征。

  既然了解了条件的来源,下一节将介绍如何比较条件,这与数据的值类型有关。前端页面还应该根据值类型呈现比较条件。

  

  时间条件一般不列举,因为随着时间的流逝很难统计。

  对应的条件选择交互式日历选择器或者日历范围选择器,而动态时间一般采用T+N的形式,其中T指的是时间(通常是天),N也可以是负数。

  例如:关注时间=T-1,表示1天前关注的用户。

  数字和字符串的比较方法比较接近,只是数字和时间可以有“大于”和“小于”等比较方法,而字符串没有。

  4)人群服务

  上一部分描述了如何选择用户,这部分是选择后要做什么。其执行过程如下:

  

  通过条件查询得到人群包,然后对不同的人群包进行互相关的数学计算。计算后对数据进行去重,最后查询这些用户的数据,供内容语言和界面使用。

  这些服务详细描述如下:

  ① 交叉交叉

  

  ② 去重

  

  重复数据删除很容易理解。核心原因是防止数据重复,避免在查询数据时因数据重复而浪费资源。

  ③ 关联数据查询

  在此,分别在内容语言和界面使用方面提供两个示例。

  内容讲,我们推送了一批等待续保的客户,指导售后部门续费。但是,如果他们需要能够指导他们的策略,他们还需要在售后提供有关保险单的详细信息,例如:保险金额、保费和被*敏*感*词*。关系等

  接口的使用与调用接口所需的输入参数有关。比如风控界面一般需要用户的*敏*感*词*和手机号。

  四、用户操作平台:做操作

  产品和运营的工作主要是计划和执行,痛点由此产生。

  规划的痛点是过去的逻辑难以追溯,难以系统地理解过去的运营思路,过去谁做了什么效果如何,目前是否在运行?我们新的解决方案总是从零开始,我们需要重新踩过过去的坑。

  实施的痛点是运营方案链太多无法上线。不同的任务以不同的方式完成,有些需要配置,有些需要开发。不仅界面人不同,而且上线周期慢且分散,非常依赖。项目管理能力。

  有没有办法尽可能配置多变的操作规则,让操作可以在线管理?

  这里的解决方案是规则引擎负责操作规则的组合,交互平台提供组合的内容,然后提供不同操作角度的管理视图和自助配置工具。如果这两个能做到极致,那就是*敏*感*词*了。

  1. 底层支持:规则引擎和用户交互

  1)规则引擎

  规则引擎行业也被称为自动化营销平台。术语规则引擎有点抽象。它可以理解为操作一件事的规则或逻辑。

  

  这是 5W2H 法则中熟悉的部分,规则引擎在什么时间对谁、在哪里以及以何种方式(5 个赌注)进行操作。

  什么时候做,给谁做是触发条件,由谁做是由实时事件触发的,比如用户签到立马开奖。在这种情况下,事件既是触发条件,也是判断条件的一部分。

  判断条件的本质是过滤。比如过滤昨天登录的用户中的黑产用户,除了用户自身的特点外,我们还会接入风控、推荐等接口。

  从计算机操作的角度来看,流程控制是改变流程执行顺序的指令,浅层理解是判断条件和执行条件之间的连接器。

  实际操作中,不一定每次判断生效都立即执行,会等待时间或分组执行。例如:当用户访问页面并等待15分钟触发操作逻辑时,等待指令为流程控制。

  执行条件比较简单,但不要拘泥于思维。

  用户的一切操作干预手段都可以被我们覆盖,无论是触摸还是弹窗,无论是非人工、人工还是智能,B端最重要的是连接和共赢。

  

  了解了规则引擎的四个核心要素之后,接下来的问题就是如何让研发、产品、运营的不同角色被使用成为可能。适用角色的每一步,易用性都会变得更高。

  如果连研发的敏捷度都提高不了,那么这个引擎就没有存在的意义。

  关于敏捷,我理解的是操作需求的低代码或无代码实现,以及无需发布即可独立测试的能力,所以对应的解决方案是可视化拖拽。很棒的案例。

  但相比*敏*感*词*,我个人更喜欢低码。无代码基本上是通用模型和标准化模板。无需研发和人工投入即可快速应用。

  它可以指标准化服务的提供者,例如网页和活动。这种方法的缺点是它强烈依赖模板。如果没有合适的模板,它的实用性就会大打折扣,很难兼容复杂的逻辑,最简单最不灵活。

  低代码,通过一些基础设施的搭建,实现一些逻辑配置和一些编码,实现一些逻辑配置,测试可以自助。适合对产品、运营等有一定R&D理解能力的同学。

  2)用户交互

  交互,顾名思义,就是沟通和互动。规则引擎负责规则组合,交互内容负责规则的最后一个节点:执行。

  如果我们要做用户操作,就需要和用户进行连接,这取决于能接触到用户的渠道,不同的渠道有自己的互动内容。

  本章没有太多复杂的底层支持逻辑。基本上就是渠道能力的建设,渠道内容的维护和管理,更要注重的是愿景。

  

  这张图列举了可能与用户交互的渠道以及渠道支持的内容方式。渠道不仅是推送,还有Qiwei等私域的聊天消息,其次是对应电话和网站资源的人工服务。.

  发送的内容不仅是文字和图片,还有任务或奖品。任务可以理解为你希望用户完成的事情,奖品是你完成某事后提供的激励。

  这里大家可能会有的疑问是,着陆页通常带有任务和奖品,这是真的。但是,在某些场景下,不会有落地页,比如智能外呼、短信等。此时,将应用广义的用户任务系统和奖品。

  至于内容的产品支持工具,还包括二维码、海报、短链接、落地页生成等,这些产品如何实现不是本篇文章的重点,这里不再赘述.

  2. 产品性能:方案管理和方案配置

  运营痛点是:管理难、成本高、上线周期长。

  在线列表视图只是最表面的管理。我们还应该提供不同类型的视图,帮助运维同学了解运维计划的运行状态和业务逻辑。

  成本和周期问题要通过自助、一站式、可视化配置来解决,这部分依赖于4-1的底层支持。

  1)项目管理

  方案管理,首先要明确什么是运营方案,它由目标用户、运营策略、效果评价三部分组成。

  对于节目管理,最常见的是列表视图,包括基本列表和列表过滤。这一点就不赘述了,但是当我们想了解业务的运行状态时会用到:执行视图、逻辑视图等。

  ① 执行视图

  

  从运营的角度来看,任何交付类的运营基本上都涉及到KPI。不论效果如何,首先要按时按量执行每项运营策略。这是运营有效性的基础。

  时间部分主要分为开始时间和时长,部分业务对任务完成的时效性要求较高。

  量级部分的第一个也是最重要的部分是任务的成功率。在产品设计上更进一步,也可以根据相应计划的总水平和成功水平做出同比或趋势,方便我们定位问题。

  ② 逻辑视图

  逻辑视图承载操作计划的逻辑。其次,我要帮助运筹学同学树立全球运营的视野。

  这部分对于不同的产品形式和业务目标是非常不同的。下图是基于商品的逻辑视图。

  

  商品视图是单个商品在不同的运营场景下,在什么时间节点,通过什么渠道进行运营。

  每个频道可能有自己的细分目标。点击“目标:引导加购”进入详细运营计划,查看运营逻辑。第二张图是从类别的角度来检查场景操作是否缺失。此视图不关注频道和时间等具体细节。

  这只是两个例子。您可以根据自己的业务形态设计自己的管理视图。

  2)方案配置

  上面的产品视图只承载了部分逻辑,更详细的逻辑会进入运营计划页面。它包括以用户为导向的运营策略和运营计划的评估指标。

  下一部分我将向您解释方案配置的表示层是什么样的。业界主要有两种配置方式,一种是流程视图,另一种是表单视图。

  流程视图可以参考钉钉易达和易观数学。这里我们只展示简单的图片。

  应该使用指甲:

  

  易观数学:

  

  表单视图也是一种比较主流的方式。个人设计将运营计划分为4个部分:运营频率、用户导向、运营策略、效果评估。在本节中,首先解释前三点。

  ① 运行频率

  

  对于一个操作计划,首先要处理的是在什么时间范围内操作,其次是操作的频率和时间。

  事件触发不依赖于时间,根据事件的发生实时触发。这种类型没有运行时间的概念。循环触发和单次触发都会有时间的概念。

  循环触发是指多次触发任务。触发事件仅适用于每日定时任务和间隔每日定时任务。举一个间隔日定时任务的例子来帮助理解:你必须每周一去上班。

  单个触发器是一次性任务,可以在计划建立后立即发送,也可以在计划创建后一次发送。交互如下图所示:

  

  ② 对于用户

  这部分在讲解用户数据平台的表现层时会详细介绍,这里只展示交互。

  

  ③ 经营策略

  

  上图是一个简单的模式,可以服务于大多数场景。但在实际过程中,还是会涉及到判断和执行条件的结合。

  对于复杂模式,会在上图中添加额外的操作规则字段。通过研发可视化拖拽配置规则,然后通过相关渠道和内容渲染和执行规则,提供操作和填写。

  但是随着规则的增多,很难维护和理解。除了流程视图,如何让它更容易使用和理解,我目前还没有很好的答案。

  灵活多变,要做出取舍真的没那么容易。

  五、用户操作平台:看效果

  终于到了主流程的最后一部分:看效果。

  回顾看到结果的痛点:评价标准不同、无法比较、缺乏负面评价。

  个人观点,这部分主要是需求端,不是执行者,所以没有太多底层实现可以分享,而表现层则是根据运营计划的执行结果,进行漏斗统计和ROI成功干预的用户的计算。并深入分析肖像。

  以下是关于漏斗统计和投资回报率计算的一些想法:

  1. 漏斗统计

  

  漏斗的统计主要看端到端的转化。指标定义如下:

  转化的概念非常广泛,取决于您希望该用户完成的行为指标。该指标可能因每个运营计划而异,包括交易、续订、访问、关注等。

  如果你不关心数据产品,关注的核心应该是梳理不同业务的转化指标,将统计数据传递给数据部门,整合到你的平台中。

  2. 投资回报率统计

  ROI 统计 这是一个比较难设计的模块,这里可能只是一个指导。

  之所以难,是因为不同的业务指标不一样,统计的方法也不一样。如果强制输出,可能不是所有人都认可。

  这里的个人想法是分业务算盘,把握小局,放弃大局。了解并梳理不同业务的计算方式,为其提供通用的配置计算能力。帮助不同部门能够在内部进行比较和衡量。

  

  与传统的计算方式相比,ROI的计算公式多了一个参数:“负指标经济价值”。

  原因也很简单,每发一个公众号文章,就会有人关注,就会有人下架。但这并不是说不需要继续操作,而是让分子大于0,并尽可能接近和超越分母。

  

  对于上图第二个例子的解释,假设是某张Dong Plus会员年卡,快到期时用户还没有续费。这时平台运营会将这些用户推送到出站座位,出站同学会引导用户进行续费。

  过程指标反映了完成结果指标的方式。为提高成果指标的经济价值,要么减少完成过程的损失,要么提高完成成果的单价。

  而负面指标,也就是这种操作行为可能造成的损失,就是这种操作动作的负面影响,比如第一个例子中的unfollow。

  负指标也需要换算成经济价值,比如一个公众号粉丝的成本,一个小程序UV的成本。正负方向的结合可以使计算更加客观。

  六、写在最后

  这个 文章 写起来非常困难和有趣。难度是我最熟悉的我从未想过的B端产品。如果你沉下心来写,会有这么多的产品方向。有趣的是,我终于不用在意那些该死的界限、价值观和实现的难度,可以设计出理想中应该收录的东西,以及应该呈现的交互风格。

  一个完整的用户操作平台是非常复杂和昂贵的。它要求您的业务强烈依赖召回,并具有足够大的业务规模和收益。否则,我仍然建议从这里获取灵感并制作自己的 MVP。

  思想可以更开放。借助用户数据平台,还可以实现基于特征的拖放BI报表,也可以进行画像分析。有一个规则引擎来解决审批流程配置和调查问卷的问题也很好。通过构建渠道能力,为外呼团队和客服团队提供支持也是一个很好的途径。

  其实能设计出这样一款产品,真的是很幸运,这和我过去的产品体验有联系。在我的第二份工作中,我做了很多B端产品,包括:页面配置、任务、奖品、用户功能等,但都非常脱节。

  这一次,是一点点所谓的生态情怀,而不是假名。

  最后,我也想建议B端产品在设计时尽量屏蔽底层逻辑,减少配置项。这么多的可视化和自助化配置,确实降低了研发成本,但只是转化为正在向前发展的产品和运营。

  回到C端已经快3个月了。我写了一篇关于B端产品的毕业论文,2个月还清了债务。

  非常感谢您来到这里,谢谢宁。

  #专栏作家#

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线