专业知识:一篇文章带你从0到1掌握用户画像知识体系
优采云 发布时间: 2022-11-28 04:21专业知识:一篇文章带你从0到1掌握用户画像知识体系
这里推荐:
一个。OSM 模型(目标、策略、测量)
b. 销售公式=流量*转化率*客单价*复购率
3、面向业务目的的运营策略设计和用户标签需求针对不同的业务目的,标签体系的构建也不同,因此标签必须来源于运营策略。比如业务部门要做个性化推荐,做一些关于事物或人的兴趣爱好的标签会更有价值;但如果要做精细化运营,保留和激活用户标签会更有价值。用户标签选择参考以下示例:
量化目标是提高扫码方式的关注率,选择的运营策略是通过推送优惠券的方式吸引微信用户扫码。新粉丝扫码关注推送100元优惠券,老粉丝扫码关注推送50元优惠券。,那么在执行运营策略的过程中,需要使用“是否是新粉”这个标签。
这个阶段可以准备一个简单的Excel模板,用于记录交流内容。列表头包括标签名称、标签规则、使用场景等,记录与业务方的沟通内容。
4. 组织标签对于组织标签,需要基于对业务和政策的理解,站在用户的角度进行分类管理。这是一个参考框架:
(1)用户属性标签:性别、年龄、省份、城市、注册日期、手机号等。
(2)用户行为标签:近30天访问次数、近30天客单价、近30天活跃天数、近30天访问时长、平均访问深度等。
(3) 用户消费标签:收入状况、购买力水平、购买的产品、购买渠道偏好、上次购买时间、购买频率等 (4) 产品品类标签:高跟鞋、靴子、衬衫、法式连衣裙、牛仔裤, ETC。
(5)社交属性标签:频繁活跃时间段、活跃地点、单身、评价次数、好评等。
2.2.2输出标签要求文档
经过前面的需求采集
和分析,明确了业务方的标签需求。为了研发顺利交付,下一步是:编写标注系统文档——根据标注规则确定埋点——编写数据需求文档。
1.编写标签系统文档
在这个环节,数据产品经理需要根据前期与业务方的沟通内容,制作出具体的标签体系文档:
(1)Tag ID:例如ATTRITUBE_U_01_001,其中“ATTRITUBE”为人口属性主体,“_”后的“U”为userid维度,“_”后的“01”为一级分类,“001” "末尾为该一级标签下的标签详情
(2)标签名称:英文格式名称,例如famale
(3) 标注中文:女
(4)标签主题:描述标签所属的主题,例如用户属性维度标签、用户行为维度标签、用户消费维度标签 (5)标签级别ID:标签所属的级别,一般分为2 levels (6) Name : ID对应的名称
(7) 标签类型:统计标签、规则标签、机器学习算法标签
(8)更新频率:实时更新,离线T+1更新,单次计算(9)标签算法规则:
一个。需要描述选择哪个数据表中的哪个具体字段。如果需要关联多张表,还需要说明join是用哪个字段
b. 具体的算法逻辑和统计周期,比如“最近7天的支付次数”,需要统计最近7天的支付总数。
(十)使用场景说明
(11) 调度
(12) 开发商
(十三)需求方
(14)优先权
2.根据标注规则确定埋点
上面已经阐明了标签的算法规则。接下来,还需要进一步确定应该埋哪些点来采集需要的数据。下面是具体的
案子:
对于标签“Purchase Product Category Preference”,会用到点击下单按钮的事件数据,以及产品名称、产品类别等事件属性数据,所以需要埋掉点击下单按钮的事件。
3.编写数据需求文档
确定好埋哪些数据后,需要制作具体的数据需求文档,交付给负责埋的开发同事埋。在数据需求文件中,应规定以下内容:
(1) 墓葬名称:click_order
(2)埋点显示名称:点击订购按钮
(3)上报时间:根据实际情况,选择上报时间。比如点击下单事件,可以选择点击下单按钮时上报
(4)埋点类型:根据实际情况,选择埋点在客户端还是服务端。比如“购买商品类别偏好”标签上的订购按钮的点击事件,因为它只是判断用户对购买商品的偏好。用户点击按钮后,已经可以提示是否有偏好,无需等待服务器返回是否成功的提示。因此,适合客户端埋点
(5) 属性名称:事件属性的名称,如点击下单按钮事件的商品名称属性
(6) 属性值:比如衬衫
(七)备注
在实际工作中,编写标签系统文档、根据标签规则确定埋点、编写数据需求文档将是一个相互完善、相辅相成的过程。
2.2.3 标签开发
在整个工程方案中,系统所依赖的基础设施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除了基础设施,系统主体还包括三个重要的组成部分:ETL操作、用户画像主题建模、应用端标签结果数据的存储。如图所示是用户画像数据仓库的架构图,下面简单介绍一下。
1、Hive数据仓库ETL作业
下图虚线框展示了常见的数仓ETL处理流程,即日常业务数据、日志数据、埋点数据等通过处理进入数仓对应的ODS层、DW层、DM层ETL 过程。
2、Hive数仓用户画像主题建模
中间的虚线框是用户画像建模的主要环节,会基于数据仓库的ODS层、DW层、DM层对用户相关数据进行二次建模和处理。
3、应用端标签结果数据的存储
在用户画像的主题建模过程中,会将用户标签的计算结果写入Hive。由于不同的数据库有不同的应用场景,下面分别介绍:
(1) MySQL
作为关系型数据库,可用于元数据管理、监控预警数据、用户画像中的结果集存储等应用。下面详细介绍这三种应用场景:
一个。元数据管理:MySQL读写速度更快。平台标签视图(Web端产品)中的标签元数据可以维护在MySQL关系数据库中,方便标签的编辑、查询和管理。
b. 监控预警数据:在画像的数据监控中,调度流每跑过相应的模块,都会将该模块的监控数据插入MySQL,当验证任务判断达到触发告警阈值时,告警将被触发。
C。结果集存储:存储多维视角分析的标签,圈人服务的用户标签,记录当天每个标签的数量等。
(二)HBase
与Hive不同,HBase可以在数据库上实时运行,而不是运行MapReduce任务,适用于大数据的实时查询。下面以案例介绍HBase在画像系统中的应用场景及工程实现:某渠道商拟通过App首页弹窗发放红包或优惠券,以促进其注册下单。未注册的新安装用户启动。每天画像系统ETL调度完成后,会推送相应的人群数据到广告系统(存储在HBase数据库中)。当满足条件的新用户访问App时,在线接口读取HBase数据库,在查询用户时向用户推送弹窗。
(3) 弹性搜索
它是一个开源分布式全文搜索引擎,可以近乎实时地存储和检索数据。对于响应时间要求高的场景,比如用户标签查询、用户人口统计、用户群体多维度透视分析等,也可以考虑使用Elasticsearch进行存储。
2.2.4 标签发布及效果跟踪
经过开发测试,上线后需要持续跟踪标签应用的效果和业务方的反馈,调整优化模型和相关权重配置。
03.用户画像产品化
在商业价值上,标签和画像类似于一个中间层的系统模块,为前端服务提供数据支持。开发出人像标签数据后,如果只是“躺在”数据仓库中,将无法发挥更大的商业价值。只有将人像数据商业化后,数据处理环节上各个环节的效率才能得到标准化的提升,同时也更加方便业务方使用。下面从标签生产架构和产品化后覆盖的功能模块两个角度进行总结:
3.1 用户画像产品体系架构
下图是一个用户画像产品体系的*敏*感*词*。数据从左到右,主要包括数据采集、数据接入、数据集成/标签计算、标签应用四个层次。让我们尝试简要描述一下:
3.1.1 数据采集
" />
在数据采集模块中,主要通过客户端/服务端SDK、导入、与第三方应用对接等方式采集日志数据、业务数据、第三方数据。
1.开发工具包
(1)客户端SDK:通过嵌入客户端SDK,可以采集iOS、Android、小程序、网站等各类客户端的用户行为数据和用户属性信息。
(2) 服务端SDK:如果数据已经存在于数据库或者数据仓库中,比如订单信息,可以使用开发语言对应的服务端SDK来采集数据。
2.*敏*感*词*商
根据运行环境、源数据格式、导入数据大小等因素,可选择不同的大导入方式,将历史文件数据导入用户画像产品系统。
3、领克根据不同第三方产品OpenAPI的特点,采用接收事件消息推送或主动轮询的方式采集
用户在不同第三方应用系统中的个人属性和行为事件数据。
3.1.2 数据访问
埋点数据先大量进入Kafka,然后慢慢消费访问后续的数据集成存储系统。
3.1.3 数据整合/标签计算
在用户画像系统中,Hive主要作为数据仓库进行ETL处理,开发相应的用户属性表和用户行为表,计算标签。
1、数据整合
从各个渠道接收到的数据存在隔离、空值、格式不匹配、超出限制范围等数据质量问题。因此,需要进行脏数据清洗、格式转换、用户识别和合并等集成工作:
(1) 清理/改造
a.Clean:比如用户的出生日期是未来的某个日期,所以需要过滤掉这种脏数据
b.Transform:例如通过第三方应用API获取的所有用户的地域信息,采用IPB标准编码形式。为了和其他渠道的信息一起分析,需要按照IPB标准编码转换成标准的省、省、省。城市格式
(2) ID映射
一个。从各个通道接收到的用户属性数据和行为事件数据是相互隔离的。为了计算用户的全面综合标签,需要对用户进行识别和合并。比如通过unionID,识别并合并同一个微信公众号、小程序、开放平台网站的同一个用户的信息。
经过数据整合处理后,数据将进入如下数据模型:
2.标签计算
在用户画像系统中,将构建批量离线标签处理引擎,依托于相对稳定的底层数据结构。标签引擎同时读取事件数据和用户属性数据,然后按照特定的标签规则进行批量计算,最终生成用户标签。
3.1.4 标签申请
标签的应用主要分为前端画像展示和通过API访问其他系统两种应用方式,在后面的“3.2用户画像产品化功能模块”一章中有详细介绍。
3.2 用户画像产品功能模块
3.2.1 系统看板
通常,用户画像系统的数据仪表盘以可视化的形式展示企业的核心用户数据资产或关注人群的数据。旨在建立和统一用户对企业数据资产或核心人口数据的基本认识,主要分为以下几类:
1、用户量级及变化趋势:不同设备类型ID量级,不同类型用户量级(如注册用户与非注册用户、付费用户与非付费用户等);
2. 标签资产:按主要类别统计标签数量等;
3、核心用户标签:展示固有或自定义群体的关键标签画像数据等;
3.2.2 标签管理
供业务人员对标签进行增删改查,包括:标签分类、新建标签、标签审核、标签下架、标签覆盖率监控等。
根据用户行为数据和用户属性数据设置标签规则创建标签:
3.2.3 单用户画像
主要能力包括通过输入用户ID查看单个用户画像的详细数据,如用户属性信息、用户行为等数据。
3.2.4 用户分群及用户群画像
1、用户分组
用户分组功能主要面向业务人员。产品经理、运营、客服等业务人员在应用标签时,可能不仅仅查看某个标签对应的群体情况,可能需要组合多个标签来满足他们对群体的业务定义。例如:结合“近7天多次领取优惠券”、“活跃度等于高和极高”、“女性”用户3个标签定义目标人群,查看覆盖用户数这个组。
2、用户群体画像
与用户分组功能类似,用户群画像功能首先需要结合标签来圈定用户群体。不同的是,用户群画像功能支持从多维度分析所圈定的用户群体的特征,而用户分群功能则侧重于筛选出用户群体,推送到各个业务系统,提供服务支持。
3.2.5 BI分析
BI平台与这些数据打通后,可以丰富数据的维度,通过各种分析模型支持更丰富、更深入的分析对比。
3.2.6 开放API
OpenAPI可以保证画像系统数据与推送系统、营销系统、广告系统、推荐系统、BI等各个平台的连接,保证各个系统数据的实时更新,避免来自同一来源的不同数字的问题。
04.用户画像应用
前面提到,用户画像主要包括三个应用:业务分析、精准营销、个性化推荐与服务。具体可以分为:
4.1 经营分析
用户画像系统的标签数据通过API进入分析系统后,可以丰富分析数据的维度,支持对各类业务对象的业务分析。下面总结了一些市场、运营、产品人员分析时会关注的指标:
4.1.1 流量分析
一、流量来源
2、流量:UV、PV
3、流量质量:浏览深度(UV、PV)、停留时长、来源转化、ROI(投资回报率)
4.1.2 用户分析
1. 用户数:新用户数、老用户数、新老用户比
2、用户质量:新用户数(app启动)、活跃用户数(app启动)、用户留存(app启动-app启动)、用户参与度、睡意、客单价
4.1.3 产品分析
1、商品销量:GMV、客单价、下单人数、退购人数、退货人数、各终端复购率、购买频率分布、经营岗位购买转化
2、商品类:支付订单状态(次数、人数、趋势、复购)、访问购买状态、申请退货状态、订单取消状态、关注状态
4.1.4 顺序分析
1、订单指标:总订单量、退款订单量、订单应付金额、订单实际支付金额、下单人数
2、转化率指标:新订单/访问UV、有效订单/访问UV
4.1.5 渠道分析
1.活跃用户
(1)活跃用户:UV、PV
" />
(二)新增用户:注册量、注册量同比比较
2、用户质量
(1)留存率:次日留存率/7天/30天
3、渠道收入
(1)订单:订单量、日均订单量、同比订单量
(2)收入:支付金额、日均支付金额、同比金额(3)用户:人均订单量、人均订单金额
4.1.6 产品分析
1、搜索功能:搜索人数/次,搜索功能渗透率,search关键词
2.关键路径漏斗等产品功能设计分析
4.2 精准营销
4.2.1 短信/邮件/推送营销
在日常生活中,我们经常会从很多渠道收到营销信息。红包到账的短信推送可能会提示用户打开很久没有访问的应用,心愿单中图书降价的邮件推送可能会刺激用户打开推送链接直接下单。营销有哪些类型?大致可以分为以下4类:
1、行为营销:商品浏览、加入购物车、店铺扫码、取消订单、退货等。
2. 位置营销:周边门店、周边活动、常去区域等 3. 节日营销:生日、春节、双十一、双十二、圣诞节等。
4、会员营销:欢迎加入、优惠券提醒、积分变化、等级变化、会员福利等。
4.2.2客服语音技巧
当我们向某平台客服部门投诉、咨询或反馈时,客服人员可以准确地告诉我们我们在该平台的购买情况、上次咨询问题的结果等信息,并及时提出解决方案有针对性的方式。为价值用户提供VIP客服通道等特色服务。
4.3 个性化推荐和服务
应用运营方可以通过在用户画像中推送性别、年龄段、兴趣爱好、浏览和购买行为等标签,向用户推荐不同的内容。例如今日头条的个性化文章内容推荐,抖音基于用户画像的个性化视频内容推荐,淘宝基于用户浏览行为等画像数据的个性化商品推荐。
05.用户画像实践案例
基于画像系统做多方位的数据分析和用户可触达的运营方案,标签数据可以快速应用到服务层(T+1,实时应用),通过效果分析得到用户反馈后,它有助于迭代营销策略或产品设计。下面通过一些实际案例,场景化地复现用户画像的应用要点和应用方法。
5.1 A/B人群效应测试
5.1.1 案例背景
为了在大促期间获得更好的销量,某快消产品计划通过新闻推送的方式,对新上架的产品和产品的保健功能进行系列文章植入,为大促造势,刺激销量。销售转化。为了准确定位目标人群流量,渠道运营商现计划进行两次A/B人群效应测试:
1、不同内容标题对流量的影响;
2、与普通推送相比,精准推送带来更多流量。
5.1.2 用户画像入口
在整个项目中,需要梳理AB组流量如何划分,AB组人群规则如何设计以及效果监控。下面分步介绍人像系统在AB人群测试中的使用方法。
1. 对AB组用户进行细分要想做A/B组测试,首先要做好流量的细分。您可以使用A/B分布和随机分布的形式将用户划分为A/B组。
2. 文案对流量影响测试方案 某平台渠道商为了在大促期间召回更多用户访问APP,计划抽取少量用户进行AB效果测试。在活动预热期间复制标题。
本次测试方案中,控制组A选择路径A的用户组,在过去x天访问过,在过去x天浏览/采集
/购买过零食,将零售文案A推送给这些用户; 控制组B选择对于走过路径B,在过去x天访问过,并且在过去x天浏览/采集
/购买过零食的用户群,将零食文案B推送给该组用户。control group和control group的用户数是一样的,但是文案不同。跟进监测两组人的点击率,然后分析不同文案对用户点击的影响。例如通过用户分组功能选择A组中的用户,如下图:
3、精准推送相比普通推送带来的流量提升测试方案
在使用画像系统精细推送人之前,某平台以乱推送消息的形式推送用户。为了测试精细化运营组相比无差异化运营带来的流量提升,渠道运营人员决定在目前重点运营的零食营销场馆进行AB效果测试。
在本次测试计划中,控制组A选择了路径A,在过去x天内访问过,并在过去x天内浏览/采集
/购买了零食;对照组B选择路径B,在过去x天访问过,A用户组没有类别偏好。将同样的文字推送给A组和B组的用户群,然后监控两组人的点击率,进而分析精准营销推送带来的增长点。
5.1.3 效果分析
AB群消息推送上线后,需要构建监控报表,监控控制组和测试组的流量和转化情况,重点关注下表指标:
例如,使用事件分析模型构建的AB人群的GMV对比报告如下图所示:
5.2 女神节精准营销
5.2.1 案例背景
某主打女性产品的品牌商计划在女神节期间针对不同品类偏好的女神进行针对性营销。营销信息会推送两次,第一次是在当天10:00推送促销信息,第二次是在当晚10:00发送一波促销提醒。最后,通过跟踪目标受众支付订单的当天完成率来评估营销效果。
5.2.2 实现逻辑
首先根据用户性别标签和年龄标签圈选择18-40岁的女性用户。然后延迟到2020-03-08上午10点,根据用户的品类偏好标签推送不同的营销内容。第二波推送延迟至2020-03-08晚上10点,推送信息为统一促销提醒。
5.3 新装未注册用户实时营销
5.3.1 案例背景
某小吃商城App运营方为促进未注册新装用户注册下单,制定了运营规则:新装未注册用户打开App时,通过App弹窗推送优惠券进行营销. 例如,如果用户安装APP后没有注册,改天用户打开后会第一时间推送APP弹窗优惠券,更好的引导用户完成注册下单。
5.3.2 用户画像入口
渠道运营商通过组合用户标签(如“未注册用户”、“今日安装量”小于××天)筛选出相应的用户群体,然后选择将相应的群体推送至“广告系统”。这样每天画像系统的ETL调度完成后,就会将对应的人群数据推送到HBase数据库中存储。当满足条件的新用户访问App时,在线接口读取HBase数据库,在查询用户时向用户推送弹窗。
5.4 电子商务再营销广告
5.4.1 案例背景
某电商APP产品运营团队希望提高老客户对电子产品的复购率和新客户的下单率,选择与今日头条合作投放再营销广告。例如,某用户在电商APP中看到了一款vivo手机,第二天查看今日头条时,看到了对应手机的广告信息。
5.4.2 实现逻辑
首先需要保证电商APP和今日头条的API已经开放,然后根据用户在APP中的行为(浏览、采集
、追加、搜索等)进行算法挖掘。生成用户产品偏好的标签。今日头条在抓取用户的设备信息后,会向电商发送请求,询问是否需要向用户展示广告。这时电商平台会判断该用户是否是自己的用户。如果是自己的用户,会返回一个推荐结果给今日头条,用户会看到自己之前在今日头条浏览过的商品信息。您现在可以跳转到电子商务应用程序中的产品详细信息页面。
06.总结
1、首先,描述了用户画像、用户标签、用户群体的认知概念;
2.然后,对标签系统的分类、标签构建的过程和方法进行了说明;
3、为了说明如何让数据仓库中“躺着”的画像标签数据发挥更大的商业价值,从系统架构和应用层功能两个角度对用户画像系统的构建进行简要总结;
4.最后从业务分析、精准营销、个性化推荐三个角度总结了用户画像的应用,并在实战案例部分列举了几个用户画像的实际应用案例。
参考:
[1] 赵红天,《用户画像:方法论与工程化解决方案》
[2] 晓峰老师,21天训练营
[3] 草帽小子,如何从0-1搭建用户画像系统
[4] 酒仙桥@道明前辈,从0开始构建用户画像系统的系列文章
[5]秦璐,什么是用户画像,一般用户画像的作用是什么
[6] 蔡青青,如何打造有效的用户画像(Persona)
[7] 赵红天,《数据化运营:系统方法与实战案例》 [8] 刘振华,《电商数据分析与数据化运营》
分享文章:百度到底是喜欢原创文章还是采集文章的网站(自媒体网站如何采集文章优化)
本文主要为您介绍SEO网站文章优化。有需要的朋友可以参考一下。如果您觉得对您有帮助,希望您能关注本站。
刚开始做网站的时候,一直在想一个问题,
百度是喜欢原创文章的网站还是采集
文章的网站?虽然百度出过打击采集网站的算法,但感觉并没有真正落地。
不仅如此,对于那些辛勤工作的原创站长来说,
有时候效果还不如别人的轻松采集
效果好,那么今天我们就来和大家分析一下网站是如何进行SEO的采集
文章的。
如何采集
文章:
" />
采集
文章的本质是移动它们。我认为在互联网上移动文章有两种方法:
1、自己手动复制和传输。手动复制太费时间和精力了。你得去各大网站找你要的文章,然后复制采集
。不过人工运输也有好处,就是我们可以改Find exactly what you want。
2.使用采集软件批量采集。之前跟大家说的小说采集
站的玩法其实和采集
软件差不多。采集软件可以根据我们提供的关键词自动采集,对于自媒体网站的文章也会显示阅读数、评论数等。
使用采集软件有利于我们分析数据,比如哪篇文章更受欢迎,更受欢迎。我们可以通过数据分析所有这些,然后将它们传输到我们的网站。
使用采集
的文章来优化网站:
对于一个网站来说,内容很重要,除非你是付费玩家(SEM),否则不做内容也能获得好的排名。对于我们草根站长来说,内容就像是一栋楼的地基。
必须先打好地基,才能建造摩天大楼。
" />
所以如果你想利用采集
的文章来优化你的网站,我建议你重点关注网站优化的几个要点。首先是网站的TDK编写。网站的TDK编写很重要。
百度蜘蛛进入你的网站后,首先抓取的是网页的TDK。
有的朋友可能不知道什么是TDK。主要是网页的三大标签,标题(title),关键词(keywords)和描述(description),所以在发表文章的时候一定要合理设置。
第二点是网页内链的锚文本。由于我们选择采集文章进行优化,所以每天都有大量的文章发布。这时候可能会有更多的百度蜘蛛来抓取网站内容。
而我们就是想利用好这样一个特性,让百度蜘蛛继续深入爬取。通过设置网站文章的内部链接,它会在我们的网站中不断爬取和抓取。这将有助于增加我们网站的整体权重。
第三点是关于网站内部的评论模块。虽然前期可能会说没有人会在我们的网站上发表评论,但是我们可以自己发表评论。其实百度蜘蛛也会抓取评论模块,那我们应该怎么使用呢?好评呢?
我的拙见是我们可以使用注释来增加关键词的密度。百度也评估了页面上关键词的密度。我们在站长工具中看到推荐的密度在2%到8%之间。之间,
至于是真是假,我不知道,但不管是真是假,还是建议大家好好利用评论模块。如果有效怎么办?没错,这些都是不准确的。