对如何从0到1建设用户画像体系进行了梳理分析,主要是4个步骤:业务需求分析、建设标签体系、建设画像系统和画像应用。
从PC到移动互联网,一批搭乘流量红利快车的互联网产品,曾极速崛起。而如今,流量红利消失,一个疯狂的、传奇般的流量时代,已然结束。增量乏力,存量市场竞争更加激烈的环境下催生了精细化运营,结合大数据,对用户进行分群,针对不同群体的用户采用不同的营销策略。
兵法云:“知己知彼,百战不殆”,在整个精细化运营过程中,用户画像体系的搭建起到不可或缺的作用。前面介绍了埋点数据采集、指标体系搭建、数仓和OLAP分析等数据基础层建设,接下来我们来研究如何从0-1搭建用户画像体系,以及用户画像的应用场景。
用户画像的概念,最早由交互设计之父Alan Cooper提出,是对产品或服务的目标人群做出的特征刻画。
在早期,用户数据的来源渠道比较少,数据量也相对比较小的时期,用户画像的研究主要基于统计分析层面,通过用户调研来构建用户画像标签。
后来,加利福尼亚大学的Syskill和Webert,通过手动收集网站用户对页面的满意度,然后通过统计分析逐渐构建出用户兴趣模型。
再随着互联网及信息采集技术的发展,加州管理大学开发了Web Watcher,可以通过数据采集器,记录互联网上用户产生的各种浏览行为以及用户的兴趣偏好,实现对用户兴趣模型的构建,并随着数据的不断累积,扩大更新系统模型,用户画像标签也更加丰富。
近年来,随着互联网海量数据的爆炸式增长,众多企业的用户画像研究有了新的机遇,基于用户的属性、行为、兴趣爱好等数据标签,运用算法对特征进行分析建模,从而抽象出用户的全貌,成为了产品人员的关注重点。
例如对于路飞而言,其用户画像可简单描述为18-25岁中二少年,15亿身价,爱吃肉,爱炫酷机器人,冲动性消费人群,若某电商网站提前得知了该用户信息,就可以根据其偏好特征,给其推送肉类以及高科技商品,促进路飞在平台上完成购买。
这个过程中,用于描绘用户画像的关键性因素就是标签,通常不同应用场景下,标签分类不同。
例如腾讯广告对标签的分类,可分为:
按阿里电商对标签的分类,可分为:
整个画像体系包含标签建模、画像系统、画像应用,那从数据产品层面来看,如何0-1建立用户画像体系呢?接下来我们按照如下结构进行展开:
(1)首先用户画像是个动词逻辑,不是名词,就是给用户绘制肖像。
(2)在互联网这个平台上,绘制肖像就相当千给用户打标签
(3)标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、兴趣等
(4)这些标签集合就能抽象出一个用户的信息全貌
用户画像有啥应用
(1) 精准营销: 从粗放式到精细化,将用户群体切割成更细的粒度,辅以短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。
(2) 数据应用: 用户画像是很多数据产品的基础,诸如耳熟能详的推荐系统广告系统。
(3) 用户分析: 产品早期,通过用户调研和访谈的形式了解用户。在产品用户量扩大后调研的效用降低,这时候会辅以用户画像配合研究。
用户画像体系的建设不能凭空捏造,需要以经济建设为中心,根据实际的业务需求,考量画像系统能为业务带来的价值,所以我们第一步要做的是分析业务需求。
明确用户画像服务于企业的对象,如产品、用户运营、活动运营、市场、风控等部门;再根据业务方需求,明确未来产品建设目标和用户画像分析之后的预期效果。
就公司整体而言,他的目标是提升平台整体的收益,过程中会驱动产品、运营、数据分析、市场、客服等同事协同工作,画像会更加关注如何进行精细化运营,提升公司营收上;
就运营人员娜美而言,她的目标是提升转化率,过程中会采用内容的个性化推送的策略、用户精准触达,画像会更加关注用户个人行为偏好上;
就数据分析人员罗宾而言,她的目标是做用户的流失预警,做针对性的精准营销,那过程中就需要分析用户行为特征,用户的消费偏好;
在需求分析阶段,我们需要分析业务过程,各部门核心关注点、部门KPI、组织结构、用户行为路径、功能流程图。此处分析过程跟埋点业务需求分析类似,详情可查看埋点业务需求分析,此处不做展开。
从数据产品建设标签体系来看,可以根据标签的统计方式,将标签分为3类:统计类标签、规则类标签、预测类标签;
用户画像最为基础常见的标签,统计类标签值统计用户相关数值、客观描述用户状态的标签,这类数据通常可以从用户注册数据、用户访问、消费统计中可以得出。
例如对于某个用户来说,其性别、年龄、城市、星座、近7日活跃天数、近7日活跃次数、累计购买金额、累计购买次数、月均消费金额等字段,
基于用户行为及确定的规则产生,在实际开发画像的过程中,根据业务的需要,由运营人员和数据人员共同协商制定,包含活跃度标签、RFM标签等。例如,对平台上“交易活跃”这一口径的定义为“近90天交易次数>3”。
下面由草帽小子来介绍,常用的用户活跃度标签、RFM标签的划分方法。
实际业务场景中会涉及根据用户的活跃情况,给用户打上高活跃、中活跃、低活跃、流失等标签。
那这个过程中高中低的时间范围是如何划分的呢?
在这里,路飞的拍脑门可行不通,标签的建设讲究定义有依据,建设有方法。
首先划分用户的流失周期,通常有2种方法:
一是拐点理论:X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。
比如图中流失周期增加到5周的时候,用户回访率的缩减速度明显下降,所以这里的5周就是拐点,我们可以用5周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续5周都没有访问/登录,则定义该用户流失。
二是统计用户最后一次访问与倒数第二次访问之间的时间间隔,可认为大于这个时间间隔的用户基本不会再访问,即用户已流失。查看历史数据可以了解到用户最后一次访问与倒数第二次访问间隔30日以上的用户不足10%,可以认为大于这个时间间隔的用户为“流失用户”。
划分完流失周期之后,根据用户的活跃情况进一步将其划分高中低活跃。对历史数据,按照二八原则进行划分。
例如分析得出活跃次数10次以上的用户占近30日访问用户量的20%,则这批为“高活跃用户”;进一步把活跃5-10次的用户划分为“中活跃用户”;把活跃1-5次的用户划分为“低活跃用户”。