什么是用户画像？

什么是用户画像？
对如何从0到1建设用户画像体系进行了梳理分析，主要是4个步骤：业务需求分析、建设标签体系、建设画像系统和画像应用。

从PC到移动互联网，一批搭乘流量红利快车的互联网产品，曾极速崛起。而如今，流量红利消失，一个疯狂的、传奇般的流量时代，已然结束。增量乏力，存量市场竞争更加激烈的环境下催生了精细化运营，结合大数据，对用户进行分群，针对不同群体的用户采用不同的营销策略。

兵法云：“知己知彼，百战不殆”，在整个精细化运营过程中，用户画像体系的搭建起到不可或缺的作用。前面介绍了埋点数据采集、指标体系搭建、数仓和OLAP分析等数据基础层建设，接下来我们来研究如何从0-1搭建用户画像体系，以及用户画像的应用场景。

一、初识用户画像

用户画像的概念，最早由交互设计之父Alan Cooper提出，是对产品或服务的目标人群做出的特征刻画。

在早期，用户数据的来源渠道比较少，数据量也相对比较小的时期，用户画像的研究主要基于统计分析层面，通过用户调研来构建用户画像标签。

后来，加利福尼亚大学的Syskill和Webert，通过手动收集网站用户对页面的满意度，然后通过统计分析逐渐构建出用户兴趣模型。

再随着互联网及信息采集技术的发展，加州管理大学开发了Web Watcher，可以通过数据采集器，记录互联网上用户产生的各种浏览行为以及用户的兴趣偏好，实现对用户兴趣模型的构建，并随着数据的不断累积，扩大更新系统模型，用户画像标签也更加丰富。

近年来，随着互联网海量数据的爆炸式增长，众多企业的用户画像研究有了新的机遇，基于用户的属性、行为、兴趣爱好等数据标签，运用算法对特征进行分析建模，从而抽象出用户的全貌，成为了产品人员的关注重点。

例如对于路飞而言，其用户画像可简单描述为18-25岁中二少年，15亿身价，爱吃肉，爱炫酷机器人，冲动性消费人群，若某电商网站提前得知了该用户信息，就可以根据其偏好特征，给其推送肉类以及高科技商品，促进路飞在平台上完成购买。

这个过程中，用于描绘用户画像的关键性因素就是标签，通常不同应用场景下，标签分类不同。

例如腾讯广告对标签的分类，可分为：
- 人口学标签：性别、年龄、居住地、学历、婚恋、资产及工作状态等。
- 兴趣类标签：商业兴趣、泛娱乐兴趣、语义兴趣等。
- 设备类标签：设备品牌、运营商、联网方式、型号、操作系统等。
- 行为类标签：人群上班地、出游频率、使用电商购物、O2O、游戏等应用特定行为、互动行为、支付行为等。
按阿里电商对标签的分类，可分为：
- 用户属性类标签：性别、年龄、地域、注册日期、手机品牌、手机系统、联系方式、历史购买状态、用户活跃度、RFM价值度。
- 用户行为类标签：近30日访问次数、近30日客单价、近30日活跃天数、近30日访问时长、平均访问深度、充值用户等。
- 消费类标签：收入状况、购买力水平、已购商品、购买渠道偏好、最后购买时间、购买频次。
- 商品品类标签：高跟鞋、靴子、衬衫、法式连衣裙、肉脯、牛肉干、扫地机器人、智能音响等。
- 社交类标签：经常活跃的时间段、活跃地点、单身、评价次数、好评度等。
整个画像体系包含标签建模、画像系统、画像应用，那从数据产品层面来看，如何0-1建立用户画像体系呢？接下来我们按照如下结构进行展开：
1. 业务需求分析
2. 建设标签体系
3. 建设画像系统
4. 画像应用
二、什么是用户画像？

(1）首先用户画像是个动词逻辑，不是名词，就是给用户绘制肖像。

(2）在互联网这个平台上，绘制肖像就相当千给用户打标签

(3）标签通常是人为规定的高度精炼的特征标识，如年龄、性别、地域、兴趣等

(4）这些标签集合就能抽象出一个用户的信息全貌

用户画像有啥应用

(1) 精准营销: 从粗放式到精细化，将用户群体切割成更细的粒度，辅以短信、推送、邮件、活动等手段，驱以关怀、挽回、激励等策略。
(2) 数据应用: 用户画像是很多数据产品的基础，诸如耳熟能详的推荐系统广告系统。
(3) 用户分析: 产品早期，通过用户调研和访谈的形式了解用户。在产品用户量扩大后调研的效用降低，这时候会辅以用户画像配合研究。

第一步：业务需求分析

用户画像体系的建设不能凭空捏造，需要以经济建设为中心，根据实际的业务需求，考量画像系统能为业务带来的价值，所以我们第一步要做的是分析业务需求。

明确用户画像服务于企业的对象，如产品、用户运营、活动运营、市场、风控等部门；再根据业务方需求，明确未来产品建设目标和用户画像分析之后的预期效果。

就公司整体而言，他的目标是提升平台整体的收益，过程中会驱动产品、运营、数据分析、市场、客服等同事协同工作，画像会更加关注如何进行精细化运营，提升公司营收上；

就运营人员娜美而言，她的目标是提升转化率，过程中会采用内容的个性化推送的策略、用户精准触达，画像会更加关注用户个人行为偏好上；

就数据分析人员罗宾而言，她的目标是做用户的流失预警，做针对性的精准营销，那过程中就需要分析用户行为特征，用户的消费偏好；

在需求分析阶段，我们需要分析业务过程，各部门核心关注点、部门KPI、组织结构、用户行为路径、功能流程图。此处分析过程跟埋点业务需求分析类似，详情可查看埋点业务需求分析，此处不做展开。

第二步：搭建标签体系

从数据产品建设标签体系来看，可以根据标签的统计方式，将标签分为3类：统计类标签、规则类标签、预测类标签；

1. 统计类标签

用户画像最为基础常见的标签，统计类标签值统计用户相关数值、客观描述用户状态的标签，这类数据通常可以从用户注册数据、用户访问、消费统计中可以得出。

例如对于某个用户来说，其性别、年龄、城市、星座、近7日活跃天数、近7日活跃次数、累计购买金额、累计购买次数、月均消费金额等字段，

2. 规则类标签

基于用户行为及确定的规则产生，在实际开发画像的过程中，根据业务的需要，由运营人员和数据人员共同协商制定，包含活跃度标签、RFM标签等。例如，对平台上“交易活跃”这一口径的定义为“近90天交易次数>3”。

下面由草帽小子来介绍，常用的用户活跃度标签、RFM标签的划分方法。

（1）用户活跃度标签

实际业务场景中会涉及根据用户的活跃情况，给用户打上高活跃、中活跃、低活跃、流失等标签。

那这个过程中高中低的时间范围是如何划分的呢？

在这里，路飞的拍脑门可行不通，标签的建设讲究定义有依据，建设有方法。

首先划分用户的流失周期，通常有2种方法：

一是拐点理论：X轴上数值的增加会带来Y轴数值大幅增益（减益），直到超过某个点之后，当X增加时Y的数据增益（减益）大幅下降，即经济学里面的边际收益的大幅减少，那个点就是图表中的“拐点”。

比如图中流失周期增加到5周的时候，用户回访率的缩减速度明显下降，所以这里的5周就是拐点，我们可以用5周作为定义用户流失的期限，即一个之前访问/登录过的用户，如果之后连续5周都没有访问/登录，则定义该用户流失。

二是统计用户最后一次访问与倒数第二次访问之间的时间间隔，可认为大于这个时间间隔的用户基本不会再访问，即用户已流失。查看历史数据可以了解到用户最后一次访问与倒数第二次访问间隔30日以上的用户不足10%，可以认为大于这个时间间隔的用户为“流失用户”。

划分完流失周期之后，根据用户的活跃情况进一步将其划分高中低活跃。对历史数据，按照二八原则进行划分。

例如分析得出活跃次数10次以上的用户占近30日访问用户量的20%，则这批为“高活跃用户”；进一步把活跃5-10次的用户划分为“中活跃用户”；把活跃1-5次的用户划分为“低活跃用户”。
相关阅读:
mysql和sqlserve中smallint存储什么类型数据？
区别Vue 2.0 和 Vue 3.0
grep基础正则使用
 Educational Codeforces Round 155 (Rated for Div. 2)(A-D)
尚硅谷大数据项目《在线教育之实时数仓》笔记001
MySQL语句基本介绍
 量化交易之One Piece篇 - linux - 定时任务（重启服务器、执行程序、验证）
纷享销客联合B.P商业伙伴携手30+企业CEO走进南天信息
 Dapr 集成 Open Policy Agent 实现接口的访问控制
 安捷伦N8974A分析仪
原文地址：https://blog.csdn.net/summer_fish/article/details/133409716

一、初识用户画像

二、什么是用户画像？

第一步：业务需求分析

第二步：搭建标签体系

1. 统计类标签

2. 规则类标签

（1）用户活跃度标签