编辑导语:如今在这个大数据时代,每个用户都被标签化,运用用户画像的方式了解用户,从而推送相关消息;最常见的情况就是你买了商品后,推荐会自动推送与此商品相关的商品,促进消费;本文作者分享了关于什么是真正的用户画像,我们一起来看一下。
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。
我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来;作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。(来源百度)
一、用户画像是什么?
用户画像的核心是为用户打标签,即——将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。
我理解的用户画像是一种标签(浅层次)、数据的集合体(深层次),最终的导向还是获取用户的信息,并提供战略决策。
1. 什么是标签
举个例子:男,28岁,未婚,收入2万,爱美食,科技控,喜欢美女、喜欢旅游、有车。
这样的描述,就是一个初步的用户画像,就是一组标签信息(即用户信息标签化)。
那么我们再看一下这一张截图:
(来源站酷,某作品集中的一页)
这很明显是一个反面教材了,大家能在这张截图中,看出什么标签吗?
从,姓名、学生、年龄、快毕业、艺校生、探索未知等标签就可以了解到专业水平、学习兴趣?这是怎么挖掘出来的?
标签又可以分为三大类(宽泛):
- 统计类标签:这类标签是最为基础也最为常见的标签类型,例如:对于某个用户来说,其姓名、性别、年龄、地市、活跃时长等,这类数据可以从用户注册数据、用户消费数据中得出,该类数据构成了用户画像的基础。
- 规则类标签:该类标签基于用户行为确定的规则产生。例如:定义该用户为高频投诉用户,规则为“近30天投诉次数>10”;在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则由运营人员和数据人员共同协商确定。
- 学习挖掘类标签:该类标签通过系统智能化学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断;例如:根据用户的消费行为习惯判断该用户的消费能力、对某类商品的偏好程度,该类标签需要通过算法挖掘产生。
标签规则(举例:这个规则是在给用户定上具有消费力等等标签)。
相同的商品:我妹妹打开某宝,东西都贼便宜,而我贼贵,你们懂了吧。
2. 为什么需要标签?
用户画像的核心工作是为用户打标签。打标签的重要目的之一就是为了让用研或者产品能够理解并且方便数据统计。
以电商举例:
如,标签可以做分类统计:喜欢美食的用户有多少?喜欢美食中的男女比例又是多少?
在做精细分类:喜欢甜食的有多少?喜欢辣条的有多少?那么他们的地域分布比例又是多少?那么针对凉茶的男女喜好比例又有多少?
如:标签可以做数据挖掘/清洗:利用关联规则计算,喜欢美食的人,通常会喜欢什么什么卧室环境。那么同样也可以分析出什么地域的人偏好什么样的美食,什么样的环境。
根据初步数据分析结果,我们可以得出,一旦这个上海地域的人登录了某电商APP,可以快速根据该地域喜欢的,推就完事了(如:上海人大多数都喜欢偏甜的零食,或者小资生活的周边、布置等等)。
那么这里会牵扯到「模型」,通过算法和培养,能让一个APP更加懂你。
比如:我在某宝上,买了一个汽车改装用品,就疯狂给你推荐汽车相关;因为我购买(达成)、浏览相关(计算)和浏览时间(培养),让他更加确定了,我对这方面的需求很大。
二、数据分析本质是什么?
由于本文重点倾向交互侧,数据分析这一块留着下次说。
数据分析的本质是获得信息和知识,从而在判断和决策中使用。
根据分析的方法和目的,数据分析可以被划分为:
描述性分析(Descriptive Analysis):将数据整合为一份可视化的报告,进行演讲或陈述,但它不能解释某种出现的结果及未来发生的事情。
1. 信息可视化
预测性分析(Predictive Analysis):预测性分析不仅可以对数据特征和变量(可以假定取消范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。
预测性分析首先会确定变量值之间的关联,然后基于这种已知的关联预测另一种现象出现的可能性(如:某短视频中会产生广告,通过行为事件进行预测你购买/下载产品的可能性)。
2. 预测分析
决策性分析(Decision Analysis):通过对比、验证等手段,直接反应情况,给出明确的好坏。
所以要分析数据,至少要包含描述性分析的能力,这样获取的信息才有价值。(回顾上文,可以关联标签的含义)剩下的就是进阶能力,预测和决策了;让用研和产品同学更高效的、更准确的解决问题,而不是纸上谈兵“我认为”、“我感觉”。
数据又分为静态和动态数据:
静态信息数据:静态数据在很长的一段时间内不会变化,一般不随运行而变。包含有:人的基本属性,公司基本属性、商业属性等等;一般来说,做调研获得的静态数据都是真实的信息,无需进行分析和清晰。
动态信息数据:动态数据是常常变化,直接反映事务过程的数据,比如,网站访问量、在线人数、日销售额等等,也就是用户不断变化的行为。
得出的数据是为了完成用户画像的架构图:
三、定量验证
如果算法或者模型没跑起来的话,我们需要带着描述性分析+定量验证,去构建初步的用户画像(如果是算法和模型搭建起来的用户画像则不要验证)。
这篇不重点讲定量了,如果还有小伙伴不知道的,可以去看前面的文章《定量与定性》。
四、构建用户画像
以韩梅梅的户画像为例,我们将其年龄、性别、职位、等等,通过场景描述,挖掘用户痛点,从而了解用户动机;其中将21~30岁最为一个年龄段,以职业作为一个范围,利用数据分析(定性)得到数据标签结果,最终满足业务需求,从而让构建用户画像形成一个闭环。
以一个健身APP为例:
画像重要组成部分:
揭示关键差异(目标行为和观点):给用户一个定义名称,这个名称要围绕产品最关键的特点凸显出来,也可以从目标行为和观点上去定义。
基础信息:一个虚构的典型用户,可能跟某类用户的大部分人比较相似,但不会是某一个具体的人;有了这些个人信息,能够让用户画像看起来更像一个真实的人,更容易引起用户的同理心(根据调研信息抹去真实的信息,如:名字、职业等等)。
相关设备产品使用情况:标识出相关特点,比如产品的使用情况,一天的生活轨迹等等,这部分内容主要跟产品、研究对象、研究目标相关。
竞品使用情况:可以围绕差异点来提供思路。
简介场景:比如健身类的产品,那么整个故事背景要围绕这个健身去展开。
其他重要属性:其他的重要属性可以帮助我们去理解用户,为了让用户形象更生动;个人语录:如:我立了一个flag,降低体脂,我会围绕这个目标坚持下去的。
最后得出的画像还需要计算TGI。
TGI:Target Group Index(目标群体指数) TGI=[「目标用户群」中某一特征的总用户数在「目标用户群」总用户数的占比/「全量用户」中具有该特征的总用户数在「全量用户」总用户数的占比]*标准数100 TGI指数大于100,则说明该特征用户倾向较强(和平均相比) 小于100,则说明该类用户相关倾向较弱(和平均相比) 而等于100则表示在平均水平。
最后将画像信息标签化-建立数据分析-验证(如:ABtest)——转化为实际场景的用户画像——最终决策(如果是算法和模型搭建起来的用户画像则不要验证)。