有些面试候选人虽然有相关的工作经历或者实习经验,但是因为在工作中没有自己的思考,在面试中并没有给自己加分。只有用心思考如何利用数据为公司创造价值并付诸实践,才是一个好的数据分析师应该做的。
一、数据人员如何创造价值
随着大数据的发展,公司的数据库中存储着大量的数据,这些数据大多是公司内部技术人员通过埋点获取的,也有些是通过第三方机构获取的。如何充分利用这些数据,创造价值,推动公司的发展,是数据分析师所应该思考的。
作为数据分析师,经常被问到的问题是“XXX 数据最近上升/下降了,是什么原因造成的?” “新上线的功能给业务带来的是正面影响还是负面影响”“对于 XXX,我们需要制定什么样的策略,完成 KPI/OKR? ”……解决业务方的问题,并提出建设性意见,就体现出了数据分析师的价值。
面对数据库中的海量数据,数据分析师首先要做的就是构建合理的指标体系或者模型,合理地“整理”这些数据。指标体系可以分成两个部分——通用的规则和针对具体业务的特定规则;模型则包含了比较多的类型,如业务模型、数据挖掘模型等。在构建好合理的指标体系或者模型后,接下来就可以通过报表或者数据看板的方式,对数据进行监控,并且制定相应的监控规则,根据监控结果实时调整策略。有了合理的监控规则和监控结果,下一步要做的就是将获取到的内容进行整合,输出完整的分析报告,或者调整相应的策略,继续追踪调整后的效果,真正指导业务的发展。
总结起来,就是:
- 基于历史数据和业务背景构建指标体系或者模型。
- 基于指标体系,监控线上业务数据并制定相应的监控规则。
- 输出数据分析报告或者提供可执行策略,推动业务的发展。
二、完整的指标体系构建
在数据分析师的工作中,针对“xxxApp 或 xxx 功能模块最近的用户量或者其他相关指标下降了,你会如何进行分析”等问题,最直接的解决方法就是建立完整的指标体系。通过指标体系,能够很直观地发现问题所在,并且可以针对问题采取相应的措施。
Q :要构建一套指标体系,整体思路是什么?
构建指标体系应该“纵向”和“横向”相结合,纵向指的是梳理出分析问题的整个流程,比如对于电商产品,需要分析出用户从进入网站到最终下单的整个流程;对于工具类产品,则需要关注用户使用过程中的体验以及用户流失情况。有了纵向分析的过程,还需要横向拓展不同的维度,如基于用户画像的人群分类、根据不同业务背景的时间拓展以及业务线的划分。最后将纵向和横向的结果相结合,就得到了一套完整的指标体系。
Q:用户行为的核心节点有哪些?如何有针对性地设计指标?
了解用户行为的核心节点,实际上就是纵向分析的过程。互联网公司大多针对 C 端用户进行分析,这里就以 C 端用户为例进行介绍。对于 C 端用户,核心的三个节点是新增、活跃、留存/流失,大多数分析都是围绕这三个节点逬行的,整个流程如图 5-1 所示。
可以看到,针对新增、活跃、留存/流失这些节点,可以纵向设计出很多指标,但主要是绝对数量和百分比。
- 对于新增用户,指标有新增用户数量、新增用户留存率、新增用户活跃率等。
- 对于活跃用户,指标有活跃用户数量、活跃用户中的新增用户数量、活跃用户中 的老用户数量等。
- 对于老用户,指标有老用户螭、老用户老用户唤醒率等。
- 对于流失用户,指标有流失用户数量、流失用户与新增用户比率等。
这样就可以针对用户的整体行为节点进行比较完整的指标设计,其中活跃用户部分是需要重点关注的,通过对从新增到流失整个流程指标的构建,可以清晰地看出在哪个环节最终活跃用户数增加了或者减少了。
Q:对于活跃用户,应该如何进行相应的指标设计及路径分析?
对于活跃用户,要研究其活跃行为,从而提高用户的体验。针对不同类型的产品,需要进行相应的细分设计。比如对于电商产品,需要关注的是从来访用户到用户最终成功支付的整个流程,如图 5-2 所示。
可以看到,针对这个流程的每一步都可以统计出相应的用户数量以及上一步的转化率,比如来访用户数量、点击用户数量、加入购物车用户数量、下单用户数量、支付用户数量、最终成功支付用户数量,以及各种转化率,如点击/曝光转化率、下单/点击转化率、下单/加购转化率、支付/下单转化率、成功支付/支付转化率。这些指标就构成了一个完整的纵向指标体系,通过这些指标可以清晰地看出哪个环节存在问题。
对于电商产品,除了要关心用户数量,金额也是要关心的指标。从加购开始,每个环节在用户数量的基础上都需要增加金额指标以及相应的客单价指标。
以上是对电商产品活跃用户的纵向分析。下面再举一个短视频的例子。对于短视频, 需要分为视频的观看者和视频的发布者两个独立的用户群体进行分析。对于视频的观看者,需要考虑的是各种行为数据,相对路径比较短,如图 5-3 所示。
针对用户的这些行为设计相关的指标,比如观看视频的数量、整体时长、点赞视频占比、评论视频占比等,这些指标刻画了用户观看视频的体验情况。
对于视频的发布者,则需要关注整个流程,看在某个环节的转化上是否存在问题,造成发布的视频数量减少,如图 5-4 所示。
以上就是构建指标体系的纵向部分,其中包括了用户从新增到流失/留存的整个流程,这是比较通用的指标体系建立方法。同时针对一些产品的活跃用户逬行了分析。大 家在面试前需要对所要应聘部门的业务有所了解,梳理出产品中用户的生命周期以及活 跃用户的行为情况。
Q:有了明确的用户行为路径及相关指标后,如何进一步分析?
除了纵向分析,还需要横向分析,横向分析是指对于同一个指标,基于不同的维度进行相应的拓展,常用的维度包括时间维度和用户维度。
Q:针对时间维度的分析,需要注意的点有哪些?
对于时间维度,常用的分析方法是关注最近一段时间的数据,时间的长短要根据业务的具体特性来确定。对于一些高频的 App 或者功能,通常关注最近 1~ 7 天的整体数据情况即可,也可以是自然周。对于一些相对低频的 App 或者功能,则需要将时间拉长,关注最近 15 天、30 天、90 天甚至更长时间的整体数据,也可以是自然月、季度甚至自然年。
另外,与时间维度相关的有同比和环比的概念。因为单纯地关注一段时间的数据并 不能很好地看出趋势情况,需要与之前的数据逬行对比。对于同比和环比的概念,在实际应用中不需要逬行很明确的划分。常用的对比方法是对比当日与上日、本周与上周、本月与上月的数据。对于一些周期性比较强的产品,则需要先确定产品的周期,比如有些产品会受到周末的影响,此时比较合理的对比方法是用本日的数据与上周同一日的数 据进行对比;有些产品会受到大型节假日的影响,此时针对节假日数据,就需要与上一个大型节假日的数据进行对比。
对于一些对实时性要求高的产品,需要将数据指标细化到小时级别。处理后的时间维度分析方法如图 5-5 所示。
除了时间维度,还有一种常用的拓展方法,就是基于用户画像的用户维度进行拓展。用户画像是互联网公司中常用到的分析工具,通过用户画像可以有效了解各个群体的行为情况,也可以基于用户画像拓展出相应的指标。
Q:列举常用的用户维度拓展方法。
有很多通用的用户维度拓展方法,比如对于用户所在地,可以分为城市、省份,甚 至华东、华南等大区;对于用户的基本属性,可以分为年龄、性别、职业等;对于用户使用的设备情况,可以分为终端类型、客户端版本、厂商、机型等;对于新老用户,也可以拓展出一些指标。对于新用户,需要关注的是用户来源渠道,通常分为自然新增用 户、活动新增用户、广告新增用户等渠道,通过对渠道的划分,可以在一定程度上避免 一些大型活动对新增用户分析带来的影响;对于老用户,根据用户的生命周期逬行划分, 通常分为有效用户、活跃用户、忠诚用户、沉睡用户和流失用户,可以对产品整体趋势 有一个清晰的了解。
梳理后的用户维度拓展方法如图 5-6 所示。
以上纵向和横向两个方向讲解了如何构建一套完整的指标体系。在数据分析师岗位面试前,候选人需要对所要面试公司的产品有一定的了解,这样一方面可以进行有针对性的准备;另一方面也可提前构建起一套指标体系。下面通过问题对前面的内容进行总结
Q: XXX 最近有所下降,如何进行分析?
针对这个问题,需要充分利用前面所讲的指标体系,按照如下步骤逬行分析。
(1) 梳理与该问题相关的流程,确定纵向指标体系。比如是支付金额有所下降,就需要梳理:曝光-点击-下单-支付这样完整的用户路径,以各个环节的转化率和用户量为核心指标。
(2) 针对核心指标,确定所要对比的时间维度,比如基于所要分析的产品确定与前一天或者前一周的数据进行对比,发现问题所在。
(3) 确定问题所在的环节后,针对该环节以用户维度进行拓展,如基本属性、所在地、设备情况、新老用户等,确定引起该问题的用户群体,并针对这部分用户逬行相应的策略调整。
除了上述问题,对于“新版产品或者某个运营活动上线后,如何评估效果”等问题, 也可以采用相同的方法进行分析,只做微调即可。总结起来,整个思路就是:梳理路径一 确定对比的指标一选取对比的时间维度-针对问题环节拓展用户维度。
本节内容总结如图 5—7 所示。