第三章 数据化运营中常见的数据分析项目类型
卡举万变,其道一也。 -《荀子·儒效》
3.1 目标客户的特征分析
3.2 目标客户的预测(响应、分类)模型
3.3 运营群体的活跃度定义
3.4 用户路径分析
3.5 交叉销售模型
3.6 信息质量模型
3.7 服务保障模型
3.8 用户(买家、卖家)分层模型
3.9 卖家(买家)交易模型
3.10 信用风险模型
3.11 商品推荐模型
3.12 数据产品
3.13 决策支持
一个成功的数据分析挖掘项目,首先要有准确的业务需求描述,之后则要求项目相关人员自始自终对业务有正确的理解和判断。
对于业务的理解和思考,永远高于项目的匪类和分析技术的选择。
3.1 目标客户的特征分析
特征分析是数据化运营中最普遍、频率最高的业务分析需求之一。找准目标用户、目标受众,然后是相应的运营方案、个性化产品与服务等。这是与传统粗放模式最直接、最显性的区别。
基于用户数据,整理分析出该产品的核心目标用户特征的分析报告,以供后期运营团队、产品开发团队、服务团队更有针对性、更有效第尽心个运营和服务。
3.2 目标客户的预测(响应、分类)模型
预测(响应、分类)模型:
- 流失预警模型
- 付费预测模型
- 续费预测模型
- 运营活动响应模型
数据化运营6要素的核心是以数据分析挖掘志成的目标响应概率(probability)。
预测模型基于真实业务场景产生数据而进行的预测(响应、分类)模型搭建,其中涉及的主要数据挖掘技术包括逻辑回归、决策树、神经网络、支持向量机等。
3.3 运营群体的活跃度定义
运营群体(目标群体)的活跃度:
- 活跃度的组成指标应该是该业务场景中最核心的行为因素;
- 衡量活跃度的定义合适与否的重要判断依据是其能否有效回答业务需求的中级目标。
案例1:
产品与用户的洽谈动作(表现为洽谈次数)
在线登录该产品的次数
需求分析的中级目标是促成付费用户的转化。
活跃度的定义涉及统计技术有:主成分分析和数据标准化。
主成分分析
把多个核心行为指标转化为一个或者少数几个主成分,并最终转化为一个综合分数,作为活跃度的定义,到底去第一个主成分,还是前两个或者前3个取决于种成分分析的特征跟和累计方差贡献率。一般累计方差贡献率打到80%以上,则可以基本认定前面几个主成分就可以相应第代表原始数据的大部分信息。
3.4 用户路径分析
用户路径分析是互联网行业特有的分析专题,主要是分析用户在网页上流转的规律和特点,发现频繁访问的路径那个模式,这些路径的发现可以有很多业务用途,宝货提炼特定用户群体的主流途径、网页设计的优化和改版、用户可能浏览的下一个页面的预测、特定群体的浏览特征等。
很多部门都需要应用用户路径分析,包括运营部门、产品涉及部门(PD)、用户体验涉及部门(UED)等。
用户路径分析所用的数据主要是web服务器中的海量日志数据。
路径分析常用的分析技术: 一类是算法支持的,一类是严格按照不走顺序遍历主要路径。
3.5 交叉销售模型
一旦客户购买了商品(或者成为付费用户),企业就会想方设法保留和延长这些客户在企业中中的生命周期和客户的利润贡献,一般会选择两个运营方向;
- 延缓客户流失,通常是客户流失预警模型发挥作用,提前锁定最可能流失的有价值用户,然后残躯关怀措施,降低客户流失率;
- 让客户消费更多的商品和服务,提高客户的商业价值,挖掘客户利润,通过数据挖掘找出客户进一步的消费需求引导消费。
建立交叉销售模型的4个思路: - 按照关联技术(association analysis),即购物篮分析,进行有针对性的促销和捆绑销售;
- 借鉴响应模型,为某几种重要的商品分别建立预测模型,对潜在消费者通过这些特定模型惊醒过滤,然后针对最有可能的前5%消费者进行精确的营销推广;
- 借鉴预测响应模型,让重要商品两两组合,找出最有可能消费的潜在客户;
- 通过决策树清晰的树状规则,发现基于具体数据资源的具体规则
相应的建模技术主要包括关联分析(association analysis)和序列分析(sequence analysis)