秦路的博客:https://ask.hellobi.com/blog/qinlu/6086
- 需要配合视频阅读。
- 同时提供了初中级别的必读书单。
这是一门比较全面的数据分析入门课程。分为7个模块。
分析思维:
数据分析是为了解决企业的问题。不是为了分析而分析。
带着4个问题学习:
- 这个月KPI又没有达成,业务数据没有提示,为什么分析没有效果?
- 跑SQL的,天天给业务部分跑数据,何时是个头啊?
- 零零碎碎,什么是数据分析体现?道理懂,但都是碎片化
- 老板的心思你别猜,每次报告都不触及老板,他到底想要什么?
为什么七周?
数据思维,业务知识,Excel, 数据可视化,SQL, 统计学, Python。在工作中都很重要!
- 一门交叉领域的学科
- 用EXCEL可以完成基础的报告,也可以使用PYthon深入挖掘数据。
- 决定数据分析师上限的是能力:解决问题的能力,不是工具(Excel, Python)。
数据分析的结构层次
底层数据的收集/产品端收集:
埋点(采集),收集网页端,产品端,客户端的数据,也包括第三方外部数据。
用户行为-原始数据
数据业务化/产品需要什么样的数据?
将收集的数据转化为可理解,可量化比较的业务数据。只有和业务本身结合才有价值。
原始数据-加工数据
数据可视化/产品的表现如何?
建立数据指标体系,监督和衡量数据指标。
加工数据-可视化数据/信息。bi
数据决策和执行/怎么让产品更好
数据分析师应当参与进去,提供建议。从数据中获得的洞察,要转化为策略,这就包括分析过程。
执行既包括策略的制定,也包括优化和改进。
可视化数据/信息-数据决策
数据模型/产品开始自动化和系统化的运营
类似发现了用户需求,然后把需求作成产品。
这是将策略制作成数据应用和产品,当发现数据中蕴含的规律,比如什么样的用户喜欢,什么样的商品会被购买,什么样的活动形式更好,就尝试包这些作出系统
数据决策-数据产品/应用
数据战略/指导未来。
当积累了大量数据,模型,应用后,公司级别的数据体系形成了。
数据工具-数据体系/战略。
每个概念都不是独立的:
- excel+统计->分析工具库
- sql+python->PyMysql
- 可视化+python-> Matplotlib
- 可视化+sql+python->Superset
数据分析思维
- What: 三种核心思维
- Why: 数据分析的思维技巧
- How: 如何在业务时间锻炼分析能力
三种核心思维
- 结构化
- 公式化
- 业务化
结构化
分析思路乱成一团?
使用电脑可以使用思维导图工具(xmind)和类似金字塔分析图,小团队开会使用展板或标签等方法进行头脑风暴。
- 对最直观的问题或论点,进行归纳和整理
- 对论点进行递进和拆分
- 将论点完善,补充。
金字塔分析工具:
- 找核心论点,假设,问题,预测,原因
- 进行拆解:自上而下,将核心论点层层拆分成分论点,上下之间形成因果,依赖关系
- 各分论点,应相互独立,并完全穷尽思维。
- 验证,每个论点都要去验证,量化,用数据说话。
结构化也有缺点,因此用到公式化和业务化。
公式化
结构化是分析的思维,不够数据化,而且难免有发散的缺点。
使用简单的加减乘除。把公式加入到思维导图中去。
业务化(业务流程化)
完成结构化和公式化解决不了的问题。即需要深入了解业务本身,才能考虑的充分。
你的分析贴合业务吗?
- 是否从业务方面的角度思考
- 真的分析出原因了吗?
- 能不能将分析结果落地
数据是某个结果的体现,不代表原因。必须用业务思维去分析。
数据分析要和业务走的近一点。
换位思考,我是用户,则。。
数据分析的思维技巧
- 象限法: 2个纬度,分成4个象限。3个维度,3d。
- 核心:策略驱动的思维
- 优点:直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略。
- 须知:按中位数,平均数,或经验分,都可以。
- 多维法:
- 核心:精细化驱动
- 优点: 处理大数据量,维度丰富且复杂的数据,维度过多会消耗不少时间。
- 对不同维度进行交叉分析时,注意辛普森悖论
- 应用:只要数据齐全,丰富。
- 假设法:
- 启发式思考的方式。
- 优点,没有直观数据或线索时,先假设一个点,然后再验证,判断,得到一个结论。
- 指数:把开放的数据,更细分的数据化。
- 线性加权指数(设计权重)
- 反比例法。用月消费次数的增长比率,来计算用户忠诚度。数据收敛到0和1.
- log法
- 核心: 目标驱动的思维
- 目前驱动力强, 直观。对业务有一定的指导作用。一旦设立指数,不要频繁变动。
- 应用:将无法利用的数据加工成可利用的数据。
- ⚠️:指数无统一标准,更依赖业务经验的加工。
- 二八: 抓重要的指标,只有2成的数据是有用的,老板只看topN的数据。 和业务/kpi紧密关联。
- 但有些时候,仍然不能放弃全局,否则会让思路变狭隘。
- 对比:好的 数据指标,一定是比例/比率,一定会用到对比。
- 各种方法,途径的对比:竞争对手,类别,特性,时间同比,转化,前后变化。
- 通过对比发现数据背后的规律。
- 可以和其他思维技巧结合使用。
- 漏斗:一个过程的思维方法: 展现-点击-访问-咨询-订单。
- 单一的漏斗分析无用,必须结合其他思维方法。比如对比。
简单的技巧,无需 统计知识,性价比较高的技巧
如何锻炼数据分析思维
获得一个案例,首先要看他的数据,来源是否是真实的。
比如啤酒和尿布的故事,美国沃尔玛超市,发现很多父亲带婴儿买尿布,便在尿布旁放上啤酒。于是啤酒大卖。
分析:
- 反向思考,那么买啤酒的人会买尿布吗?
- 发散思考,尿布旁边摆放其他商品是更好?啤酒是否是更好的选择?比如放上婴儿奶粉是不是更好一些?
- 深度思考,怎么摆放的啤酒?部分还是全部品类?
- 场景型的摆放是否比品类摆放更好?超市经营者都是傻瓜吗,现在的超市还是品类的摆放。
- 结论这是一个虚假的故事,因为没有数据。
通过上面的3种思维思考,以及更多思考,会发现这个故事真实性很低,假的!。
在生活中保持好奇心
工作中多问为什么?
- 为什么领导/同事不认同这个分析?原因? (追根究底)
- 如果我的职位比现在高两级,我会去怎么分析?(换位思考)
- 让我再次分析一年前的案例,我怎么做改进? (复盘分析)
- 我的历史分析中,能用3个核心思维去优化和迭代吗? (结构化,数据/公式化,业务化)
成为数据分析师怎么学?
业务思维80 (满分100)
核心竞争力。老板很重视。
数据能力60 (合格)
数据敏锐度,统计知识等,长期锻炼的能力。
主要是应用为主的。这和人工智能专家不一样。
工具技巧40分(入门)
各类技术和编程很好用,但在职场初级,价值不大。(入门即可,在工作中至少半年,并不断踩坑后才能算熟练!)
学习方法:
- 分阶段,有重点。
- 带目的/问题去学习,解决实际问题
- 温故知新,记笔记
- 输出,博客,讲给别人,解释清朝。