掌握数据,就是掌握规律。当你了解了市场数据,对它进行分析,就可以得到市场规律。当你掌握了产品自身的数据,对它进行分析,就可以了解产品的用户来源、用户画像等等。所以说数据是个全新的视角。数据分析如此重要,它不仅是新时代的“数据结构 + 算法”,也更是企业争夺人才的高地。接下来步入正题
一、什么是数据分析
1、数据分析我们可以分成三个重要的组成部分
- 数据采集。它是我们的原材料,也是最“接地气”的部分,因为任何分析都要有数据源。
- 数据挖掘。它可以说是最“高大上”的部分,也是整个商业价值所在。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务。因此数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能 BI。
- 数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观地了解到数据分析的结果。
2、详细讲解三部分
① 数据采集
通常会和数据源打交道,然后使用工具进行采集
工具:1、八爪鱼 - 抓取 99% 的页面源 2、py爬虫
② 数据挖掘
知识型的工程,相当“算法”部分。首先你要知道它的基本流程、十大算法、以及背后的数学基础 ,比如关联分析,Adaboost 算法等
掌握了数据挖掘,它会通过历史数据,告诉你未来会发生什么。当然它也会告诉你这件事发生的置信度是怎样的,置信度这个词你先记住就可以了,后面我们来学习它具体代表什么。
③ 数据可视化
直观的了解到数据分析的结果 - 万金油
两种方法:1、使用 Python。在 Python 对数据进行清洗、挖掘的过程中,我们可以使用 Matplotlib、Seaborn 等第三方库进行呈现。
2、使用第三方工具。如果你已经生成了 csv 格式文件,想要采用所见即所得的方式进行呈现,可以采用微图、DataV、Data GIF Maker 等第三方工具,它们可以很方便地对 数据进行处理,还可以帮你制作呈现的效果。
二、学习指南
把知识转化为自己的语言,才能变成我们自己的东西 - 这个过程就是认知的过程。 认知比作大脑,工具则是双手
1、MAS 学习法
- Multi-Dimension - 多个角度
- Ask - 不懂就问
- Sharing - 最好的学习就是分享
2、数据分析原则
- 不重复造轮子 - 大部分类库就能满足需求
- 工具决定效率 - 好的工具事半功倍
- 积累熟练度
3、建议
- 记录每天的认知
- 用工具来表达你对知识点的掌握,并用自己的语言记录下这些操作笔记。
- 做更多练习来巩固你的认知
- 画图软件SketchBook