Python 数据分析学习路线
概述
数据分析:
数据分析是指用适当利用统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
分析数据,得到结果
学习路线
基础部分:
- 数学知识
- Python基础知识
- Python数据分析包使用
进阶部分:
- 网页爬虫
- 机器学习和深度学习
- 大数据
基础部分
数学
需要的知识主要为 《概率论与数理统计》
Python基础知识
由于只需要掌握计算部分的知识,Python 的基础知识需要了解以下内容:
- 基本语法
- 数据类型和变量
- 条件语句和循环语句
- 函数和模块的概念
Python数据分析包
主要掌握 Python 相关数据分析包的使用,三剑客:
- numpy
- pandas
- matplotlib
参考的书为《利用 Python 进行数据分析》
进阶部分
网页爬虫
《Python3网络爬虫开发实战》崔庆才
机器学习和深度学习
学习SQL,这是数据分析最基础的能力
大体上掌握各类算法原理以及如何利用机器学习包
理论书籍:
- 《机器学习》, 周志华
- 《统计学习方法》, 李航
机器学习包:
-
scikit-learn
是一个机器学习库,可以对数据进行分类,回归,无监督,数据降维,数据预处理等等,包含了常见的大部分机器学习方法。
深度学习就是各种神经网络如何解算的问题。
大数据
Hadoop 权威指南