点击了解更多Python课程>>>
小象学院Python数据分析第二期【升级版】
主讲老师:
梁斌 资深算法工程师
查尔斯特大学(Charles Sturt University)计算机博士,从事机器学习、计算机视觉及模式识别等相关方向的研究,在计算机视觉等国际会议及期刊发表10余篇学术论文。现就职于澳大利亚某科学研究机构,负责算法改进及其产品化、数据分析处理及可视化。
课程简介:
近两年来,数据分析师的岗位需求非常大,90%的岗位技能需要掌握Python作为数据分析工具,本课程以案例驱动的方式讲解如何利用Python完成数据获取、处理、数据分析及可视化方面常用的数据分析方法与技巧。
升级版第二期的课程更新内容:
本期课程在《Python数据分析》升级版的基础上,主要新增了探索性数据分析(Exploratory Data Analysis,EDA)、金融数据量化分析及深度学习基础等三大数据分析工具,覆盖了时下最前沿的数据分析技术。具体新增内容如下:
新增探索性数据分析,更好地结合数据可视化发掘数据的模式与特点
新增金融数据量化分析,更好地结合时间序列分析探索金融数据的发展趋势
新增深度学习基础,更好地结合机器学习探索人工智能的技术趋势
升级并调整全部随课项目,并提供更详细的分析步骤
系统性地将相关章节的项目整理成一个完整的项目,使学员能够更加充分地理解数据分析的流程和步骤
注意:本资源是2017年2月开班的第一期升级版,除去上面部分列出的更新内容就是本版(第一期升级版)的内容.
面向人群:
1. 想了解和学习典型的数据分析流程和实践方法的学习者
2. 想接触和学习非结构化数据(比如:文本、图像等)分析的学习者
3. 想学习数据分析中常用建模知识的相关从业人员
4. 尚不会使用Python的数据分析师从业者
5. 想转行从事数据分析师行业的学习者
6. 想使用Python实现金融数据分析、机器学习或深度学习的工程师
学习收益:
通过本课程的学习,学员将会收获:
1. 熟悉数据分析的流程,包括数据采集、处理、可视化、数据建模等
2. 掌握Python语言作为数据分析工具,从而有能力驾驭不同领域数据分析实践
3. 掌握非结构化数据的处理与分析、探索性数据分析及量化分析
4. 快速积累多个业务领域数据分析项目经验,包括金融数据、文本数据及图像数据
5. 掌握使用Python实现基于机器学习及深度学习的数据分析和预测
6. 掌握数据分析中常用的建模知识
学习方式:
在线直播,共10次课,每次2-3小时
每周2次(周六、日,晚上20:00 - 22:00)
注意:第一次课是5月28日晚上20:00 - 22:00
第二次课是5月29日晚上20:00 - 22:00
直播后提供录制回放视频,可在线反复观看
课程大纲:
第一课 工作环境准备及数据分析建模理论基础 (2-3课时)
1. 课程介绍
2. 数据分析的基本概念
3. Python简介和环境部署
4. NumPy数据结构及向量化
5. 数据分析建模理论基础
a. 机器学习基础
b. 数据分析建模过程
c. 常用的数据分析建模工具
6. 实战案例1:使用Python实现蒙特卡洛模拟的期权估值
第二课 数据分析工具Pandas (2-3课时)
1. Pandas的数据结构
2. Pandas的数据操作
a. 数据的导入、导出
b. 数据的过滤筛选
c. 索引及多重索引
3. Pandas统计计算和描述
4. 数据的分组与聚合
5. 数据清洗、合并、转化和重构
6. 实战案例2-1:Lending Club借贷数据处理及初步分析
第三课 探索性数据分析(EDA)及数据可视化 (2-3课时)
1. 什么是EDA
2. 探索单变量、多变量的关系及其可视化
3. 3D绘图
4. 实战案例2-2:Lending Club借贷数据探索性分析及可视化
第四课 机器学习及scikit-learn(2-3课时)
1. 机器学习基本概念与流程
2. Python机器学习库scikit-learn
3. 常用评价指标
4. 分类预测模型– Logistic回归与Softmax回归
5. 实战案例2-3:Lending Club借贷违约预测
第五课 金融数据分析(1)--金融时间序列(2-3课时)
1. Pandas的时间处理及操作
2. 金融数据
3. 金融学图表
4. 高频数据分析
5. 实战案例3-1:股票收益率回归分析
第六课 金融数据分析(2)--量化分析 (2-3课时)量化分析基础
1. 量化策略建模流程及回测
2. 常用量化分析指标及框架
3. TA-Lib金融软件工具
4. 实战案例3-2:多因子策略模型
第七课 图像数据处理及分析 (2-3课时)
1. 基本的图像操作和处理
2. 常用的图像特征描述
3. 聚类模型:K-Means
4. 实战案例4:电影海报主色调聚类分析
第八课 深度学习及TensorFlow (2-3课时)
1. 人工神经网络及深度学习
2. TensorFlow框架学习及使用
3. TensorFlow实现卷积神经网络
4. 实战案例5:基于TensorFlow的101类图像识别(Caltech101)
第九课 文本数据分析 (2-3课时)
1. Python文本分析工具NLTK
2. 情感分析与文本分类
3. TensorFlow实现文本深度表示模型Word2Vec
4. 分类与预测模型-- 朴素贝叶斯
5. 实战案例6:搜狐新闻数据分类
第十课 项目实战(2-3课时)
1. 交叉验证及参数调整
2. 特征降维与特征选择
3. 实战案例7:根据日常新闻预测股市动向
4. 课程总结
常见问题:
Q: 本课程需要什么基础?
A:有基本的大学数学基础, 掌握Python基本编程。
Q: 会有实际上机演示和动手操作吗?
A: 有,几乎每节课,老师均会准备上机演示部分,学员可以学习老师的实践经验。
Q: 本课程必须提前掌握Python吗?
A: 不是必须的,本课程将系统讲授Python编程语言。如果你熟悉其他编程语言Java、C、Scala,学习Python是很容易的。