一、Numpy、Matplotlib、Pandas概述
- NumPy是使用Python进行科学计算的基础包,常用于数据分析。NumPy通常与SciPy和Matplotlib一起使用,广泛用于替代matlab,有助于我们学习数据科学或机器学习。
- Matplotlib是用于数据可视化的最流行的Python包之一,它是一个跨平台库,用于根据数组中的数据制作2D和简单3D图。
- Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。Pandas用于广泛的领域,包括金融,经济,统计,分析等学术和商业领域。
二、参考教程及学习建议
1、参考教程:
《Numpy、Matplotlib和Pandas学习笔记》,建议以该学习笔记为主线,以示例代码做练习,便于小组交流讨论。
Numpy、Matplotlib和Pandas为数据分析工程师必学内容,软测工程师选学内容,若是立志做大数据测试工程师或者AI测试工程师,也建议后续学习。
学习笔记主要借鉴网上如下教程:
Numpy教程:https://www.yiibai.com/numpy/numpy_data_types.html
Matplotlib教程:https://www.yiibai.com/matplotlib/lifecycle.html
Matplotlib教程:https://www.yiibai.com/matplotlib/matplotlib_bar_plot.html(借鉴该教程部分内容)
Pandas教程:https://www.yiibai.com/pandas
Pandas项目实战:https://blog.csdn.net/weixin_43060843/article/details/93738582
2、学习建议
序号 |
学习阶段 |
学习内容 |
不足 |
1 |
2019.12.25-2020.12.29 |
NumPy库学习18小时,12个py文件,922行py代码。 |
总计学习58个小时,完成31个py文件,2000行代码。相关数学知识遗忘或者未曾学过,如线代、统计学、概率论等,另外缺乏有深度的项目实战,需后面将爬虫技术以及三个库的技术整合在一起进行实践,熟能生巧。
|
2 |
2020.1.1-2020.1.6 |
Matplotlib库学习16小时,10个py文件,507行代码。 |
|
2 |
2020.1.7-2020.1.14 |
Pandas库学习24小时,9个py文件,610行代码。 |
2、学习笔记和练习代码
学习笔记和练习代码均上传到QQ小组群中,后续会上传到语雀协作平台和码云上。
建议在学习过程中,也构建自己的个人学习笔记,并为后续的团队学习笔记添砖加瓦,共建Numpy、Matplotlib和Pandas学习知识库。
此部分内容建议课外花费60小时以上时间,并结合《线性代数》、《概率论》等课程一起学习实践。