Library
NumPy
Numpy的核心是ndarray
基本操作
矩阵运算
点乘,叉乘
存储
np.savetxt()
有个比较坑的地方,3×1的矩阵存起来再读取变成1×3的了,读完再reshape()
保证形状正确。
可以用np.save()
直接保存为.npy
格式的文件,读起来也会更快。
微分方程
提供一些比较好的样例,用于预习和练习。
知乎:基于SIR模型的新型冠状病毒动力学建模与参数辨识(附Python代码)
pandas
pandas是一个做数据分析的包,依赖于numpy。
import pandas as pd
dataset = pd.read_csv(csv_path)
dataframe是pandas内置格式简写为df
dataset.info()看看几个not-null,以及每一类的数据类型,object就是字符串。
https://blog.csdn.net/a8131357leo/article/details/79635866
dataset.descirbe()
打印一些特征,比如平均值啥的。object就没有平均值。
注意不要漏打了括号。
画图
画图的目的是为了更加方便地观察数据。
单个连续变量画图
plt.figure(figsize=(8,6))
dataset['monthly_payment'].plot(kind='kde')
https://blog.csdn.net/Jinlong_Xu/article/details/70175107
单个离散变量的柱状图
plt.figure(figsize=(8,6))
sns.distplot(dataset['early_return'].values, bins=50, kde=False)
https://blog.csdn.net/u010916338/article/details/106036759
变量之间关联
筛选出满足条件的entry,观察这个sub table中变量的分布
# 仅显示数字统计
watch_feat = 'early_return'
dataset[watch_feat].value_counts()
for v in dataset[watch_feat].unique():
plt.figure(figsize=(8,6))
sns.distplot(dataset.loc[dataset[watch_feat]==v, 'isDefault'].values, bins=50, kde=False)
OpenPyXl
用openpyxl
work_sheet = work_book[sheet_name]
v = work_sheet.cell(x,y).value
work_sheet.cell(x,y).value = written_value
work_book.save("path")
记得save就好,不然没有实际写到硬盘上。
具体操作可以看这篇文章:https://blog.csdn.net/weixin_41546513/article/details/109555832
自己的一个练习可以看这个:https://gitee.com/vsbug/Classroom_Project/blob/master/main.py