Numpy
什么是Numpy:Numeric Python
Numpy模块是Python的一种开源的数值计算扩展。
1 一个强大的N维数组对象Array
2 比较成熟的(广播)函数库
3 用于整合(C/C++)和Fortran代码的工具包
4 实用的线性代数、傅里叶变换和随机数生成函数
5 numpy和稀疏矩阵运算包scipy配合使用更加强大
导入numpy库,并查看numpy版本
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141053605-118732998.png)
注意:numpy模块不是python自带的,需要自己安装的。pip install numpy
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141101757-510359617.png)
这是我要处理的图片 gtx.jpg
必须要先安装这个模块 Pillow ,才能支持除png之外的格式的图片的读取。因为没有安装Pillow模块,会有如下报错:
ValueError: Only know how to handle extensions: ['png']; with Pillow installed matplotlib can handle
Pillow模块安装之后,就能正常读取图片内容了。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141121332-1246107636.png)
读取的数组,元素值范围0-255。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141131810-67719907.png)
看来gtx 是numpy.ndarray类型的,如果需要对图片进行操作,是需要对numpy.ndarray的属性和方法熟悉的。下一步学习numpy.ndarray的属性和方法。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141155361-329455907.png)
再定义一个数组gtx2,是由gtx转换而来的,变成如下图所示的样子了。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141209377-1016238265.png)
一、创建ndarray
1 使用np.array() 由python list创建
·numpy默认ndarray的所有元素类型是相同的
·如果传进来的列表中包含不同的类型,则统一为同一类型,优先级 str>float>int
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141219733-2031590470.png)
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141231958-283971581.png)
numpy的3个属性:
1 shape 查看数组是几维的。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141248559-426091240.png)
317 表示数组的高,行数
500 表示数组的宽,列数
3 表示颜色
任何一张二位的图片转化为3维数组,长宽最后一维表示颜色。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141300049-1274237414.png)
数组元素统一成同一种数据类型的元素
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141313987-1624931770.png)
n1.ndim 得到数组的维度数
2 使用np的routines函数创建数组
包含以下常见创建方法:
1)np.ones(shape,dtype=None,order='C') one表示创建的数组元素全是1
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141333870-191933900.png)
2)np.zeros(shape,dtype=float,order='C') zero表示创建的数组元素全是0
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141355915-1072812851.png)
3)np.full(shape,fill_value,dtype=None,order='C') full表示可以自定义元素值fill_value
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141410603-326376188.png)
4)np.eye(N,M=None,k=0,dtype=float) 对角线位置元素值为1,其他位置为0 满秩矩阵 N、M用来定义矩阵的高和宽的。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141500542-1514550735.png)
这就是一个一元十次方程简化成这样,在线性代数中叫做满秩。
5)np.linspace(start,stop,num=50,endpoint=True,retstep=False,dtype=None)
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141509997-8503061.png)
6)np.arange([start,]stop,[step,]dtype=None) 左闭右开区间
使用该方法创建ndarray时候,左闭右开。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141519258-521403352.png)
7)np.random.randint(low,high=None,size=None,dtype='l')
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141526566-641214931.png)
8)np.random.randn(d0,d1...dn) 标准正态分布
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141534652-1906929851.png)
9)np.random.normal(loc=0.0,scale=1.0,size=None)
scale值越大其波动越厉害,scale=0.0 就没有波动了。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141542931-619926847.png)
10)np.random.random(size=None) 生成0到1的随机数,左闭右开
随机生成一张图片。png格式的像素值 0-1 jpg格式像素值0-255
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141551117-1509946609.png)
=====================================
三、ndarray的基本操作
1、索引
一维与列表完全一致 多维时同理
2、切片
一维与列表完全一致,多维时同理
比如一个3维数组, n1[0:2,1:3,-2:-1] 最终切到要的元素。
3、变形 使用reshape函数,注意参数是一个tuple,如果参数是个负数,直接转换成一维数组ndarray,不论负数值是多少。比价省事的做法就是 -1。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141601899-407463642.png)
4、级联 (将两个数组拼接在一起)
·1 np.concatenate() 级联需要注意的点:
·2 级联的参数是列表:一定要加中括号或小括号
·3 维度必须相同
·4 形状相符
·5 【重点】级联的方向默认是shape这个tuple的第一个值所代表的维度方向
·6 可通过axis参数改变级来联的方向
axis = 0表示按行
axis = 1表示按列
1. np.hstack 与 np.vstack
水平级联与垂直级联,处理自己,进行维度的变更。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520144605903-729123218.png)
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520144615825-2098090727.png)
5、切分
与级联类似,三个函数完成切分工作:
· np.split
· np.vsplit 按行切
· np.hsplit 按列切
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141626991-888328660.png)
split默认情况下是对行进行切分
Signature: np.split(ary, indices_or_sections, axis=0)
ary 是要切割数数据源
axis = 0 是对行进行切割 axis= 1 是对列进行切分
6、副本
所有赋值运算不会为ndarray的任何元素创建副本,对赋值后的对象的操作也对原来的对象生效。可以使用copy()函数创建副本。
==============================
四:ndarray的聚合操作
1、求和 np.sum
2、最大最小值:np.max / np.min
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141644159-1389665705.png)
3、其他聚合操作
np.sum
np.prod
np.mean 平均值 axis 的值是维度
np.std 标准方程
np.var
np.min
np.max
np.argmin
np.argmax
np.median
np.percentile
操作文件:使用pandas打开文件president_heights.csv获取文件中的数据。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141700537-1651777595.png)
就把文件内容读取出来了。CSV格式比较经常遇到的,就是从Oracle数据库中导出的文件。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141712054-343157417.png)
五、ndarray的矩阵操作
1.基本矩阵操作
1)算术运算符:
·加减乘除
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141721939-1310833896.png)
2)矩阵积 np.dot()
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141743369-73630687.png)
2.广播机制
【重要】ndarray广播机制的两条规则
· 规则一:为缺失的维度补 1 (补一行或一列)
· 规则二:假定缺失元素用已有值填充
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141750919-1954735236.png)
六、ndarray的排序,排序算法,面试经常问。
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141811844-846727389.png)
1 快速排序
np.sort()与ndarray.sort()都可以,但有区别:
· np.sort()不改变输入
· ndarray.sort()本地处理,不占用空间,但改变输入
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141836165-1739524236.png)
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141844004-818551697.png)
2 部分排序
np.partition(a,k)
有时我们不是对全部数据感兴趣,只对最小或最大的一部分感兴趣
· 当k为正时,我们想要得到最小的k个数
· 当k为负时,我们想要得到最大的k个数
![](https://images2018.cnblogs.com/blog/869265/201805/869265-20180520141857566-1971901694.png)
只返回需要的这部分数,但这部分数是不会排序的。切片,排序即可。