python数据结构：numpy

一、 numpy概述

numpy（Numerical Python）提供了python对多维数组对象ndarray（应该是N-dimension array）的支持，具有矢量运算能力，快速、节省空间。numpy支持高级大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。

二、实操

1. 创建ndarray数组

ndarray：N维数组对象（矩阵），所有元素必须是相同类型。
ndarray属性：ndim属性，表示维度个数；shape属性，表示各维度大小；dtype属性，表示数据类型。

2.生成指定维度的随机数组

　　(1)生成一个3行4列的随机数组，然后计算数组的各个属性

# 生成指定维度的随机数组
data = np.random.rand(3,4) #随机生成一个3行4列的随机数组
print(data)
print(type(data))   #数据结构是：<class 'numpy.ndarray'>

　　[[0.9866426 0.54835475 0.69859764 0.32483656]
　　[0.27492952 0.23119927 0.97028605 0.08145471]
　　[0.28869387 0.2712937 0.91773528 0.95094582]]

# 打印出数组的各个属性
print('数组的维数',data.ndim)  #number of dimension  数组的维数  2 
print('数组的大小',data.shape)   #描述数组各维度的大小      (3,4)
print('数据类型',data.dtype)     #描述数组的数据类型     float

　　(2)将列表转换为np.array形式

# 将list转换为二维数组
list = range(0,10)
data = np.array(list)   #实现将python列表的数据结构转换为np的array的数据结构
print(data)   #[0 1 2 3 4 5 6 7 8 9]
print(type(data))   #<class 'numpy.ndarray'>
print(data.ndim)   #1
print(data.shape)   #(10,)
print(data.dtype)   #int32

　　(3)将嵌套序列转换为ndarray的形式

#将嵌套序列转换为ndarray
l1 = [range(10),range(10)]
data = np.array(l1)
print('数据类型',type(data))
print('数据的维度的大小为：',data.shape)
print('数组的维数为：',data.ndim)

　　(4)np.zeros(shape, dtype=float, order='C') #注意这里shape是一个元组，对于其他的几个数据结构同理

#np.zeros np.ones 和np.empty
#np.zeros
zeros_arr = np.zeros((3,4),dtype=float)   #生成一个3行4列的全0数组 ，其中的数据类型是int
print('zeros_arr',zeros_arr)

ones_arr = np.ones((3,4),dtype=float)    #生成一个3行4列的全1数组数据类型为float类型
print('ones_arr',ones_arr)

empty_arr = np.empty((3,4))
print('empty_arr',empty_arr)

empty_int_arr = np.empty((3,4),dtype=int)
print('empty_int_arr',empty_int_arr)

　　(5)np.arange()

print(np.arange(10))   #生成0到9的数组
print(type(np.arange(10)))   #数据类型是numpy.ndarray的数据类型

　　(6)生成一个全0的矩阵

zero_float_arr = np.zeros((3,4),dtype=np.float)
print(zero_float_arr)
print(type(zero_float_arr))   #数组的数据类型是numpy.ndarray
print(zero_float_arr.dtype)    #

# 使用astype做数据类型的转换
zero_int_arr = zero_float_arr.astype(np.int)
print(type(zero_int_arr))
print(zero_int_arr.dtype)

　　(7)矢量的计算

arr = np.array([[1,2,3],[4,5,6]])　　#生成一个列表，使用np.array方法将一个列表转换为np.array
print(arr)   
print(type(arr))   #打印出数组的数据类型
print(arr.dtype)　　#打印出数据类型

　　(8)矩阵的运算

#产生一个2行3列的二维矩阵
arr = np.array([[1,2,3],[4,5,6]])
print(arr)
print(type(arr))
print(arr.dtype)

# 将矩阵进行相乘的运算，这个地方要注意，直接将矩阵进行乘法运算，是将矩阵中元素进行位置上的乘法运算
print('矩阵中的元素相乘arr*arr',arr*arr)

#将矩阵进行加法的运算
print('arr+arr',arr+arr)

# 实现矢量与标量的运算，矢量与标量运算的时候需要进行广播
print('1/arr=
',1./arr)   #矩阵的除法
print('2*arr=
',2*arr)

　　(9)数组的切片操作

arr1 = np.arange(10)   #产生一个10个元素的数组
print(type(arr1))    #数据结构仍然是numpy.ndarray
print(arr1.dtype)   #元素的数据类型仍然是int32类型
print(arr1)     #
print(arr1[2:5])   #切片操作 ，左闭右开的切片

arr2 = np.arange(12).reshape(3,4)   #产生一个3行4列的二维数组
print(arr2)
print(arr2[1])    #切片操作，切出数组中第一行的数据，出数组的第一行
print(arr2[0:2,1:])  #切片操作，切除第0行第一行以及第一列之后的数组
print(arr2[:,1:3])  #切片操作，切出所有的行，以及第1列，第2列的数据

　　(10)条件索引

#找出data_arr中2015年以后的数据
data_arr = np.random.rand(3,3)   # 创建一个3行3列的二维随机数组
print('data_arr 
',data_arr)

year_arr = np.array([[2000,2001,2000],[2005,2002,2009],[2001,2003,2010]])
print('year_arr 
',year_arr)

filtered_arr=data_arr[year_arr>2005]
print('filtered_arr 
',filtered_arr)

#多条件索引

#多个条件索引
filtered_arr = data_arr[(year_arr<=2005) & (year_arr%2==0)]   #打印出年份小于2005年并且为偶数年份的数据
# print(year_arr[(year_arr<=2005) & (year_arr%2==0)])
print('filtered_arr',filtered_arr)

　　(11)二维矩阵的转置

arr1 = np.random.rand(2,3)  #生成一个2行3列的二维数组
print('arr1=
',arr1)
print('arr1数组的转置为:
',arr1.transpose())

　　(12)三维矩阵及其转置

#3维矩阵
arr3d = np.random.rand(2,3,4)
print('arr3d=
',arr3d)
print('================================')
print(arr3d.transpose((1,0,2)))

　　(13)常见运算（np.around、np.floor、np.ceil、np.where）

　　　　①p.ceil 函数返回输入值的上限,就是向上取整，即对于输入 x ，返回最小的整数 i ，使得 i> = x。

arr = np.random.randn(2,3)   #生成量行3列的随机数组
print(arr)

　　　　②np.floor 返回不大于输入参数的最大整数。即对于输入值 x ，将返回最大的整数 i ，使得 i <= x。注意在Python中，向下取整总是从 0 舍入。

print('np.floor(arr)=
',np.floor(arr))

　　　　③np.rint()是根据四舍五入取整

print('np.rint(arr)=
',np.rint(arr))

　　　　④np.isnan(arr)是判断数组的每个元素是不是NaN数据类型

print('np.isnan(arr)=
',np.isnan(arr))

　　　　⑤np.where(condition, x, y)，满足条件(condition)，输出x，不满足输出y。

#np.where
arr1 = np.random.rand(3,4)
print(arr1)
print(np.where(arr1>0.5,1,-1))

　　　14.数组求和

arr1 = np.random.rand(5,2)
print('arr1=
',arr1)
print('np.sum(arr1)=
',np.sum(arr1))  #对数组进行求和
print('np.sum(arr1),axis=0',np.sum(arr1,axis=0))   #在列的方向进行求和
print('np.sum(arr1),axis=1',np.sum(arr1,axis=1))   #在行的方向进行求和

　　　15.

　　　　np.array.any()是或操作，将np.array中所有元素进行或操作，然后返回True或False

　　　　np.array.all()是与操作，将np.array中所有元素进行与操作，然后返回True或False

arr1 = np.random.randn(2,3)
print(arr1)
print(np.any(arr1>0))
print(np.all(arr1>0))

[[-0.03475223 0.21371993 0.84167799]
[ 1.60330052 0.02812848 1.37971765]]
True
False

　　　　16unique操作

arr1 = np.array([[1,2,1],[2,3,4]])
print('arr1',arr1)
print('np.unique(arr1)',np.unique(arr1))

相关阅读:
MongoDB 数组
 MongoDB 内嵌文档
 MongoDB 聚合操作
 MongoDB 文档的删除操作
 MongoDB 文档的更新操作
 MongoDB 文档的查询和插入操作
 MongoDB 安装和可视化工具
 SSIS 容器
 SSISDB2：SSIS工程的操作实例
 Replication：distribution 中一直在运行 waitfor delay @strdelaytime 语句
原文地址：https://www.cnblogs.com/bigdata-stone/p/10202363.html