Python NumPy库入门

第一周数据分析之表示

维度：一组数据的组织形式

一维数据：一维数据由对等关系的有序或无序数据构成，采用线性方式组织，对应列表、数组和集合等概念

列表和数组区别：列表的数据类型可以不同，数组的数据类型相同

二维数据：二维数据是有多个一维数据构成，是一维数据的组合形式。表格是典型的二维数据，其中，表头是二维数据的一部分

多维数据：多维数据有一维或二维在新维度上扩展而成

高维数据：高维数据仅利用最基本的二元关系展示数据间的复杂结构。

数据维度的Python展示

数据维度是数据的组织形式

一维数据：列表和集合类型

二维数据：列表类型

多维数据：列表类型

高维数据：字典类型或数据表示格式JSON、XML、YAML格式

NumPy的介绍：

NumPy的引用：

import numpy as np

思考：Python已有列表类型，为什么还需要一个数组对象（类型）？

N维数组对象：ndarray

介绍：

ndarray是一个多维数组对象，有两部分构成实际的数据，描述这些数据的元数据（数据维度，数据类型等）

ndarray数组一般要求所有元素类型相同（同质），数组下标从0开始

属性	说明
.ndim	秩，即轴的数量或维度的数量
.shape	ndarray对象的尺度，对于矩阵,n行m列
.size	ndarray对象元素的个数，相当于.shape中n*m的值
.dtype	ndarray对象的元素类型
.itemsize	ndarray对象中每个元素的大小，以字节为单位

数据类型	说明
bool	布尔类型，True或False
intc	与C语言中的int类型一致，一般是int32或int64
intp	用于索引的整数，与C语言中ssize_t一致，int32或int64
int8	字节长度的整数，取值：\([-128,127]\)
int16	16位长度的整数，取值：\([-32768,32767]\)
int32	32位长度的整数，取值：\([-2^{31},2^{31}-1]\)
int64	64位长度的整数，取值：\([-2^{63},2^{63}-1]\)
uint8	8位无符号整数，取值：\([0,255]\)
uint16	16位无符号整数，取值：\([0,65535]\)
uint32	32位无符号整数，取值：\([0,2^{32}-1]\)
uint64	64位无符号整数，取值：\([0,2^{64}-1]\)
float16	16位半精度浮点数：1位符号位，5位指数，10位尾数
float32	32位半精度浮点数：1位符号位，8位指数，23位尾数
float64	64位半精度浮点数：1位符号位，11位指数，52位尾数
complex64	复数类型，实部和虚部都是32位浮点数
complex128	复数类型，实部和虚部都是64位浮点数

思考：为什么ndarray要支持这么多中元素类型？

对比：Python语法仅支持整数、浮点数和复数三种类型

非同质的ndarray对象

ndarray数组可以由非同质对象构成，

非同质ndarray元素为对象类型，非同质对象无法发挥NumPy优势，尽量避免

ndarray数组的创建方法

函数	说明
np.arrange(n)	类似range()函数，返回ndarray类型，元素从0到n-1
np.ones(shape)	根据shape生成一个全1数组，shape是元组类型
np.zeros(shape)	根据shape生成一个全0数组，shape是元组类型
np.full(shape,val)	根据shape生成一个数组，每个元素值都是val
np.eye(n)	创建一个正方的n*n单位矩阵，对角线为1，其余为0

对于·创建后的ndarray数组可以对其进行维度变换和元素类型变换

方法	说明
.reshape(shape)	不改变数组元素，返回一个shape形状的数组，原数组不变
.resize(shape)	与reshape()功能一致，但修改原数组
.swapaxes(ax1,ax2)	将数组n个维度中的两个维度进行调换
.flatten()	对数组进行降维，返回折叠后的一维数组，原数组不变