//2019.07.10
python数据分析基础——numpy(数据结构基础)
import numpy as np:
1、python数据分析主要的功能实现模块包含以下六个方面:
(1)numpy——数据结构基础
(2)Scipy——强大的数据计算(矩阵计算、信号处理、数理分析等)
(3)matplotlib——可视化图形功能模块,实现数据的图形可视化)
(4)pandas——基础数据分析方法
(5)scikit-learn——强大的数据分析建模库,主要用于数据挖掘
(6)Keras——人工神经网络,实现人工神经网络的数据分析应用
2、对于numpy模块,它是python里面一个开源的数据计算模块,可以实现的功能主要有:ndarray、多维数组以及线性代数相关数据分析;
3、对于numpy数据结构以及数据类型的定义举例如下:
numpy1=numpy.array(list1 dtype=numpy.float),其数据结构的类型是numpy.ndarray
4、对于数组的输入标准形式如下:
list=[[1,2,3],[1,2,4],[2,3,4],[1,3,5]]
np1=np.array(list,dtype=np.float)
其中有以下几个常见的属性:
np1.shape:数组的长宽尺寸(mxn)
np1.ndim:数据的维数,这里指的是数据列表嵌套的层数
np1.dtype:数据的类型
np1.itemsize:只要是指数据所占自己的大小
np1.size:指整个数据结构所包含的数据元素个数
len(np1)是指数据结构的真正维数,即数组的行数
5、对于输入数据数组(或者说是矩阵)的其中元素提取方法如下:
np1[a:b,c:d]
这里是指提取数组np1的第a+1行到第b行,第c+1列到第d列的数据模块,举例如下:
6、对于python随机数的生成可以用numpy模块里的random模块:
np1.random.rand(0-1之间的的随机数生成)
andn(服从正态分布的随机数生成)
andint(随机整数的生成)choice([])(随机数产生的范围自定义)......(其他随机数类型),举例如下:
7、矩阵数组之间的运算:+-*/(加减乘除)以及点乘
其中最为常用的点乘函数规则如下:
np.dot(矩阵1,矩阵2)
8、多维数组之间的运算(sum、max、min等)需要先对其进行数组的分层,可以用axis=0-维数-1来进行分层,具体例子如下:
9、对于矩阵之间的拼接:
(1)np.concatenate((list1,list2),axis=0):矩阵之间的拼接
(2)np.vstack((list1,list2)):矩阵之间的上下纵向追接(列数)
(3)np.hstack((list1,list2)):矩阵之间的横向拼接,所以不同矩阵的维数(行数)必须保证相同