• 玩转NumPy数组


    一、Numpy 数值类型

      1、前言:Python 本身支持的数值类型有 int(整型, long 长整型)、float(浮点型)、bool(布尔型) 和 complex(复数型)。而 Numpy 支持比 Python 本身更为丰富的数值类型,细分如下:

      2、bool:布尔类型,1 个字节,值为 True 或 False。

      3、int:整数类型,通常为 int64 或 int32 。

      4、intc:与 C 里的 int 相同,通常为 int32 或 int64。

      5、intp:用于索引,通常为 int32 或 int64。

      6、int8:字节(从 -128 到 127)

      7、int16:整数(从 -32768 到 32767)

      8、int32:整数(从 -2147483648 到 2147483647)

      9、int64:整数(从 -9223372036854775808 到 9223372036854775807)

      10、uint8:无符号整数(从 0 到 255)

      11、uint16:无符号整数(从 0 到 65535)

      12、uint32:无符号整数(从 0 到 4294967295)

      13、uint64:无符号整数(从 0 到 18446744073709551615)

      14、float:float64 的简写。

      15、float16:半精度浮点,5 位指数,10 位尾数

      16、float32:单精度浮点,8 位指数,23 位尾数

      17、float64:双精度浮点,11 位指数,52 位尾数complex:complex128 的简写。

      18、complex64:复数,由两个 32 位浮点表示。

      19、complex128:复数,由两个 64 位浮点表示。

      20、总结:

      eg:设置数值类型

      import numpy as np
    
      a = np.array([1.1, 2.2, 3.3], dtype=np.float64) # 指定 1 维数组的数值类型为 float64
    

      此处输入图片的描述

      eg:.通过astype() 方法转换数值类型。

      此处输入图片的描述

      eg:通过 .dtype 方法来查看 dtype 数值类型。

      此处输入图片的描述

      注释:在 Numpy 中,上面提到的这些数值类型都被归于 dtype(data-type) 对象的实例。可以通过 numpy.dtype(object, align, copy) 来指定数值类型。而在数组里面,可以用 dtype= 参数来设置数值类型。

    二、Numpy数组

      1、数组介绍

        1、一维数组的介绍

          在 python 内建对象中,数组有三种形式:list 列表,Tuple 元组,)Dict 字典。其中,元组与列表相似,不同之处在于元组的元素不能修改。而字典由键和值构成。python 标准类针对数组的处理局限于 1 维,并仅提供少量的功能。

        2、多维数组的介绍

         Numpy 最核心且最重要的一个特性就是 ndarray 多维数组对象,它区别于 python 的标准类,拥有对高维数组的处理能力,这也是数值计算过程中缺一不可的重要特性。Numpy 中,ndarray 类具有六个参数,它们分别为:shape:数组的形状。dtype:数据类型。buffer:对象暴露缓冲区接口。offset:数组数据的偏移量。strides:数据步长。order:{'C','F'},以行或列为主排列顺序。

        3、数组特性

         NumPy数组的下标从0开始。
         同一个NumPy数组中所有元素的类型必须是相同的。

      2.2创建数组方式

      1、使用 numpy.array 将列表或元组转换为 ndarray 数组,

      格式:numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)
    

       注释:object:列表、元组等。dtype:数据类型。如果未给出,则类型为被保存对象所需的最小类型。copy:布尔来写,默认 True,表示复制对象。order:顺序。subok:布尔类型,表示子类是否被传递。ndmin:生成的数组应具有的最小维数。

       案例:

        1、通过列表的方式转换:

        import numpy as np
        np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])
    

        此处输入图片的描述

        2、通过元组的方式转换

        import numpy as np
        np.array([(1,2),(3,4),(5,6)])
    

        此处输入图片的描述

      2 arange 方法创建

        格式:numpy.arange(start, stop, step, dtype=None)
    

        注释:设置值所在的区间,即(开始, 停止),并且这是一个半开半闭区间即顾头不顾尾。然后设置 step 步长用于设置值之间的间隔。最后的可选参数 dtype可以设置返回ndarray 的值类型。

        案例:在区间 [3, 7) 中以 0.5 为步长新建数组

        import numpy as np
        np.arange(3, 7, 0.5, dtype=float32)
    

        此处输入图片的描述

      3、 linspace 方法创建

    linspace方法也可以像arange方法一样,创建数值有规律的数组。linspace 用于在指定的区间内返回间隔均匀的值。其方法如下:

      格式:numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
    

        注释:start:序列的起始值。stop:序列的结束值。num:生成的样本数。默认值为50。endpoint:布尔值,如果为真,则最后一个样本包含在序列内。retstep:布尔值,如果为真,返回间距。dtype:数组的类型。

        案例:

      import numpy as np
      np.linspace(0, 10, 10, endpoint=True)
      np.linspace(0, 10, 10, endpoint=False)
    

        此处输入图片的描述

      4、 ones 方法创建

      numpy.ones 用于快速创建数值全部为 1 的多维数组。其方法如下:

      格式:numpy.ones(shape, dtype=None, order='C')
    

       注释:shape:用于指定数组形状,例如(1, 2)或 3。dtype:数据类型。order:{'C','F'},按行或列方式储存数组。

      案例:

      import numpy as np
      np.ones((2,3))
    

        此处输入图片的描述

      5、 zeros 方法创建

      zeros 方法和上面的 ones 方法非常相似,不同的地方在于,这里全部填充为 0。zeros 方法和 ones 是一致的。

      格式:numpy.zeros(shape, dtype=None, order='C')
    

        注释:shape:用于指定数组形状,例如(1, 2)或3。dtype:数据类型。order:{'C','F'},按行或列方式储存数组。

        案例:

      import numpy as np
      np.zeros((3,2))
    

        此处输入图片的描述

      6、 eye 方法创建

      numpy.eye 用于创建一个二维数组,其特点是k 对角线上的值为 1,其余值全部为0。方法如下:

      格式:numpy.eye(N, M=None, k=0, dtype=)
    

       注释:N:输出数组的行数。M:输出数组的列数。k:对角线索引:0(默认)是指主对角线,正值是指上对角线,负值是指下对角线。

       案例:

      import numpy as np
      np.eye(5, 4, 3)
    

        此处输入图片的描述

      7、 从已知数据创建

      我们还可以从已知数据文件、函数中创建 ndarray。numpy 提供了下面 5 个方法:

      frombuffer(buffer):将缓冲区转换为 1 维数组。fromfile(file,dtype,count,sep):从文本或二进制文件中构建多维数组。fromfunction(function,shape):通过函数返回值来创建多维数组。fromiter(iterable,dtype,count):从可迭代对象创建 1 维数组。fromstring(string,dtype,count,sep):从字符串中创建 1 维数组。

      案例:

      import numpy as np
      np.fromfunction(lambda a, b: a + b, (5, 4))
    

        此处输入图片的描述

    三、ndarray 数组属性

      1、创建一个多维数组

      import numpy as np
      a = np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])
    

        此处输入图片的描述

      2、ndarray.T属性

        注释:ndarray.T用于数组的转置,与 .transpose() 相同。

        案例:
    

        此处输入图片的描述

      3、 ndarray.dtype属性

        注释:ndarray.dtype 用来输出数组包含元素的数据类型。

        案例:
    

        此处输入图片的描述

      4、ndarray.imag属性

        注释:ndarray.imag 用来输出数组包含元素的虚部。

        案例:
    

         此处输入图片的描述

      5、ndarray.real属性

        注释:ndarray.real用来输出数组包含元素的实部。

        案例:
    

         此处输入图片的描述

      6、 ndarray.size属性

        注释:ndarray.size用来输出数组中的总包含元素数。

        案例:
    

          此处输入图片的描述

      7、ndarray.itemsize属性

        注释:ndarray.itemsize输出一个数组元素的字节数。

        案例:
    

        此处输入图片的描述

      8、ndarray.nbytes属性

        注释:ndarray.nbytes用来输出数组的元素总字节数。

        案例:
    

        此处输入图片的描述

      9、 ndarray.ndim属性

        注释:ndarray.ndim用来输出数组尺寸。

        案例:
    

        此处输入图片的描述

      10、ndarray.shape属性

        注释:ndarray.shape用来输出数组维数组.

        案例:

        此处输入图片的描述

      11、 ndarray.strides属性

        注释:ndarray.strides用来遍历数组时,输出每个维度中步进的字节数组。

        案例:
    

        此处输入图片的描述

    四、Numpy 数组的基本操作

      1、 重设形状

    reshape 可以在不改变数组数据的同时,改变数组的形状。其中,numpy.reshape() 等效于 ndarray.reshape()。reshape 方法非常简单:

      格式:numpy.reshape(a, newshape)
    

        注释:a 表示原数组,newshape 用于指定新的形状(整数或者元组)。

        案例:

      import numpy as np
    
      np.arange(10).reshape((5, 2))
    

        此处输入图片的描述

      2、数组展开

       ravel 的目的是将任意形状的数组扁平化,变为 1 维数组。ravel 方法如下:

      格式:numpy.ravel(a, order='C')
    

      注释:a 表示需要处理的数组。order 表示变换时的读取顺序,默认是按照行依次读取,当 order='F' 时,可以按列依次读取排序。

      案例:

      import numpy as np
      a = np.arange(10).reshape((2, 5))
      np.ravel(a)
      np.ravel(a, order='F')
    

        此处输入图片的描述

      3、 轴移动

      moveaxis 可以将数组的轴移动到新的位置。其方法如下:

      格式:numpy.moveaxis(a, source, destination)
    

      注释:a:数组。source:要移动的轴的原始位置。destination:要移动的轴的目标位置。

      案例:

      import numpy as np
    
      a = np.ones((1, 2, 3))
    
      np.moveaxis(a, 0, -1)
    

      此处输入图片的描述

      你可能没有看明白是什么意思,我们可以输出二者的 shape属性:

      此处输入图片的描述

      4、轴交换

      和 moveaxis 不同的是,swapaxes 可以用来交换数组的轴。其方法如下:

      格式:numpy.swapaxes(a, axis1, axis2)
    

        注释:a:数组。axis1:需要交换的轴 1 位置。axis2:需要与轴 1 交换位置的轴 1 位置。

       案例:

      import numpy as np
      a = np.ones((1, 4, 3))
      np.swapaxes(a, 0, 2)
    

      我们直接输出两个数组的 shape 值。

      此处输入图片的描述

      5、 数组转置

      transpose 类似于矩阵的转置,它可以将 2 维数组的横轴和纵轴交换。其方法如下:

      格式:numpy.transpose(a, axes=None)
    

       注释:a:数组。axis:该值默认为 none,表示转置。如果有值,那么则按照值替换轴。

      案例:

      import numpy as np
      a = np.arange(4).reshape(2,2)
      np.transpose(a)
    

      此处输入图片的描述

      6、 维度改变

      atleast_xd 支持将输入数据直接视为 x维。这里的 x 可以表示:1,2,3。方法分别维:

      numpy.atleast_1d()
      numpy.atleast_2d()
      numpy.atleast_3d()
      案例:
      import numpy as np   np.atleast_1d([1])   np.atleast_2d([1])   np.atleast_3d([1])

      此处输入图片的描述

      7、 类型转变

    在 numpy 中,还有一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量,ndarray 等。如下:

    asarray(a,dtype,order):将特定输入转换为数组。asanyarray(a,dtype,order):将特定输入转换为 ndarray。asmatrix(data,dtype):将特定输入转换为矩阵。asfarray(a,dtype):将特定输入转换为 float 类型的数组。asarray_chkfinite(a,dtype,order):将特定输入转换为数组,检查 NaN 或 infs。asscalar(a):将大小为 1 的数组转换为标量。

    这里以 asmatrix(data,dtype) 方法举例:

    import numpy as np
    
    a = np.arange(4).reshape(2,2)
    np.asmatrix(a)
    

    此处输入图片的描述

      8、数组连接

    concatenate 可以将多个数组沿指定轴连接在一起。其方法为:

    numpy.concatenate((a1, a2, ...), axis=0)
    

    其中:

    (a1, a2, ...):需要连接的数组。axis:指定连接轴。

    举个例子:

    import numpy as np
    
    a = np.array([[1, 2], [3, 4], [5, 6]])
    b = np.array([[7, 8], [9, 10]])
    c = np.array([[11, 12]])
    
    np.concatenate((a, b, c), axis=0)
    

    此处输入图片的描述

    这里,我们可以尝试沿着横轴连接。但要保证连接处的维数一致,所以这里用到了 .T 转置。

    a = np.array([[1, 2], [3, 4], [5, 6]])
    b = np.array([[7, 8, 9]])
    
    np.concatenate((a, b.T), axis=1)
    

    此处输入图片的描述

    2.9 数组堆叠

    在 numpy 中,还有一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量,ndarray 等。如下:

    stack(arrays,axis):沿着新轴连接数组的序列。column_stack():将 1 维数组作为列堆叠到 2 维数组中。hstack():按水平方向堆叠数组。vstack():按垂直方向堆叠数组。dstack():按深度方向堆叠数组。

    这里以 stack(arrays,axis) 方法举例:

    import numpy as np
    
    a = np.array([1, 2, 3])
    b = np.array([4, 5, 6])
    np.stack((a, b))
    

    此处输入图片的描述

    当然,也可以横着堆叠。

    np.stack((a, b), axis=-1)
    

    此处输入图片的描述

    2.10 拆分

    split 及与之相似的一系列方法主要是用于数组的拆分,列举如下:

    split(ary,indices_or_sections,axis):将数组拆分为多个子数组。dsplit(ary,indices_or_sections):按深度方向将数组拆分成多个子数组。hsplit(ary,indices_or_sections):按水平方向将数组拆分成多个子数组。vsplit(ary,indices_or_sections):按垂直方向将数组拆分成多个子数组。

    下面,我们看一看 split 到底有什么效果:

    import numpy as np
    
    a = np.arange(10)
    np.split(a, 5)
    

    此处输入图片的描述

    除了 1 维数组,更高维度也是可以直接拆分的。例如,我们可以将下面的数组按行拆分为 2。

    import numpy as np
    
    a = np.arange(10).reshape(2,5)
    np.split(a, 2)
    

    此处输入图片的描述

    numpy 中还有针对数组元素添加或移除的一些方法。

    2.11 删除

    delete(arr,obj,axis):沿特定轴删除数组中的子数组。

    下面,依次对 4 种方法进行示例,首先是 delete 删除:

    import numpy as np
    
    a = np.arange(12).reshape(3,4)
    np.delete(a, 2, 1)
    

    这里代表沿着横轴,将第 3 列(索引 2)删除。

    此处输入图片的描述

    当然,你也可以沿着纵轴,将第三行删除。

    np.delete(a, 2, 0)
    

    此处输入图片的描述

    2.12 数组插入

    insert(arr,obj,values,axis):依据索引在特定轴之前插入值。

    再看一看 insert插入, 用法和 delete 很相似,只是需要在第三个参数位置设置需要插入的数组对象:

    import numpy as np
    
    a = np.arange(12).reshape(3,4)
    b = np.arange(4)
    
    np.insert(a, 2, b, 0)
    

    此处输入图片的描述

    2.13 附加

    append(arr,values,axis):将值附加到数组的末尾,并返回 1 维数组。

    append 的用法也非常简单。只需要设置好需要附加的值和轴位置就好了。它其实相当于只能在末尾插入的 insert,所以少了一个指定索引的参数。

    import numpy as np
    
    a = np.arange(6).reshape(2,3)
    b = np.arange(3)
    
    np.append(a, b)
    

    注意 append方法返回值,默认是展平状态下的 1 维数组。

    此处输入图片的描述

    2.14 重设尺寸

    resize(a,new_shape):对数组尺寸进行重新设定。

    resize 就很好理解了,直接举例子吧:

    import numpy as np
    
    a = np.arange(10)
    a.resize(2,5)
    

    此处输入图片的描述

    你可能会纳闷了,这个 resize 看起来和上面的 reshape 一样呢,都是改变数组原有的形状。

    其实,它们直接是有区别的,区别在于对原数组的影响。reshape 在改变形状时,不会影响原数组,相当于对原数组做了一份拷贝。而 resize 则是对原数组执行操作。

    此处输入图片的描述

    2.15 翻转数组

    在 numpy 中,我们还可以对数组进行翻转操作:

    fliplr(m):左右翻转数组。flipud(m):上下翻转数组。

    举个例子:

    import numpy as np
    
    a = np.arange(16).reshape(4,4)
    n.fliplr(a)
    n.flipud(a)
    

    此处输入图片的描述

    三、Numpy 随机抽样

    Numpy 的随机抽样功能非常强大,主要由 numpy.random 模块完成。

    首先,我们需要了解如何使用 numpy 也就是生成一些满足基本需求的随机数据。主要由以下一些方法完成:

    3.1 numpy.random.rand

    numpy.random.rand(d0, d1, ..., dn) 方法的作用为:指定一个数组,并使用 [0, 1) 区间随机数据填充,这些数据均匀分布。

    import numpy as np
    
    np.random.rand(2,5)
    

    此处输入图片的描述

    3.2 numpy.random.randn

    numpy.random.randn(d0, d1, ..., dn) 与 numpy.random.rand(d0, d1, ..., dn) 的区别在于,返回的随机数据符合标准正太分布。

    import numpy as np
    
    np.random.randn(1,10)
    

    此处输入图片的描述

    3.3 numpy.random.randint

    randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间。

    import numpy as np
    
    np.random.randint(2,5,10)
    

    此处输入图片的描述

    3.4 numpy.random.random_integers

    random_integers(low, high, size) 方法将会生成 [low, high] 的 np.int 类型随机整数。注意这是一个闭区间。

    import numpy as np
    
    np.random.random_integers(2,5,10)
    

    此处输入图片的描述

    3.5 numpy.random.random_sample

    random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数。

    import numpy as np
    
    np.random.random_sample([10])
    

    此处输入图片的描述

    与 numpy.random.random_sample 类似的方法还有:

    numpy.random.random([size])numpy.random.ranf([size])numpy.random.sample([size])

    它们 4 个的效果都差不多。

    3.6 numpy.random.choice

    choice(a, size, replace, p) 方法将会给定的 1 维数组里生成随机数。

    import numpy as np
    
    np.random.choice(10,5)
    

    上面的代码将会在 np.arange(10) 中生成 5 个随机数。

    此处输入图片的描述

    3.7 概率密度分布

    除了上面介绍的 6 中随机数生成方法,numpy 还提供了大量的满足特定概率密度分布的样本生成方法。它们的使用方法和上面非常相似,这里就不再一一介绍了。列举如下:

    numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。

    numpy.random.binomial(n, p, size):从二项分布中生成随机数。

    numpy.random.chisquare(df,size):从卡方分布中生成随机数。

    numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数

    。numpy.random.exponential(scale,size):从指数分布中生成随机数。

    numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。

    numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。

    numpy.random.geometric(p,size):从几何分布中生成随机数。

    numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。

    numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。

    numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。

    numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。

    numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。

    numpy.random.logseries(p,size):从对数系列分布中生成随机数。

    numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。

    numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。

    numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。

    numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。

    numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。

    numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。

    numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。

    numpy.random.poisson(lam,size):从泊松分布中生成随机数。

    numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。

    numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。

    numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。

    numpy.random.standard_exponential(size):从标准指数分布中生成随机数。

    numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。

    numpy.random.standard_normal(size):从标准正态分布中生成随机数。

    numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。

    numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。

    numpy.random.uniform(low,high,size):从均匀分布中生成随机数。

    numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随机数。

    numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。

    numpy.random.weibull(a,size):从威布尔分布中生成随机数。numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。

    六、数组运算

      1、数组文件输入输出

        np.save方法

          arr = np.arange(10)  

          np.save('some_array',arr) 

        np.load方法 函数是读写磁盘的两个主要函数,默认情况下,数组以未压缩的原始二进制格式保存在扩展名为.npy的文件中

          np.load('some_array.npy') 

           array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

          arr = np.loadtxt('dataMatrix.txt',delimiter=' ') 

      2、numpy索引与切片

      index 和slicing :第一数值类似数组横坐标,第二个为纵坐标

  • 相关阅读:
    个人工作总结07
    软件项目第一个Sprint评分
    丹佛机场行李系统没能及时交工的原因
    第一次团队冲刺 5
    第一次团队冲刺4
    第一次团队冲刺3
    第一次团队冲刺2
    第一次团队冲刺 1
    风险评估
    团队开发——第一篇scrum报告
  • 原文地址:https://www.cnblogs.com/xuanan/p/7751902.html
Copyright © 2020-2023  润新知