• 数据分析


    简介

    Numpy是高性能科学计算和数据分析的基础包。它也是pandas等其他数据分析的工具的基础,基本所有数据分析的包都用过它。NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库处理这些数组。它将常用的数学函数都支持向量化运算,使得这些数学函数能够直接对数组进行操作,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地提高了程序的运算速度。

    •  下载

    >: pip install numpy
    • 引用方式

    import numpy as np  # 约定俗成的起别名:np

    这是官方认证的导入方式,可能会有人说为什么不用from numpy import *,是因为在numpy当中有一些方法与Python中自带的一些方法,例如maxmin等冲突,为了避免这些麻烦大家就约定俗成的都使用这种方法。

    ndarray 

    Numpy的核心特征就是N-维数组对——ndarray.

     ndarray的优势

    有一个购物车, 购物车中有商品的数量和对应的价格, 求总的价格
    shop_car = [2,4,6,1]
    shop_price = [10,20,1,30]
    • pycharm中实现:
    shop_car = [2,4,6,1]
    shop_price = [10,20,1,30]
    prices = 0
    index = 0
    for i in shop_car:
        price = shop_price[index]
        prices += i * price
        index +=1
    print(prices)  # 136
    • numpy中实现:

    通过ndarray这个多维数组对象可以让这些批量计算变得更加简单,当然这只它其中一种优势,接下来就通过具体的操作来发现。

    ndarray是一个多维数组列表

     注意: 

    • 1.数组对象内的元素类型必须相同
    • 2.数组大小不可修改

     常用属性

    属性描述 
    T 数组的转置(对高维数组而言)  
    dtype 数组元素的数据类型  
    size 数组元素的个数  
    ndim 数组的维数  
    shape 数组的维度大小(以元组形式)

    数据类型

    类型描述 
    布尔型 bool_  
    整型 int_ int8 int16 int32 int 64  
    无符号整型 uint8 uint16 uint32 uint64  
    浮点型 float_ float16 float32 float64  
    复数型 complex_ complex64 complex128

    注意: astype()方法可以修改数组的数据类型

    创建ndarray对象

    方法描述 
    array() 将列表转换为数组,可选择显式指定dtype  
    arange() range的numpy版,支持浮点数  
    linspace() 类似arange(),第三个参数为数组长度  
    zeros() 根据指定形状和dtype创建全0数组  
    ones() 根据指定形状和dtype创建全1数组  
    empty() 根据指定形状和dtype创建空数组(随机值)  
    eye() 根据指定边长和dtype创建单位矩阵
    •  array()

    •  arange()

    •  linspace()

    •  zeros()

    •  ones()

    •  eye()

    •  reshape()

    • empty()

    索引和切片

     numpy数组索引与python中的索引用法一样

    • 索引取值

    •  布尔索引

    ndarray可以直接对判断数组中的元素进行判断,返回一个布尔值(True,False)组成的数组

    •  花式索引 [ [ ] ]

    花式索引括号内是被取值的索引下标

    •  切片

     通用函数

    能对数组中所有元素同时进行运算的函数就是通用函数

    能够接受一个数组的叫做一元函数,接受两个数组的叫二元函数,结果返回的也是一个数组

    一元函数

    函数功能 
    abs、fabs 分别是计算整数和浮点数的绝对值  
    sqrt 计算各元素的平方根  
    square 计算各元素的平方  
    exp 计算各元素的指数e**x  
    log 计算自然对数  
    sign 计算各元素的正负号  
    ceil 向上取整  
    floor 向下取整  
    rint 计算各元素的值四舍五入到最接近的整数,保留dtype  
    modf 将数组的小数部分和整数部分以两个独立数组的形式返回,与Python的divmod方法类似  
    isnan 判断是否是 NaN  
    isinf 表示那些元素是无穷的布尔型数组  
    cos,sin,tan 普通型和双曲型三角函数
    • abs,fabs

    •  sqrt,square

    •  exp,log

    •  ceil,floor

    •  modf

    •  isnan

     二元函数

    函数功能 
    add 将数组中对应的元素相加  
    subtract 从第一个数组中减去第二个数组中的元素  
    multiply 数组元素相乘  
    divide、floor_divide 除法或向下圆整除法(舍弃余数)  
    power 对第一个数组中的元素A,根据第二个数组中的相应元素B计算A**B  
    maximum,fmax 计算最大值,fmax忽略NAN  
    miximum,fmix 计算最小值,fmin忽略NAN  
    mod 元素的求模计算(除法的余数)

    数学统计方法

    函数功能 
    sum 求和  
    cumsum 求前缀和  
    mean 求平均数  
    std 求标准差  
    var 求方差  
    min 求最小值  
    max 求最大值  
    argmin 求最小值索引  
    argmax 求最大值索引
    • sum,cumsum

    随机数

    随机数生成函数在np.random的子包当中

    函数功能 
    rand 给定形状产生随机数组(0到1之间的数)  
    randint 给定形状产生随机整数  
    chocie 给定形状产生随机选择  
    shuffle 与random.shuffle相同  
    uniform 给定形状产生随机数组  

    补充 NaN:

    1、nan(Not a Number):不等于任何浮点数(nan != nan)
    ---------------------------------------------
    2、inf(infinity):比任何浮点数都大
    ---------------------------------------------
    • Numpy中创建特殊值:np.nan、np.inf
    • 数据分析中,nan常被用作表示数据缺失值
  • 相关阅读:
    Flowable学习笔记(二、BPMN 2.0-基础 )
    Flowable学习笔记(一、入门)
    只有程序员才懂的幽默
    Navicat自动备份数据库
    两个原因导致Spring @Autowired注入的组件为空
    设计模式—— 十二 :代理模式
    设计模式—— 十 一:建造者模式
    SpringBoot学习笔记(十一:使用MongoDB存储文件 )
    Swagger API文档集中化注册管理
    Spring Boot2从入门到实战:集成AOPLog来记录接口访问日志
  • 原文地址:https://www.cnblogs.com/waller/p/11971636.html
Copyright © 2020-2023  润新知