Numpy
Numpy(Numerical Python)是一个开源的、Python数值计算库,也是大部分PY科学计算类库的基础库,用于在大型、多维数组(矩阵)上执行数值运算
- 最早叫Numeric,后来分化为Numpy和Scipy,借鉴自MATLAB
- ndarray数据类型:N维数组对象
- 是Scipy/pandas/scikit-learn等数据处理或科学计算库的基础库
- 底层用C实现,且每种操作都进行了高度优化,处理大量数据时,特别是矩阵、数组,执行效率远超Python
- 自带的数学运算函数能够满足许多应用
Numpy库的引入
import numpy as np
np为模块别名,可更改但建议使用约定俗成的别名
数据维度
数据的标记/结构也是一种信息,甚至比数据本身更重要(结绳记事)
标记后的信息可以形成信息组织结构,增加信息维度,利于存储/通讯/展示
- 0维,文本数据,单个数据
- 1维,list列表,ndarray数组(区别:list不限制类型,数组限制内容为同一类型)
- 2维,表格,CSV,关系型数据库
- 可以看做行列键值对,也可以看做简化版的多维数据格式
- 多维,能组织表达一切
- 数组嵌套形式:多层list或array嵌套
- 标签形式:XML,HTML
- 键值对形式:
- 字典:Python专用
- 通用:
- JSON,有数据类型的键值对(应用于不同系统间的信息交互,例如移动端和服务器的API接口交互)
- YAML,TOML等,无数据类型的键值对(系统/软件的配置文件)
- 非关系型数据库,MongoDB等