最好用的时间序列处理工具是pandas,它里面的各个主要的类继承了性能很好的np.datetime64,基于它构建的时间类型的数组能够实现快速的向量化运算。
pandas处理时间序列支持的功能:
- 解析来自各种来源和格式的时间序列信息
- 生成固定频率日期和时间范围的序列
- 使用时区信息处理和转换日期时间
- 将时间序列重采样或转换为特定频率
- 以绝对或相对时间增量执行日期和时间算术
概述
pandas捕捉了4个与时间相关的一般概念:
日期时间:具有时区支持的特定日期和时间。与
datetime.datetime
标准库相似。时间增量:绝对持续时间。与
datetime.timedelta
标准库相似。时间跨度:由时间点及其关联的频率定义的时间跨度。
日期偏移量:尊重日历算术的相对持续时间。类似于
dateutil.relativedelta.relativedelta
从dateutil
包。
概念 | 标量类 | 数组类 | pandass数据类型 | 主要创建方法 |
日期时间 | Timestamp | DatetimeIndex | datetime64[ns];datetime64[ns, tz] | to_datetime;date_range |
时间增量 | Timedelta | TimedeltaIndex | timedelta64[ns] | to_timedelta;timedelta_range |
时间跨度 | Period | PeriodIndex | period[freq] | Period;period_range |
日期偏移 | DateOffset | None | None | DateOffse |
*常用的时间序列构建与实例的操作(代码)*
时间戳、时间戳数组创建
时间序列索引
时间序列实例的常用方法