Pandas 常用统计方法

DataFrame对象的统计方法

DataFrame对象有一些统计方法。它们大部分都属于约简和汇总统计，用于从 Series 中提取单个值，或从 DataFrame 的行或列中提取一个 Series。比如 DataFrame.mean(axis=0,skipna=True) 方法，当数据集中存在 NA 值时，这些值会被简单跳过，除非整个切片（行或列）全是 NA。如果不想这样，则可以通过 skipna=False 来禁用此功能。

常用统计方法	说明
count	非 NA 值的数量
describe	针对 Series 或 DF 的列计算汇总统计
min , max	最小值和最大值
argmin , argmax	最小值和最大值的索引位置（整数）
idxmin , idxmax	最小值和最大值的索引值
quantile	样本分位数（0 到 1）
sum	求和
mean	均值
median	中位数
mad	根据均值计算平均绝对离差
var	方差
std	标准差
skew	样本值的偏度（三阶矩）
kurt	样本值的峰度（四阶矩）
cumsum	样本值的累计和
cummin , cummax	样本值的累计最大值和累计最小值
cumprod	样本值的累计积
diff	计算一阶差分（对时间序列很有用）
pct_change	计算百分数变化

可以通过dir( pd.DataFrame )查看DataFrame对象的统计方法

通过 dir ( pd.core.groupby.SeriesGroupBy )查看SeriesGroupBy对象的统计方法。

相关阅读:
this指向
 作用域链
 入门
 一、servlet之初见
 jdbc之mysql
第六章、树和二叉树
 第七章、暴力求解法
 机试
 第十三章、字符串
 栈和队列
原文地址：https://www.cnblogs.com/ZeroTensor/p/10398165.html

热门文章
PHP转换成html
连接数据库
 14-4-23
本周学习总结
 事件冒泡
 事件
 面向对象
 11.7笔记
 函数
 js数据类型