Pandas 汇总计算
排除NaN值
df['内容'].dropna()
计算平均数
mean_ = df['age'].mean()
多个列的平均数
result = df[['age', 'height']].describe()
result.count().age # 取值
groupby
result = df[['age', 'sex']].groupby('sex').mean()
# 方式二
result = df.groupby('sex')['age'].mean()
也可以多个列分组
result = df.groupby(['sex', 'origin'])['age'].mean()
每个类别的数量 value_counts()
value_count_ = df['笔记类型'].value_counts()
# 该函数是一个快捷方式,因为它实际上是一个groupby操作,结合了对每个组中记录数的计数
# value_count_ = df.groupby('笔记类型')['笔记类型'].count()