数据分析常用的函数（2）

1、df.describe（）：该函数主要对数据进行一个基本的统计，输出数据的总数量（count）、平均值（mean）、标准差(std)、最小值和最大值（min、max)、分位数（四分位）

2、sort_values(by="列名/行名")：对该列或该行进行值排序

3、df.replace(to_replace="?",value=np.nan) :这个函数主要将df数据中的？替换为标准缺失值表示。

4、DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

功能：根据各标签的值中是否存在缺失数据对轴标签进行过滤，可通过阈值调节对缺失值的容忍度

参数：axis : {0 or ‘index’, 1 or ‘columns’},或 tuple/list

　　　how : {‘any’, ‘all’}

　　　　　　any : 如果存在任何NA值，则放弃该标签

　　　　　　all : 如果所有的值都为NA值，则放弃该标签

　　　thresh : int, 默认值 None

　　　　　　int value ：要求每排至少N个非NA值　　

　　　subset : 类似数组

　　　inplace : boolean, 默认值 False

　　　　　　如果为True，则进行操作并返回None。

返回：被删除的DataFrame

5、dataframe.shape：输出dataframe的行和列。

6、df.groupby(['列名']).cumcount()：正序（倒序）

相关阅读:
[osg][原]自定义osgGA漫游器
[osg]osg窗口显示和单屏幕显示
sql中去除重复的数据 select distinct * from table
Microsoft VBScript 运行时错误错误 800a005e 无效使用 Null: Replace
如何解决Access操作或事件已被禁用模式阻止
sql 中 '' 与 null 的区别
IsNull、rs、sum
Access与SQL中的IsNull(),IS NULL的区别
ASP将Table导出Excel
ASP如何将table导出EXCEL表格

原文地址：https://www.cnblogs.com/Lee-yl/p/9135849.html