• pandas


    1.
    df6 = pd.DataFrame(data,index=行名,columns=列名)# 构成一个表格
    print(df6.index) # 查看行名
    print(df6.columns) # 查看列名
    print(df6.values) # 查看数据值
    print(df6['B'].values) # 查看列名为B的那一列的值
    print(df6.iloc[0]) # 查看第0行的值
    print(df6.shape[0]) 查看行数
    print(df6.shape[1]) 查看列数
    print(df6['a':'b']) # a行到b行,左闭右闭
    print(df6.loc[:,'A':'B']) # 所有行,A列到B列
    print(df6.describe())# 对数据根据列进行描述性统计(mean,std,min。。。)
    print(df6.sum()) # 对每一列列求和
    print(df6.sum(1)) # 对每一行求和
    使用这个方法可以指定把列插入到第几列,其他的列顺延:
    df6.insert(0, 'QQ', ['999','999','999','999','999','999'])
    print(df6)
    _dtypes = df6.infer_objects().dtypes # 查看所有列的数据类型

    2.对表格根据某一列分组,并求分组后的最小值,最大值,均值,方差
     1 def compute_min_max_means_std_column():
     2     #计算每一类的min,max,means,std
     3     df = pd.read_excel('../train_data/aba.xlsx', index_col=None, header=None)
     4     # print(df.min())每一列的最小值
     5     # print(df.max())
     6     # print(df) 
     7     # sex = df[0] 第一列
     8     # print(df[0].groupby(by=abalone[8]).count()) 根据标签对第一列进行分组查看每一类的个数
     9     """
    10     使用pd根据标签分组,计算每一类每一列的最小最大值,均值,标准差
    11     根据第9列(第9列是标签)进行分组
    12     """
    13     for name,group in df.groupby(df[8]):
    14         print('类号:',name)
    15         # print(group)
    16         group = group.iloc[:,1:8]#取每一行的第2列到第8列
    17         print(group.min())
    18         #for m in group.min():
    19           #  print(m) #循环打印每一列的最小值
    20         print(group.max())
    21         print(group.mean())
    22         print(group.std())    

     2.取某列的不同取值并计算该值在某列中存在几次:

    df['column'].unique()
    df['column'].value_counts()
    例如:

    某一列有四种取值:[1 2 4 3]

    每一种取值出现的次数:
    4 394
    1 274
    2 269
    3 63

     iloc的用法

    # 切片

    # 下面两种方法有同样的效果; 表示取出df中1:5行(不包括5)和3:6列
    1 df.iloc[1:5,3:6] 2 df.iloc[[1,2,3,4],[3,4,5]]
    # 另外 df.iloc[0]、df.iloc[1]、df.iloc[-1] 分别表示第一行、第二行、最后一行
    # 同理df.iloc[:,0]、df.iloc[:,1]、df.iloc[:,-1] 分别表示第一列、第二列、最后一列
    iloc和loc区别:
     https://blog.csdn.net/qq_33217634/article/details/88423660
  • 相关阅读:
    设计模式(行为模式)之 观察者模式
    java 内存区域 (程序计数器)
    java 枚举的应用
    ServiceLoad 应用(链式编程:统一执行某一类功能、、分支语句优化)
    python前端学习之css
    python学习四十四天(前端之HTML标签)
    python学习四十三天(网络IO模型)
    python学习四十二天(协程)
    python学习四十一天(线程)
    python学习四十天(进程池)
  • 原文地址:https://www.cnblogs.com/shuangcao/p/12901834.html
Copyright © 2020-2023  润新知