• pandas基础


    movie.csv

    序号,名称
    1,21
    2,324
    3,31
    2,312
    1,3

    代码

    import pandas as pd
    import numpy as np    
    movie = pd.read_csv('data/movie.csv')   #用read_csv()方法读取csv文件
    movie.head()                            #head()方法可以查看前五行,head(n)可以查看前n行
    movie.shape                             #数据shape
    
    movie2=movie.set_index('序号')                          #数据shape的行索引设置为'序号'
    movie2=pd.read_csv('data/movie.csv', index_col='序号')  #同上set_index
    movie2.reset_index()                                    #复原行索引
    
    movie3=movie.rename(index={}, columns={'序号':'ID'})    #重命名行名、列名
    
    columns=movie.columns                   #获取列索引
    columns.values                          #获取列内容
    index=movie.index                       #获取行索引
    index_list=index.tolist()               #获取行索引列表
    index_list[0]='00'                      #行索引第一项变为00
    movie.index = index_list                #更新行索引
    
    movie['new_column'] = 0                 #增加新的列,并进行赋值
    movie['new_column1']=movie['序号']+movie['名称']    #增加新的列,赋值操作,别的列进行+操作
    movie['new_column'].all()               #  用all()检查是否所有的布尔值都为True
    movie.drop('new_column',axis='columns') #  用drop删除行、列数据
    
    name_index=movie.columns.get_loc('名称') + 1                        #   get_loc获取‘名称’列的位置索引
    movie.insert(name_index, column='name_next',value=movie['名称'])    #   insert插入一列
    print(movie)
    
    data=movie.values                       #获取数据
    data[0]                                 #获取第一行数据
    movie.dtypes                            #各列数据类型
    
    movie['序号']                           #获取'序号'列数据
    movie.序号                              #获取'序号'列数据
    ID=movie['序号'] 
    ID.name                                 #获取'序号'列数据的列名称
    ID.to_frame().head()                    #单列Series转换为DataFrame,返回'序号'列所有数据
    
    s_attr_methods = set(dir(pd.Series))    #获取Series下所有不重复指令
    df_attr_methods = set(dir(pd.DataFrame))#获取DataFrame下所有不重复指令           
    
    ID.head()                               #获取'序号'列数据
    ID.value_counts()                       #获取'序号'列数据计数
    ID.value_counts().head(3)               #获取'序号'列 计数查看前三 
    ID.value_counts(normalize=True)         #获取'序号'列 返回频率
    ID.size                                 #获取'序号'列 数据size
    ID.shape                                #获取'序号'列 数据shape
    len(ID)                                 #获取'序号'列 数据长度
    ID.count()                              #获取'序号'列 数据非空数值统计
    ID.quantile()                           #获取'序号'列 数据中位分位数
    ID.min()                                #获取'序号'列 数据最小值
    ID.max()                                #获取'序号'列 数据最大值   
    ID.mean()                               #获取'序号'列 数据平均值
    ID.median()                             #获取'序号'列 数据中位数
    ID.std()                                #获取'序号'列 数据标准差
    ID.sum()                                #获取'序号'列 数据总和
    ID.describe()                           #获取'序号'列 打印描述信息
    
    ID.isnull()                             #获取'序号'列 非空判断
    ID.isnull().sum()                       #获取'序号'列 统计缺失值的数量
    ID.isnull().mean()                      #获取'序号'列 缺失值的比例
    
    ID.fillna(0)                            #获取'序号'列 填充缺失值
    ID.fillna(0).astype(int).head()         #获取'序号'列 缺失值填充为0、转换为整型、查看前五
    
    ID.dropna()                             #获取'序号'列 删除缺失值
    ID.hasnans                              #获取'序号'列 判断是否有缺失值
    ID.notnull()                            #获取'序号'列 判断是否是非缺失值
    ID+1                                    #获取'序号'列 值+1操作
    ID>7                                    #获取'序号'列 判断是否>7
    ID==1                                   #获取'序号'列 判断是否==1
    ID.add(1)                               #获取'序号'列 值+1操作 
    ID.mul(1)                               #获取'序号'列 值*1操作 
    ID.floordiv(7)                          #获取'序号'列 值//7操作 
    ID.gt(7)                                #获取'序号'列 值>7操作 
    ID.eq(7)                                #获取'序号'列 值==7操作 
    ID.mod(5)                               #获取'序号'列 值%7操作 
    
    ID.dtype                                #获取'序号'列 数据类型
  • 相关阅读:
    bootstrap table load属性
    Jquery中hide()、show()、remove()特性
    Jquery精准计算
    .nojekyll 文件是什么
    快来用 Nuxt 开发静态网站
    CI:持续集成
    把组件库发布到 npm
    JS的各种模块化规范
    打包发布:让组件库支持按需加载
    docz: 组件库文档 so easy!
  • 原文地址:https://www.cnblogs.com/wuyuan2011woaini/p/15910414.html
Copyright © 2020-2023  润新知