• pandans处理Excel


    pandans依赖处理Excel的xlrd模块,所以需要提前安装, 安装命令: pip install xlrd;

    提前准备一个Excel文件,存在两个表单;

    读取Excel的方式:

    1:默认读取第一个表单

    import pandas as pa
    df = pa.read_excel("./1.xlsx", encoding="UTF-8", header=None, sep=" ", error_bad_lines=False) # 默认读取这个Excel的第一个表单
    data=df.head() #默认读取前5行的数据
    print("获取到所有的值: {0}".format(data))#格式化输出

    得到的是个二维矩阵:

    2:通过指定表单名的方式获取

    import pandas as pa
    df = pa.read_excel("./1.xlsx", sheet_name="student")
    data = df.head() # 默认为前5
    print(data)

    得到的也是一个二维矩阵:

    3:通过表单索引来指定要访问的表单

    import pandas as pa
    # df = pa.read_excel("./1.xlsx", sheet_name=["python", "student"]) # 通过指定多个表名
    # df = pa.read_excel("./1.xlsx", sheet_name=["python", 1]) # 表名+索引
    df = pa.read_excel("./1.xlsx", sheet_name=[0, 1]) # 全部索引
    data = df.values() # 获取所有值,不需要像head()一样,指定行数
    print(data)
    
    
     

    pandas处理Excel数据为字典

    # 处理Excel为字典
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    test_data = []
    for i in df.index.values: # 获取行号的索引,并对其进行遍历、
    # 根据i来获取每一行指定的数据利用to_dict转成字典
    row_data = df.ix[i, [0, 1, 2, 3]].to_dict()
    test_data.append(row_data)
    print("最终获得数据: {}".format(test_data))

    pandans操作Excel的行列

    # 1:指定读取行
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[0].values # 读取第一行,不会包括表头
    print(data)

    # 2:指定读取多行
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[[1, 2]].values # 读取多行,行数写在一个列表中
    print(data)
    
    
    # 3:指定读取行列
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[0, 2] # 读取第一行,第三列数据
    print(data)
    
    
    # 4:指定读取多行多列
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[[0, 1], [1, 2]].values # 列表嵌套列表
    print(data)
    
    
    # 5:获取所有行的指定列/指定列的所有行
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    # data=df.ix[:, [1, 2]].values # 列表嵌套列表, ":" :代表所有行
    data=df.ix[[1, 2], :].values
    print(data)

    # 6:获取行号和列号并打印输出
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    print("输出所有的行号及列号:", (df.index.values, df.columns.values))
    
    
    
    
    
    
    # 7:获取指定行数的值/获取指定列的值
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    print(df.sample(3).values) #这个方法类似于head()方法以及df.values方法
    print(df["内容"].values) # 只能写行的标题,不用使用索引



     
     
     


  • 相关阅读:
    时间戳(UnixTimestamp)与 《2038年问题》
    端口相关命令
    Ubuntu中的在文件中查找和替换命令
    A Reusable Aspect for Memory Profiling
    acc文件的运行
    A Reusable Aspect for Memory Allocation Checking
    ACC常用语句
    aspectC++常用命令
    c++调用DOS命令,不显示黑屏
    fopen文件目录问题
  • 原文地址:https://www.cnblogs.com/zhouzetian/p/11184498.html
Copyright © 2020-2023  润新知