panda读取Excel - 润新知

panda读取Excel

pandas读取Excel的第一种方法
方法一：默认读取第一个表单
import pandas
print(" 方法一：")
xls_data=pd.read_excel('ceshi.xlsx',index_col='序列') #index_col 分行编号
这个会直接默认读取到这个Excel的第一个表单
print(xls_data.head()) #默认读取前5行的数据
print("输出: {0}".format(xls_data.head()))#格式化输出

方法二：通过指定表单名的方式来读取
print(" 方法二：")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
data=df.head() #默认读取前5行的数据
print("获取到所有的值: {0}".format(data))#格式化输出

方法三：通过表单索引来指定要访问的表单，0表示第一个表单
也可以采用表单名和索引的双重方式来定位表单
也可以同时定位多个表单，方式都罗列如下所示
print(" 方法三：")
df=pd.read_excel('ceshi.xlsx',sheet_name=['Sheet1','Sheet2'])
可以通过表单名同时指定多个--不推荐使用，效果不好
df=pd.read_excel('ceshi.xlsx',sheet_name=['Sheet2',0])
可以混合的方式来指定--不推荐使用，效果不好

df=pd.read_excel('ceshi.xlsx',sheet_name=1)
可以通过表单索引来指定读取的表单--列表形式

df=pd.read_excel('ceshi.xlsx',sheet_name=[0,1])
可以通过索引同时指定多个--不推荐使用，效果不好

data=df.values #获取所有的数据，注意这里不能用head()方法哦~
print("获取到所有的值: {0}".format(data))#格式化输出
以上读取的数据是一个二维矩阵，不利于处理自动化测试，

pandas操作Excel的行列
print(" pandas操作Excel的行列")
1：读取指定的单行，数据会存在列表里面
df=pd.read_excel('ceshi.xlsx')
data1=df.loc[0].values #0表示第一行这里读取数据并不包含表头，要注意哦！
print("读取指定的单行数据： {0}".format(data1))

print(" 2：读取指定的多行，数据会存在嵌套的列表里面：")
2：读取指定的多行，数据会存在嵌套的列表里面：
df=pd.read_excel('ceshi.xlsx')
data2=df.loc[[1,2]].values
print("读取指定的多行数据： {0}".format(data2))

print(" 3：读取指定的行列")
3：读取指定的行列：
df=pd.read_excel('ceshi.xlsx')
data3=df.iloc[1,2]
print("读取指定行列的数据： {0}".format(data3)) #dandelion-alipaymobile

4：读取指定的多行多列值：
print(" 4：读取指定的多行多列值：")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
data4=df.loc[[1,2],['姓名','年龄','性别']]
print("读取多行多列的数据： {0}".format(data4))
姓名年龄性别
1 sun 18 女
2 zhao 19 男

5：获取所有行的指定列
print(" 5：获取所有行的指定列")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
data5=df.loc[:,['姓名','年龄','性别']].values #得到的是嵌套列表
data6=df.loc[:,['姓名','年龄','性别']] #得到二维矩阵

print("获取所有行的指定列的数据： {0}".format(data5)) #得到的是嵌套列表
print("获取所有行的指定列的数据： {0}".format(data6)) #得到二维矩阵

6：获取行号并打印输出
print(" 6：获取行号并打印输出")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
print("输出行号列表:",df.index.values)
输出行号列表: [0 1 2 3 4 5 6]

7：获取列名并打印输出
print(" 7：获取列名并打印输出")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
print("输出标题:",df.columns.values)

输出标题: ['姓名' '年龄' '性别' '出生日期']

8：随机获取几行数的值：
print(" 8：获取指定行数的值：")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
print("输出值: ",df.sample(3).values) #随机抽取3行查看，这个方法类似于head()方法以及df.values方法

[['liu' 23 '女' '1995-05']
['wang' 17 '男' '1992-11']
['li' 20 '男' '1992-09']]

9：获取指定列的值：
print(" 9：获取指定列的值：")
df=pd.read_excel('ceshi.xlsx',sheet_name='Sheet2')
print("输出值: ",df['姓名'].values)

pandas处理Excel数据成为字典
print(" pandas处理Excel数据成为字典")
df=pd.read_excel('ceshi.xlsx',sheet_name="Sheet2")
test_data=[]
for i in df.index.values: #获取行号的索引，并对其进行遍历：
根据i来获取每一行指定的数据并利用to_dict转成字典
row_data=df.loc[i,['姓名','年龄','性别','出生日期']].to_dict()
test_data.append(row_data)
print(test_data)

[{'姓名': 'wang', '年龄': 17, '性别': '男', '出生日期': '1992-11'}, {'姓名': 'sun', '年龄': 18, '性别': '女', '出生日期': '1992-12'}, {'姓名': 'zhao', '年龄': 19, '性别': '男', '出生日期': '1993-01'}, {'姓名': 'zhang', '年龄': 22, '性别': '女', '出生日期': '1994-05'}, {'姓名': 'zhou', '年龄': 16, '性别': '女', '出生日期': '1992-07'}, {'姓名': 'liu', '年龄': 23, '性别': '女', '出生日期': '1995-05'}, {'姓名': 'li', '年龄': 20, '性别': '男', '出生日期': '1992-09'}]
相关阅读:
java代码如何快速添加作者描述的注释最好能有详细的图解
 实现ModelDriver接口的功能
 Java Class类以及获取Class实例的三种方式
 java中的clone()
applicationContext.xml 配置文件的存放位置
 Spring 整合hibernante 错误java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderListener
Struts2配置问题java.lang.ClassNotFoundException: org.apache.struts2.dispatcher.ng.filter.StrutsPrepareAndExecuteFilter
第三篇：解析库之re、beautifulsoup、pyquery(转)
第二篇：请求库之requests，selenium
爬虫基本原理(转)
原文地址：https://www.cnblogs.com/hl-2030/p/11982921.html