pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
Pandas数据存取 Pandas可以存取多种介质类型数据,例如:内存、文本、CSV、JSON、HTML、Excel、HDF5、SQL等 生成数据 import numpy as np import pandas as pd df = pd.DataFrame(np.random.randn(1000, 4),columns=['A', 'B', 'C', 'D']) df
Pandas存取CSV
写入CSV
df.to_csv('foo.csv') df.to_csv('foo.csv',index=False) #不保存行索引
读取CSV
pd.read_csv('foo.csv')
读取CSV其他参数
pd.read_csv( 'aaa.csv', #文件名 usecols=[0,1,2,4], #读取指定列 nrows=10, #读取前几行 encoding='GBK' #编码,根据文本编码修改,默认utf-8,可以指定为GBK ) ''' data,time,name,age 20100101,000000,"张三",18 20100101,230000,"李,四",28 ''' x = pd.read_csv( 'aaa.csv', parse_dates={'timestamp': ['data','time']}, #将两列合并解析为时间格式 index_col='timestamp' #将时间设为行索引 )
- csv文件内有汉字等特殊符号时,csv文件编码应为utf-8(无BOM)可默认正常读取,如果编码是ANSI,加参数encoding='GBK'
- 数据内有逗号时,左右加英文半角双引号,可以正常解析
Pandas存取HDF5
写入HDF5
df.to_hdf('foo.h5','df')
从HDF5读取
pd.read_hdf('foo.h5','df')
Pandas存取Excel(xlsx)
写入Excel文件
df.to_excel('foo.xlsx', sheet_name='Sheet1')
从Excel文件读取