python 读取Excel的各种模块说明网站
openpyxl 推荐的,用于读写Excel2010的.xlsx文件
Download | Documentation | Bitbucket
xlsxwriter 可选的包,用于写入数据、 格式信息,特别是图表到Excel2010的.xlsx文件中
Download | Documentation | GitHub
xlrd 用于读取老版的Excel文件(扩展名为.xls)的数据和格式信息
Download | Documentation | GitHub
xlwt 用于写入老版的Excel文件(扩展名为.xls)的数据和格式信息
Download | Documentation | Examples | GitHub
xlutils 相当于功能集,需要xlrd,xlwt支持,可以复制、修改、筛选已存在的Excel文件(一般来说这些功能已被openpyxl覆盖)
Download | Documentation | GitHub
#! Python3
#-*- coding:utf8 -*-
import openpyxl
#载入表格内容
wb=openpyxl.load_workbook('e:\work\newFile.xlsx')
print(wb.get_sheet_names())
#返回的为表格中的工作簿名list
#定位到Sheet工作簿
sheet=wb.get_sheet_by_name('Sheet')
print(sheet.title)
#返回sheet工作簿的名称"Sheet"
#定位到最后编辑的工作簿
sheet=wb.active
c=sheet['B1']
#单元格有属性 value值,row行号1,column列号B,coordinate位置号B1
print('c value is :',c.value,', row is :',c.row,', column is : ',c.column,' , coordinate is : ',c.coordinate)
#单元格定位的第二种表示方式
print(sheet.cell(row=1,column=2),' c: ',c)
#输出值同变量c
#sheet有属性 max_row非空白区的最大行号 ,max_column 非空白区的最大列号
from openpyxl.utils import get_column_letter,column_index_from_string
#get_column_letter()将数字列号转换为对应的字母,2:B。
#column_index_from_string()将字母列号转换为对应的数字, AA:27。
print('2 : ',get_column_letter(2),'AA: ',column_index_from_string('AA') )
#('2 : ', 'B', 'AA: ', 27)
for rowNm in sheet['A1':'C20']:
for j in rowNm:
print(j.coordinate,j.value)
print('end of row : ',rowNm)
#创建表格
from openpyxl import Workbook
wbk=Workbook()
#active 为最后修改过的工作簿,无修改则默认为第一个工作簿
wst=wbk.active
#添加工作簿
wst1=wbk.create_sheet("Mysheet") #insert at the end(default)
wst2=wbk.create_sheet("Msheet",0) #insert at first position
#工作簿的名字,在创建时不设置有默认值,创建后可通过属性title进行修改
wst.title="New Title"
#给工作簿标签添加颜色通过RRGGBB颜色码,默认为白色
wst.sheet_properties.tabColor="1072BA"
#删除工作簿
wbk.remove_sheet(wbk['Mysheet'])
#也可通过表格的键值表示一个工作簿
ws3=wbk["New Title"]
#获取表格的所有工作簿名
print(wbk.sheetnames)
#也可以循环表格
for sheet in wbk:
print(sheet.title)
#复制工作簿
target=wbk.copy_worksheet(wst)
#工作簿的单元格
d=wst.cell(row=4,column=2,value=10)
#单元格区域的表示方法
colC=wst['C'] #C列
col_range=wst['C:D']#C列到D列
row10=wst[10] #第10行
row_range=wst[5:10] #第5行到第10行
#方法 循环单元格区域的方法 iter_rows()一行一行的迭代,iter_cols()一列一列的迭代
for row in wst.iter_rows(min_row=1,max_col=3,max_row=2):
for cell in row:
print(cell)
'''
<Cell 'Mysheet'.A1>
<Cell 'Mysheet'.B1>
<Cell 'Mysheet'.C1>
<Cell 'Mysheet'.A2>
<Cell 'Mysheet'.B2>
<Cell 'Mysheet'.C2>
'''
for col in wst.iter_cols(min_row=1,max_col=3,max_row=2):
for cell in col:
print(cell)
#如果要遍历整个工作簿,可使用属性rows或columns
for s in tuple(wst.columns):
print(s)
'''
(<Cell 'Mysheet'.A1>, <Cell 'Mysheet'.A2>, <Cell 'Mysheet'.A3>, <Cell 'Mysheet'.A4>, <Cell 'Mysheet'.A5>, <Cell 'Mysheet'.A6>, <Cell 'Mysheet'.A7>, <Cell 'Mysheet'.A8>, <Cell 'Mysheet'.A9>, <Cell 'Mysheet'.A10>)
(<Cell 'Mysheet'.B1>, <Cell 'Mysheet'.B2>, <Cell 'Mysheet'.B3>, <Cell 'Mysheet'.B4>, <Cell 'Mysheet'.B5>, <Cell 'Mysheet'.B6>, <Cell 'Mysheet'.B7>, <Cell 'Mysheet'.B8>, <Cell 'Mysheet'.B9>, <Cell 'Mysheet'.B10>)
(<Cell 'Mysheet'.C1>, <Cell 'Mysheet'.C2>, <Cell 'Mysheet'.C3>, <Cell 'Mysheet'.C4>, <Cell 'Mysheet'.C5>, <Cell 'Mysheet'.C6>, <Cell 'Mysheet'.C7>, <Cell 'Mysheet'.C8>, <Cell 'Mysheet'.C9>, <Cell 'Mysheet'.C10>)
'''
import datetime
#写入数据
d.value=datetime.datetime.now()
wst['A2']='Hello world !'
print(d.value)
#datetime.datetime(2017, 7, 14, 16, 50, 43, 532788)
#同样可以写入公式
wst['A3']='=upper(A2)'
#检查公式,python 虽然不会计算公式的结果,但是可以检查公式的名字
from openpyxl.utils import FORMULAE
print('SUM' in FORMULAE)
#True
#调整数据格式
from openpyxl.styles import Font
italic24Font=Font(size=24,italic=True)
wst['A2'].font=italic24Font
#Font()有四个关键字参数 name 字体的名字(string),size 字体大小(integer),bold 粗体(boolean,True表示粗体),italic 斜体(boolean,True表示斜体)
fontObj1=Font(name='Times New Roman',bold=True)
#调整列宽column_dimensions,行高row_dimensions
wst.row_dimensions[1].height=70
wst.column_dimensions['B'].width=20
#1英寸=2.54厘米 。行高可以被设定为0~409间的浮点数或整数。一个单位相当于1/72英寸。默认行高是12.75个单位
#列宽可以被设定为0~255间的整数或浮点数。默认列宽是可以容纳8.43个11号字体的字母。
#如果行高或列宽被设置为0,则表示该行或该列被隐藏
#保存表格
wbk.save('e:\work\byPython.xlsx')
#表格的属性template,默认值为False,将其改为True则表示临时文件
wb=openpyxl.load_workbook('e:\work\byPython.xlsx')
wb.template=True
wb.save('e:\work\byPython_template.xltx')
#将临时文件保存为正式文件
wb=openpyxl.load_workbook('e:\work\byPython_template.xltx')
wb.template=False
#合并单元格
wst.merge_cells('A1:D3')
wst['A1']='twelve cells merged together.'
#取消合并
wst.unmerge_cells('A1:D3')
wbk.save('e:\work\byPython.xlsx')
#冻结窗格
#可以通过工作簿的属性freeze_panes设置冻结的单元格,当其值为None或‘A1’时,没有窗格会被冻结
wst.freeze_panes='A2' #将冻结第一行窗格
#创建图表
#通过图表的数据区域openpyxl.chart.Reference(),有三个入参第一个工作簿名;第二个参数两个数字组成的元组,区域的左边界;第三个参数,两个数字组成的元组,区域右边界。
refObj=openpyxl.chart.Reference(wst,min_col=1,min_row=1,max_col=1,max_row=10)
#创建图表数据元素
seriesObj=openpyxl.chart.Series(refObj,title='First series') #title 为图表中该数据名
#创建柱状图
chartObj=openpyxl.chart.BarChart()
#也可以创建折线图,散点图,扇形图 通过方法,openpyxl.chart.LineChart(),openpyxl.chart.ScatterChart(),openpyxl.chart.PieChart()
chartObj.title='My Chart'
#将数据加入柱状图对象
chartObj.append(seriesObj)
#将图表加入工作簿指定区域
wst.add_chart(chartObj,'C5')
wbk.save('e:\work\byPython.xlsx')
#不幸的是这个版本的openpyxl加载表格的功能load_workbook()不会加载表格中的图表,所以加载一个有图表的表格后,再立刻保存,图表就会被删除。