xlrd
■ xlrd
xlrd模块用于读取excel文件内容
基本用法:
workbook = xlrd.open_workbook('文件路径') workbook.sheet_names() #返回所有sheet的列表 workbook.sheet_by_index(...) #通过index来获得一个sheet对象,index从0开始算起 workbook.sheet_by_name(...) #根据sheet名获得相应的那个sheet对象
在得到sheet对象之后,就可以用它的一些方法和变量来获取数据:
sheet.name sheet的名字
sheet.nrows sheet的行数
sheet.ncols sheet的列数
sheet.get_rows() 返回一个迭代器,遍历所有行,给出每个行的值列表
sheet.row_values(index) 返回某一行的值列表
sheet.row(index) 返回一个row对象,可以通过row[index]来获取这行里的单元格cell对象
sheet.col_values(index) 返回某一列的值列表
sheet.cell(row,col) 获取一个cell对象(row和col都从0开始算)
上面提到的cell对象就是一个单元格的抽象,cell对象有value变量来获取其值。 *value都是以unicode的形式存储的,如果内容是中文,记得要encode一下
要获得特定的cell对象的值有多种方法,如
sheet.cell(x,y).value
sheet.cell_value(x,y)
sheet.row(x)[y].value
除了value变量外,cell还有一些其他的变量和方法:
.ctype 返回该单元格数据类型的代码(0表示空,1表示string,2表示number,3表示date,4表示boolean,5表示error)。当ctype == 3 时,虽是日期,但那时python是按照float来处理的,需要用xldate_as_tuple方法来将其转化为日期格式,这个方法的用法就是xlrd.xldate_as_tuple(xldate,datemode), xldate表示一个ctype是3的一个值,datemode是属于workbook的一个属性。
*关于读取合并单元格
在默认情况中,合并单元格只在最左上角的子单元格可以读取到值,其他都是空的。为了解决此问题,在open_workbook时加上参数formatting_info = True (这个只支持excel97-03的xls文件)
这样,sheet.merged_cells会返回当前表中所有合并单元格的信息,格式是像[(7,8,2,5),(1,3,4,5)...]这样的一个列表。其中每一项都是一个单元格,比如(7,8,2,5)的意思是这个sheet中的第七行的第2-4行合并,和序列的分片操作一样,是算头不算尾,所以7,8是指合并的仅第七行(这个7不是index而是index+1),2,5则表示第二列到第四列,不包括第五列。这个“不算尾”的做法是区别于xlwt模块中的合并单元格处理的。
这么一来,想要知道某个合并单元格的值信息的话,只要关注每个元组的第一项和第三项就行了。
xlwt
xlwt用于写入excel,基本创建方法和xlrd类似:
wk = xlwt.Workbook() st = wk.add_sheet('sheetname') st.write(x,y,...,style) #意思是将内容...写入index为(x,y)的单元格内,style可以自定义,详情见下文 st.write(x,x+m,y,y+n,...,style) #可以直接写入一个合并单元格,x为开始的row的index,x+m是结束的row的index,y类似。注意:这里是包括x+m行的,和xlrd读取合并单元格设定不一样 ''' 经试验,发现似乎并不能直接写入一个合并单元格,比较好的做法是首先调用merge方法合并出一个单元格,然后写入数据到合并单元格的最左上角的子单元格 ''' wk.save('路径') #保存文件
*关于style 可以单独定义一个def_style函数来统一处理
比如:
def def_style(): style = xlwt.XFStyle()
##########这部分设置字体######### font = xlwt.Font() font.name = 'Times New Roman' #或者换成外面传进来的参数,这样可以使一个函数定义所有style font.bold = 'True' font.height = '...' font.size = '...' font.colour_index('...') style.font = font
########这部分设置居中格式####### alignment = xlwt.Alignment() alignment.horz = xlwt.Alignment.HORZ_CENTER #水平居中 alignment.vert = xlwt.Alignment.VERT_CENTER #垂直居中 style.alignment = alignment
#########还可以添加几个设置颜色,边框的部分##########
return style ####################################### #核心意思是指,要通过这个函数来设置一些style的属性 #比如字体,居中格式等等 #最终再返回一个style #######################################
#这样在写入的时候就可以通过def_style()来返回一个style对象,来设置style了
xlwt.write(0,0,'test',def_style())
*单元格大小并不会根据内容的大小和多少自动调整,要通过
sheet.row(x).height = ...
sheet.col(x).width = ...
来调整单元格大小
*若要设置cell的背景色,边框等可以设置style的其他属性,比如
背景色要设置 style.pattern,如:
ptn = xlwt.Pattern()
ptn.pattern = xlwt.Pattern.SOLID_PATTERN
ptn.pattern_fore_colour = 颜色代码 //注意这个颜色代码不是RGB的六位颜色代码,而是xlwt内部的一套代码。具体可以参考xlwt.Styles中一些类似叫做color_map的数据,下表作参考:
aqua 0x31 black 0x08 blue 0x0C blue_gray 0x36 bright_green 0x0B brown 0x3C coral 0x1D cyan_ega 0x0F dark_blue 0x12 dark_blue_ega 0x12 dark_green 0x3A dark_green_ega 0x11 dark_purple 0x1C dark_red 0x10 dark_red_ega 0x10 dark_teal 0x38 dark_yellow 0x13 gold 0x33 gray_ega 0x17 gray25 0x16 gray40 0x37 gray50 0x17 gray80 0x3F green 0x11 ice_blue 0x1F indigo 0x3E ivory 0x1A lavender 0x2E light_blue 0x30 light_green 0x2A light_orange 0x34 light_turquoise 0x29 light_yellow 0x2B lime 0x32 magenta_ega 0x0E ocean_blue 0x1E olive_ega 0x13 olive_green 0x3B orange 0x35 pale_blue 0x2C periwinkle 0x18 pink 0x0E plum 0x3D purple_ega 0x14 red 0x0A rose 0x2D sea_green 0x39 silver_ega 0x16 sky_blue 0x28 tan 0x2F teal 0x15 teal_ega 0x15 turquoise 0x0F violet 0x14 white 0x09 yellow 0x0D
style.pattern = ptn
border = xlwt.Borders()
border.left = xlwt.Borders.THICK
border.top/right/bottom等等