工作薄: .xlsx文件、包含多个表(工作表)。
活动表:用户当前查看的表、关闭Excel前最后查看的表。
import openpyxl
先制作一张例表1.xlsx
openpyxl模块提供了openpyxl.load_workbook()函数,用来打开Excel文档。
openpyxl.load_workbook()函数打开Excel文档会返回一个workbook数据类型的值。
workbook对象代表这个Excel文件,相当于File对象代表一个打开的文本文件。
- >>> import openpyxl
- >>> wb = openpyxl.load_workbook('example.xlsx') 打开Excel文档,得到workbook对象
- >>> wb.get_sheet_names() workbook对象调用get_sheet_names()方法,得到工作薄中的所有工作表名
- ['Sheet1', 'Sheet2', 'Sheet3'] 所有工作表名
- >>> sheet = wb.get_sheet_by_name('Sheet3') get_sheet_by_name()方法指定工作表名,得到工作表对象,即worksheet对象
- >>> sheet
"Sheet3"> Worksheet对象 - >>> type(sheet)
- <class 'openpyxl.worksheet.worksheet.Worksheet'>
- >>> sheet.title worksheet对象调用title方法,得到工作表名
- 'Sheet3'
- >>> anotherSheet = wb.get_active_sheet() worksheet对象调用get_active_sheet()方法得到活动表
- >>> anotherSheet
"Sheet1">
openpyxl.load_workbook('example.xlsx'):打开Excel文件,得到工作薄对象,workbook对象。
wb.get_sheet_by_name('Sheet3'):工作薄对象调用get_sheet_by_name()方法,得到工作表对象,worksheet对象。
工作薄对象——工作表对象——单元格对象
- import openpyxl
-
- wb=openpyxl.load_workbook('1.xlsx') #得到工作薄对象
- sheet=wb['Sheet5'] #得到工作表对象
- print(type(sheet['A1'])) #得到单元格对象
- print(sheet['A1'].value)
- c=sheet['B1']
- print(c)
- print(c.value)
-
-
Cell对象,单元格对象,有value、row、column和coordinate属性。
工作表对象调用cell()方法,传入整数作为row和column关键字参数,也可以得到一个单元格对象。
- import openpyxl
-
- wb=openpyxl.load_workbook('1.xlsx') #得到工作薄对象
- sheet=wb['Sheet5'] #得到工作表对象
- a=sheet.cell(row=1,column=2)
- print(type(a))
利用 cell()方法和它的关键字参数, 就可以编写 for 循环,打印出一系列单元格的值。
练习:打印出B列所有所有单元格的值。
工作表worksheet对象的get_highest_row()方法和get_highest_column()方法可以得到表的大小,但是在最新的openpyxl模块中,已经废除,转而用max_row、max_column。
- import openpyxl
-
- wb=openpyxl.load_workbook('1.xlsx') #得到工作薄对象
- sheet=wb['Sheet5'] #得到工作表对象
- r=sheet.max_row
- c=sheet.max_column
- print(r,c)
- for i in range(1,7):
- a=sheet.cell(row=i,column=2)
- print(a.value)
- >>> import openpyxl
- >>> from openpyxl.cell import get_column_letter, column_index_from_string
- >>> get_column_letter(1)
- 'A'
- >>> get_column_letter(2)
- 'B'
- >>> get_column_letter(27)
- 'AA'
- >>> get_column_letter(900)
- 'AHP'
- >>> wb = openpyxl.load_workbook('example.xlsx')
- >>> sheet = wb.get_sheet_by_name('Sheet1')
- >>> get_column_letter(sheet.get_highest_column())
- 'C'
- >>> column_index_from_string('A')
- 1
- >>> column_index_from_string('AA')
- 27
可以单独取得工作表中的一行、一列,或者一个矩形区域中的所有Cell对象。然后可以循环遍历这个切片中的所有单元格。
- import openpyxl
-
- wb=openpyxl.load_workbook('1.xlsx') #得到工作薄对象
- sheet=wb['Sheet5'] #得到工作表对象
- print(tuple(sheet['A1':'C3']))
使用循环,输出选定区域的值:
我们指明需要从 A1 到 C3 的矩形区域中的 Cell 对象,得到了一个 Generator对象,它包含该区域中的 Cell 对象。为了帮助我们看清楚这个 Generator 对象,可以使用它的 tuple()方法,在一个元组中列出它的 Cell 对象。
Generator对象是个元组,是个大元组,其中有很多个小元组,每一行都是一个元组。
因此要打印出这个区域中所有单元格的值,就要使用两个for循环,外层for循环遍历这个切片中的每一行。第二个循环,针对每一行,循环遍历中该行中的每一个单元格。
还可以访问指定的行或列的值,这个时候就可以利用Worksheet对象的rots和columns属性。
- import openpyxl
-
- wb=openpyxl.load_workbook('1.xlsx') #得到工作薄对象
- sheet=wb['Sheet5'] #得到工作表对象
- a=sheet['A1':'C3']
- b=[col for col in sheet.columns][1]
- print(b)
利用 Worksheet 对象的 rows 属性,可以得到一个元组构成的元组。内部的每个元组都代表 1 行,包含该行中的 Cell 对象。columns 属性也会给你一个元组构成的元组,内部的每个元组都包含 1 列中的 Cell 对象。对于 example.xlsx,因为有 7 行 3 列,rows给出由 7 个元组构成的一个元组(每个内部元组包含 3 个 Cell 对象)。columns 给出由3 个元组构成的一个元组(每个内部元组包含 7 个 Cell 对象)。要访问一个特定的元组,可以利用它在大的元组中的下标。例如,要得到代表 B列的元组,可以用 sheet.columns[1]。要得到代表 A 列的元组,可以用 sheet.columns[0]。 在得到了代表行或列的元组后,可以循环遍历它的对象,打印出它们的值。
我发现我目前学习的这本书Python编程快速上手13章处理Excel电子表格主要使用的是openpyxl模块,但是书中对这个模块的教程已经过时了,好多函数已经废弃、或者被替换了,因此我决定重新在网上找一个教程,来学习openpyxl模块。
官方文档:https://openpyxl.readthedocs.io/en/stable/
注意:openpyxl模块只支持xlsx/xlsm/xltx/xltm格式,不支持xls格式。
from openpyxl import Workbook:从openpyxl模块导入Workbook类
wb = Workbook() 从Workbook类中实例化对象wb
ws = wb.active wb对象调用active方法 得到活动表
可以使用create_sheet()函数新建一张工作表。
- #新建工作表,名称以Sheet1,Sheet2,....自动填充
- ws_1 = wb.create_sheet() # 默认在结尾处新建一个新的工作表
- ws_2 = wb.create_sheet(0) # 在当前工作表的指定索引处新建一个工作表
-
- # 用title指定工作表名称
- ws_1.title = "新建工作表"
-
- # 新建工作表,并指定名称
- ws_3 = wb.create_sheet(title="新建工作表-2",index=0)
- ws_4 = wb.create_sheet("新建工作表-1", 0)
-
- # 改变工作表标签颜色,默认为无颜色
- ws.sheet_properties.tabColor = "F22F27"
wb = load_workbook(filename='数据.xlsx', read_only=True) #设置只读
- # 导入openpyxl模块的Workbook类
- import openpyxl
- from openpyxl import load_workbook
-
- wb=load_workbook(filename='1.xlsx',read_only=True)
- print(wb.sheetnames) # 获取工作薄中所有工作表名称
- for sheet in wb:
- print(sheet.title) # 遍历工作薄中所有工作表名
- #获取指定工作表名称
- ws=wb['Sheet1'] #创建工作表对象
- print('***********'+ws.title) #输入工作表名称
- ws_copy=wb.copy_worksheet(ws) #复制工作表
-
- #删除工作表
- # 方式一
- ws = wb["Sheet1"]
- wb.remove(ws)
- # 方式二
- del wb["Sheet1"]
注意:当一个工作表被创建时,其中不包含单元格,只有当单元格被获取时才被创建。
这种方式我们不会创建我们从不会使用的单元格,从而减少了内存消耗。
cell_A2=ws['A2']
cell_C3=ws[row=3,column=3]
通过切片访问:
cell_area = ws['A1':'B4']
cell_exact = ws.iter_rows(min_row=1, max_row=3, min_col=1, max_col=2) #即A1:B3
通过行、列访问:
col_A = ws['A'] #A列
col_area = ws['A:B'] #A、B列
row_2 = ws[2] #第2行
row_area = ws[2:5] #2-5行
# 迭代所有行
all_by_row = ws.rows
# 迭代所有列
all_by_col =ws.columns
结果可以用tuple()、list()、循环进行处理
e.g. 1.xlsx
- import openpyxl
- from openpyxl import load_workbook
-
- wb=load_workbook('1.xlsx')
- ws=wb['Sheet5']
- #获取单个单元格的值
- cell_A2=ws['A2']
- cell_C3=ws.cell(row=3,column=3)
- print(cell_A2.value,cell_C3.value)
- print('---------------------------')
- #获取多个单元格的值
- cell_area = ws['A1':'D4']
- for row in cell_area:
- for cell in row:
- print(cell.value)
- # 设置第2行行高
- ws.row_dimensions[2].height = 40
- # 设置C列列宽
- ws.column_dimensions['C'].width = 30
最后一定要记得保存,wb.save('文件名'),不然不会应用的。
e.g. 1.xlsx
- import openpyxl
- from openpyxl import load_workbook
-
- wb=load_workbook('1.xlsx')
- ws=wb['Sheet5']
-
- # 设置第2行行高
- ws.row_dimensions[2].height = 40
-
- # 设置C列列宽
- ws.column_dimensions['C'].width = 30
-
- wb.save('1.xlsx')
原来的:
修改后:
注意:要想在合并单元格写入数据,只需要在合并区域左上角的单元格写入数据即可。
如果合并区域内的单元格都有数据,也只会保留左上角的数据。
ws.merge_cells('A2:D4')
ws.merge_cells(start_row=2, start_column=1, end_row=4, end_column=4)
- import openpyxl
- from openpyxl import load_workbook
-
- wb=load_workbook('1.xlsx')
- ws=wb['Sheet5']
-
- ws.merge_cells('A5:B6')
- ws['A5']='这是一个合并后的单元格'
- wb.save('1.xlsx')
ws.unmerge_cells('A2:D4')
ws.unmerge_cells(start_row=2, start_column=1, end_row=4, end_column=4)
- import openpyxl
- from openpyxl import load_workbook
-
- wb=load_workbook('1.xlsx')
- ws=wb['Sheet5']
-
- ws.merge_cells('A5:B6')
- ws['A5']='这是一个合并后的单元格'
- ws.unmerge_cells('A5:B6')
-
-
- wb.save('1.xlsx')
- # 在单元格写入数据
- ws['A1'] = 42 #A1单元格写入
- ws.cell(row=1, column=2, value=42) #B1单元格写入
- ws.cell(1,3).value= 42 #C1单元格写入
-
- # 新增一行数据
- ws.append([1, 2, 3, 4])
举个例子:
- import openpyxl
- from openpyxl import load_workbook
-
- wb=load_workbook('1.xlsx')
- ws=wb['Sheet5']
-
- ws['A1']='姓名'
- ws.cell(row=5, column=1, value='韩梅梅') #A5单元格写入
- ws.cell(5,2).value= 42 #B5单元格写入
-
- ws.append(['离美', 2, 3, 4]) # 新增一行数据
-
- wb.save('1.xlsx')
- #写入公式
- ws['B2'] = "=SUM(A2:A4)"
- ws.cell(row=2, column=2, value = "=SUM(A2:A4)")
- ws.cell(2,2).value = "=SUM(A2:A4)"
- img = Image('image') # image:要插入的图片
- ws.add_image(img, 'B1') #在B1单元格插入图片
单元格样式有:number_format(数据格式)、Font(字体)、Fill(填充)、Border(边框)、Alignment(对齐方式)、Protection(保护)。
- import openpyxl
- from openpyxl import Workbook
- import datetime
-
- wb = Workbook()
- ws = wb.active
-
- ws['A1'] = '文字'
- print(ws['A1'].number_format) #-->>> General
-
- ws['A2'] = 5
- print(ws['A2'].number_format) #-->>> General
-
- ws['A3'] = 0.05
- ws['A3'].number_format='0.00%' # 自定义格式
- print(ws['A3'].number_format) # -->>> 0.00%
-
- ws['B1'] = datetime.datetime.now()
- print(ws['B1'].number_format) # -->>> yyyy-mm-dd h:mm:ss
-
- ws['B2'] = datetime.datetime.now()
- ws['B2'].number_format='yyyy-mm-dd' # 自定义格式
- print(ws['B2'].number_format) #-->>> yyyy-mm-dd
-
- wb.save("2.xlsx")
- # 导入Font
- from openpyxl.styles import Font
- name #字体
- size #字号,默认11。
- bold #是否加粗,默认False。加粗:True
- italic #是否斜体,默认False。斜体:True
- vertAlign #上下标,默认None。正常:baseline,上标:superscript,下标:subscript
- color #字体颜色,默认黑色(FF000000)。
- strikethrough #删除线,默认不设置。设置:True
- underline #下划线,默认不带下划线。单下划线:single,双下划线:double,会计用单下划线:singleAccounting,会计用双下划线:doubleAccounting
- import openpyxl
- from openpyxl import Workbook
- from openpyxl.styles import Font
- import datetime
-
- wb = Workbook()
- ws = wb.active
-
- ws['A1'] = '默认' #A1单元格写入
- ws['B2'] = '设置格式' #B2单元格写入
- ws['C3'] = '设置上标' #C3单元格写入
-
- #设置B2单元格字体格式
- ws['B2'].font = Font(name='Calibri', size=12, color="00FF9900", italic=True, underline='double', strikethrough=True)
-
- #设置C3单元格字体格式
- ws['C3'].font = Font(vertAlign='superscript', bold=True)
-
- #保存
-
- wb.save("2.xlsx")
- #导入
- from openpyxl.styles import PatternFill
- fill_type #设置图案样式,如果不设置则不会显示颜色。
- '''
- fill_type可设置的值:solid(实心),lightHorizontal,
- darkTrellis, darkUp, darkGray, darkVertical, lightDown,
- lightTrellis, lightUp, darkDown, darkHorizontal, mediumGray,
- lightVertical, gray0625, gray125, lightGrid, darkGrid, lightGray
- '''
- fgColor/start_color #前景色 ,即填充色
- bgColor/end_color #背景色,即图案颜色
- from openpyxl import Workbook
- from openpyxl.styles import PatternFill
-
- wb = Workbook()
- ws = wb.active
-
- ws['A1'] = '默认' #A1单元格写入
- ws['B2'] = '前景色' #B2单元格写入
- ws['C3'] = '背景色' #C3单元格写入
-
- #前景色,即填充色。也是我们一般设置的填充色
- ws['B2'].fill = PatternFill(fill_type='solid', fgColor='00FF9900')
-
- #背景色,即图案颜色。
- ws['C3'].fill = PatternFill(fill_type='solid', bgColor='00FF9900')
-
- wb.save("实例.xlsx")
- #导入
- from openpyxl.styles import GradientFill
- type/fill_type # 渐变填充类型:linear,path
-
- '''
- linear :
- 渐变在一组指定的 Stops 之间插入颜色,跨越一个区域的长度。默认情况下渐变是从左到右的,但可以使用 degree 属性修改此方向。可以改为提供颜色列表,它们之间的距离将相等。
- path:
- 渐变从区域的每个边缘应用线性渐变。属性 top、right、bottom、left 指定从各个边界填充的范围。比如top=”0.2” 将填充单元格的前 20%。
- '''
- from openpyxl.styles import GradientFill
- from openpyxl import Workbook
-
- wb = Workbook()
- ws = wb.active
-
- # 合并单元格
- ws.merge_cells('B2:F4')
-
- #对合并单元格左上角单元格设置渐变填充
- top_left_cell = ws['B2']
- top_left_cell.fill = GradientFill(type='linear', degree=0, stop=('FFFFFF', '99ccff', '000000')) #渐变填充
-
- wb.save("实例.xlsx")
设置边框样式时还需要通过Side。
- #导入
- from openpyxl.styles import Border, Side
- # Border参数说明
- left = Side(style , color) #左边框设置
- right = Side(style , color) #右边框设置
- top = Side(style , color) #上边框设置
- bottom = Side(style , color) #下边框设置
-
- diagonalDown #是否显示左上-右下对角线,显示:True
- diagonalUp #是否显示左下-右上对角线,显示:True
- diagonal = Side(style , color) #对角线边框设置,注意首先要设置显示对角线
-
- #Side参数说明
- style/border_style #边框样式
- '''
- 边框样式可设置的有:
- thick, mediumDashDot, dashed, mediumDashDotDot,
- dashDot, slantDashDot, dotted, double, thin,
- hair, dashDotDot, mediumDashed, medium
- '''
- color #边框颜色
- from openpyxl import Workbook
- from openpyxl.styles import Border, Side
-
- wb = Workbook()
- ws = wb.active
-
-
- ws['A1'] = '默认' #A1单元格写入
- ws['B2'] = '边框' #B2单元格写入
- ws['C3'] = '对角线' #C3单元格写入
-
- #边框线格式设置
- line_format = Side(style='medium',color='00FF9900')
-
- #B2单元格设置上下左右边框
- ws['B2'].border = Border(left=line_format, right=line_format, top=line_format, bottom=line_format)
-
- #C3单元格设置对角线
- ws['C3'].border = Border(diagonalDown=True, diagonalUp=True, diagonal=line_format)
-
- #保存
- wb.save("实例.xlsx")