Python利用openpyxl來操作Excel(一)

轉載自公衆號:python_shequ

最近一直在做項目裏的自動化的工作,爲了是從繁瑣重複的勞動中掙脫出來,把精力用在數據分析上。自動化方面python是在好不過了,不過既然要提交報表,
就不免要美觀什麼的。pandas雖然很強大,但是無法對Excel完全操作,現學vba有點來不及。於是就找到這個openpyxl包,用python來修改Excel,礙於水平有限,琢磨了兩天,踩了不少坑,好在完成了自動化工作(以後起碼多出來幾個小時,美滋滋)。

在這裏寫下這兩天的筆記和踩得坑,方面新手躲坑,也供自己日後查閱。如有問題,還請見諒並指出,多謝。

from openpyxl import load_workbook
from openpyxl.styles import colors, Font, Fill, NamedStyle
from openpyxl.styles import PatternFill, Border, Side, Alignment

# 加載文件
wb = load_workbook('./5a.xlsx')
  • workbook: 工作簿,一個excel文件包含多個sheet。

  • worksheet:工作表,一個workbook有多個,表名識別,如“sheet1”,“sheet2”等。

  • cell: 單元格,存儲數據對象

文章所用表格爲:

操作sheet

1# 讀取sheetname
2print('輸出文件所有工作表名:
', wb.sheetnames)
3ws = wb['5a']
4
5# 或者不知道名字時
6sheet_names = wb.sheetnames
7ws2 = wb[sheet_names[0]]    # index爲0爲第一張表
8print(ws is ws2)

輸出文件所有工作表名:
['5a']
True

1# 修改sheetname
2
3ws.title = '5a_'
4print('修改sheetname:
', wb.sheetnames)

修改sheetname:
['5a_']

1# 創建新的sheet
2# 創建的新表必須要賦值給一個對象,不然只有名字但是沒有實際的新表
3
4ws4 = wb.create_sheet(index=0, title='newsheet')
5# 什麼參數都不寫的話,默認插入到最後一個位置且名字爲sheet,sheet1...按照順序排列
6
7ws5 = wb.create_sheet()
8print('創建新的sheet:
', wb.sheetnames)

創建新的sheet:
['newsheet', '5a_', 'Sheet']

1# 刪除sheet
2wb.remove(ws4)  # 這裏只能寫worksheet對象,不能寫sheetname
3print('刪除sheet:
', wb.sheetnames)

刪除sheet:
['5a_', 'Sheet']

1# 修改sheet選項卡背景色,默認爲白色,設置爲RRGGBB模式
2ws.sheet_properties.tabColor = "FFA500"
3
4# 讀取有效區域
5
6print('最大列數爲:', ws.max_column)
7print('最大行數爲:', ws.max_row)

最大列數爲: 5
最大行數爲: 17

1# 插入行和列
2ws.insert_rows(1)  # 在第一行插入一行
3ws.insert_cols(2, 4)  # 從第二列開始插入四列
4
5# 刪除行和列
6ws.delete_cols(6, 3)  # 從第六列(F列)開始,刪除3列即(F:H)
7ws.delete_rows(3)   # 刪除第三行

單元格操作

1# 讀取
2c = ws['A1']
3c1 = ws.cell(row=1, column=2)
4print(c, c1)
5print(c.value, c1.value)

<Cell '5a_'.A1> <Cell '5a_'.B1>
dth_title Province

1# 修改
2ws['A1'] = '景區名稱'
3ws.cell(1, 2).value = '省份'
4print(c.value, c1.value)

景區名稱 省份

 1# 讀取多個單元格
 2
 3cell_range = ws['A1:B2']
 4colC = ws['C']
 5col_range = ws['C:D']
 6row10 = ws[10]
 7row_range = ws[5:10]
 8# 其返回的結果都是一個包含單元格的元組
 9cell_range
10# 注意!! 這裏是兩層元組嵌套,每一行的單元格位於同一個元組裏。

((<Cell '5a_'.A1>, <Cell '5a_'.B1>), (<Cell '5a_'.A2>, <Cell '5a_'.B2>))

1# 按照行列操作
2for row in ws.iter_rows(min_row=1, max_row=3,
3                        min_col=1, max_col=2):
4    for cell in row:
5        print(cell)
6# 也可以用worksheet.iter_col(),用法都一樣

<Cell '5a_'.A1>
<Cell '5a_'.B1>
<Cell '5a_'.A2>
<Cell '5a_'.B2>
<Cell '5a_'.A3>
<Cell '5a_'.B3>

1# 合併單元格
 2ws.merge_cells('F1:G1')
 3ws['F1'] = '合併兩個單元格'
 4# 或者
 5ws.merge_cells(start_row=2, start_column=6, end_row=3, end_column=8)
 6ws.cell(2, 6).value = '合併三個單元格'
 7
 8# 取消合併單元格
 9ws.unmerge_cells('F1:G1')
10# 或者
11ws.unmerge_cells(start_row=2, start_column=6, end_row=3, end_column=8)
12
13wb.save('./5a.xlsx')
14# 保存之前的操作,保存文件時,文件必須是關閉的!!!

注意!!!,openpyxl對Excel的修改並不像是xlwings一樣是實時的,他的修改是暫時保存在內存中的,所以當後面的修改例如我接下來要在第一行插入新的一行做標題,那麼當我對新的A1單元格操作的時候,還在內存中的原A1(現在是A2)的單元格
原有的修改就會被覆蓋。所以要先保存,或者從一開始就計劃好更改操作避免這樣的事情發生。(別問我怎麼知道的,都是淚o(╥﹏╥)o)

樣式修改

單個單元格樣式

1wb = load_workbook('./5a.xlsx')    # 讀取修改後的文件
 2ws = wb['5a_']
 3# 我們來設置一個表頭
 4ws.insert_rows(1)    # 在第一行插入新的一行
 5ws.merge_cells('A1:E1')  # 合併單元格
 6a1 = ws['A1']
 7ws['A1'] = '5A級風景區名單'
 8
 9# 設置字體
10ft = Font(name='微軟雅黑', color='000000', size=15, b=True)
11"""
12name:字體名稱
13color:顏色通常是RGB或aRGB十六進制值
14b(bold):加粗(bool)
15i(italic):傾斜(bool)
16shadow:陰影(bool)
17underline:下劃線(‘doubleAccounting’, ‘single’, ‘double’, ‘singleAccounting’)
18charset:字符集(int)
19strike:刪除線(bool)
20"""
21a1.font = ft
22
23# 設置文本對齊
24
25ali = Alignment(horizontal='center', vertical='center')
26"""
27horizontal:水平對齊('centerContinuous', 'general', 'distributed',
28                    'left', 'fill', 'center', 'justify', 'right')
29vertical:垂直對齊('distributed', 'top', 'center', 'justify', 'bottom')
30
31"""
32a1.alignment = ali
33
34# 設置圖案填充
35
36fill = PatternFill('solid', fgColor='FFA500')
37# 顏色一般使用十六進制RGB
38# 'solid'是圖案填充類型,詳細可查閱文檔
39
40a1.fill = fill

openpyxl.styles.fills模塊參數文檔(鏈接閱讀原文)

 1# 設置邊框
 2bian = Side(style='medium', color='000000')    # 設置邊框樣式
 3"""
 4style:邊框線的風格{'dotted','slantDashDot','dashDot','hair','mediumDashDot',
 5        'dashed','mediumDashed','thick','dashDotDot','medium',
 6        'double','thin','mediumDashDotDot'}
 7"""
 8
 9border = Border(top=bian, bottom=bian, left=bian, right=bian)
10"""
11top(上),bottom(下),left(左),right(右):必須是 Side類型
12diagonal: 斜線 side類型 
13diagonalDownd: 右斜線 bool
14diagonalDown: 左斜線 bool
15"""
16
17# a1.border = border
18for item in ws['A1:E1'][0]:   # 去元組中的每一個cell更改樣式
19    item.border = border
20
21wb.save('./5a.xlsx')  # 保存更改

再次注意!!!:

  • 不能使用 a1.border = border,否則只會如下圖情況,B1:E1單元格沒有線。我個人認爲是因爲線框涉及到相鄰單元格邊框的改動所以需要單獨對每個單元格修改才行。

  • 不能使用ws['A1:E1'].border = border,由前面的內容可知,openpyxl的多個單元格其實是一個元組,而元組是沒有style的方法的,所以必須一個一個改!!其實官方有其他辦法,後面講。

只有A1邊框有加粗

按列或行設置樣式

 1# 現在我們對整個表進行設置
 2
 3# 讀取
 4wb = load_workbook('./5a.xlsx')
 5ws = wb['5a_']
 6
 7# 讀取數據表格範圍
 8rows = ws.max_row
 9cols = ws.max_column
10
11# 字體
12font1 = Font(name='微軟雅黑', size=11, b=True)
13font2 = Font(name='微軟雅黑', size=11)
14
15# 邊框
16line_t = Side(style='thin', color='000000')  # 細邊框
17line_m = Side(style='medium', color='000000')  # 粗邊框
18border1 = Border(top=line_m, bottom=line_t, left=line_t, right=line_t)
19# 與標題相鄰的邊設置與標題一樣
20border2 = Border(top=line_t, bottom=line_t, left=line_t, right=line_t)
21
22# 填充
23fill = PatternFill('solid', fgColor='CFCFCF')
24
25# 對齊
26alignment = Alignment(horizontal='center', vertical='center')
27
28# 將樣式打包命名
29sty1 = NamedStyle(name='sty1', font=font1, fill=fill,
30                  border=border1, alignment=alignment)
31sty2 = NamedStyle(name='sty2', font=font2, border=border2, alignment=alignment)
32
33for r in range(2, rows+1):
34    for c in range(1, cols):
35        if r == 2:
36            ws.cell(r, c).style = sty1
37        else:
38            ws.cell(r, c).style = sty2
39
40wb.save('./5a.xlsx')

對於,設置標題樣式,其實官方也給出了一個自定義函數(鏈接閱讀原文),設定範圍後,範圍內的單元格都會合並,並且應用樣式,就像是單個cell一樣。在這裏就不多贅述了,有興趣的可以看看。很實用。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章