python 操作excel

python 讀寫 excel 有好多選擇,但是,方便操作的庫不多,在我嘗試了幾個庫之後,我覺得兩個比較方便的庫分別是 xlrd/xlwt、openpyxl。

之所以推薦兩個庫是因爲這兩個庫分別操作的是不同版本的 excel,xlrd 操作的是 xls/xlxs 格式的 excel,而 openpyxl 只支持 xlxs 格式的excel,openpyxl 使用起來會更方便一些,所以如果你只操作 xlxs 文件的話,那麼可以優先選擇 openpyxl,如果要兼容 xls 的話,那就用 xlrd/xlwt 吧。
本處使用openpyxl來實現

安裝

pip install openpyxl

如果excel裏面有圖片(jpeg, png, bmp,…),需要安裝圖片處理模塊

pip install pillow

excel寫

from openpyxl import Workbook
wb = Workbook()

創建一個新的工作薄

ws1 = wb.create_sheet("Mysheet")  #默認最後一個
ws2 = wb.create_sheet("Mysheet", 0) #第一個

保存

wb.save('balances.xlsx')

修改工作薄的名稱

ws.title = "New Title"

獲取所有的工作薄名稱

print(wb.sheetnames)

獲取其中一個工作薄名稱

for sheet in wb:
    print(sheet)
wb["New Title"]  #直接獲取名稱爲New Title的工作薄

excel 寫數據

ws['A4']=4 #這將返回A4處的單元格,如果尚不存在,則創建一個單元格。值可以直接分配
ws.cell(row=4, column=2, value=10) # 也可以通過cell來進行寫入,通過行數和列數來找到單元格所在的位置,通過value來賦值

execl讀

from openpyxl import load_workbook  #導入模塊
wb = load_workbook(filename = 'balances.xlsx') #打開文件,默認可讀寫,若有需要可以指定write_only和read_only爲True
sheet = wb['test2'] #找到工作表
print(sheet['B4'].value) #輸出內容
# B9處寫入平均值
sheet['B9'] = '=AVERAGE(B2:B8)'

但是如果是讀取的時候需要加上data_only=True這樣讀到B9返回的就是數字,如果不加這個參數,返回的將是公式本身'=AVERAGE(B2:B8)'

append函數

可以一次添加多行數據,從第一行空白行開始(下面都是空白行)寫入。

# 添加一行
row = [1 ,2, 3, 4, 5]
sheet.append(row)

### 獲得最大行和最大列
```python
print(sheet.max_row)
print(sheet.max_column)

獲取行和列

sheet.rows爲生成器, 裏面是每一行的數據,每一行又由一個tuple包裹。
sheet.columns類似,不過裏面是每個tuple是每一列的單元格。

# 因爲按行,所以返回A1, B1, C1這樣的順序
for row in sheet.rows:
    for cell in row:
        print(cell.value)

# A1, A2, A3這樣的順序
for column in sheet.columns:
    for cell in column:
        print(cell.value)

上面的代碼就可以獲得所有單元格的數據。如果要獲得某行的數據呢?給其一個索引就行了,因爲sheet.rows是生成器類型,不能使用索引,轉換成list之後再使用索引,list(sheet.rows)[2]這樣就獲取到第三行的tuple對象。

for cell in list(sheet.rows)[2]:
    print(cell.value)

如何獲得任意區間的單元格?

可以使用range函數,下面的寫法,獲得了以A1爲左上角,B3爲右下角矩形區域的所有單元格。注意range從1開始的,因爲在openpyxl中爲了和Excel中的表達方式一致,並不和編程語言的習慣以0表示第一個值。

for i in range(1, 4):
    for j in range(1, 3):
        print(sheet.cell(row=i, column=j).value)

# out
None
None
None
None
None
None

還可以像使用切片那樣使用。sheet['A1':'B3']返回一個tuple,該元組內部還是元組,由每行的單元格構成一個元組

for row_cell in sheet_ranges['A1':'B3']:
    for cell in row_cell:
        print(cell)

設置單元格風格--Style

先導入需要的類from openpyxl.styles import Font, colors, Alignment

分別可指定字體相關,顏色,和對齊方式。

字體

bold_itatic_24_font = Font(name='等線', size=24, italic=True, color=colors.RED, bold=True)

sheet['A1'].font = bold_itatic_24_font

對齊方式

也是直接使用cell的屬性aligment,這裏指定垂直居中和水平居中。除了center,還可以使用right、left等等參數。

# 設置B1中的數據垂直居中和水平居中
sheet['B1'].alignment = Alignment(horizontal='center', vertical='center')

設置行高和列寬
有時候數據太長顯示不完,就需要拉長拉高單元格。

# 第2行行高
sheet.row_dimensions[2].height = 40
# C列列寬
sheet.column_dimensions['C'].width = 30

合併和拆分單元格

所謂合併單元格,即以合併區域的左上角的那個單元格爲基準,覆蓋其他單元格使之稱爲一個大的單元格。
相反,拆分單元格後將這個大單元格的值返回到原來的左上角位置。

# 合併單元格, 往左上角寫入數據即可
sheet.merge_cells('B1:G1') # 合併一行中的幾個單元格
sheet.merge_cells('A1:C3') # 合併一個矩形區域中的單元格

合併後只可以往左上角寫入數據,也就是區間中:左邊的座標。
如果這些要合併的單元格都有數據,只會保留左上角的數據,其他則丟棄。換句話說若合併前不是在左上角寫入數據,合併後單元格中不會有數據。
以下是拆分單元格的代碼。拆分後,值回到A1位置。

sheet.unmerge_cells('A1:C3')
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章