週末師姐讓我幫忙處理一下之前的醫療數據,數據都存放在excel文件中,需要從裏面提取出部分數據並轉化爲她指定的格式。
總共有20幾個文件,如果手動處理的話,不僅效率低下而且很繁雜,於是我編寫了python腳本來完成了本次的工作,下面記錄一下相關的知識,並做一個總結。
我用到的庫是:openpyxl
首先安裝openpyxl
pip3 install openpyxl #安裝openpyxl
由於本次的工作主要是從excel文件中提取數據,因此只學習了提取數據的內容,下面的幾段代碼實現了打開excel文件並從中提取數據:
import openpyxl
path = "C:\\Users\\Admin\\Desktop\\demo.xlsx"
wb_obj = openpyxl.load_workbook(path) #加載excel文件
sheet_obj = wb_obj.active
print(sheet_obj.max_row) #打印最大的行號
print(sheet_obj.max_column) #打印最大的列號
cell_obj = sheet_obj.cell(row = 1, column = 1) #獲取第一行第一列的單元格
print(cell_obj.value) #打印單元格內容
此外openpyxl庫還提供了創建excel文件並寫入數據的方法,並且還可以對excel的表格格式進行控制。由於本次的任務沒有涉及到這方面的內容,暫時沒有學習,等以後需要的時候再來補充。
參考鏈接:
https://www.geeksforgeeks.org/python-reading-excel-file-using-openpyxl-module/
https://openpyxl.readthedocs.io/en/stable/tutorial.html