Pandas versus Excel 筆記1(創建及讀取Excel)

創建Excel文件

    import pandas as pd
    from openpyxl import Workbook #爲了正常保存excel文件,需導入此包
    df=pd.DataFrame({'ID':[1,2,3],'Name':['Tim','Victor','Nick']})
    df=df.set_index('ID')#設置自己的index,如果知道excel的ID,儘量這樣操作
    print(df)
    df.to_excel('output.xlsx')#可以設置絕對路徑
    print('done!')

運行結果:
在這裏插入圖片描述
空的DataFrame()相當於空的work sheet
如果沒有指定索引,結果如下:
在這裏插入圖片描述

讀取Excel文件

import pandas as pd
import xlrd #正常讀excel文件
people=pd.read_excel('people.xlsx')#自動生成索引
print(people.shape)#讀取行列
#(19972, 6)    #19972行,6列
print(people.columns)#列名
#Index(['ID', 'Type', 'Title', 'FirstName', 'MiddleName', 'LastName'], dtype='object')
people.head()#默認讀取前五行,head()可添加參數,讀取的行數
people.tail(3)#讀取倒數三行

在這裏插入圖片描述

讀取的異常情況

在excel第一行不是header的情況下

在這裏插入圖片描述

people=pd.read_excel('路徑',header=1)#可讀取到header,默認是0行,對應excel的第一行
#輸出的excel的第二行(列名)

沒有header的情況

在這裏插入圖片描述

people=pd.read_excel('people.xlsx',header=None)#不設置header
print(people.columns)
#輸出的python自定義的列名:Int64Index([0, 1, 2, 3, 4, 5], dtype='int64')

設置header並將ID設爲索引

people=pd.read_excel('People.xlsx',header=None)
people.columns=['ID','Type','Title','FirstName','MiddleName','LastName']#設置列名
print(people.columns)
people=people.set_index['ID']#代替原來的DataFrame,此時ID不再是列名中的了,而是index
#或者people.set_index('ID',inplace=True)
people.to_excel('People.xlsx')
print(people.columns)

在這裏插入圖片描述
Index([‘Type’, ‘Title’, ‘FirstName’, ‘MiddleName’, ‘LastName’], dtype=‘object’) ID不在列名裏

參考鏈接:https://blog.csdn.net/weixin_42758462/article/details/88085146,謝謝博主

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章