個人覺得數據框合併最簡單的莫過於join,一個小函數卻有大作用。具體介紹:
DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)
other:一個DataFrame、Series(要有命名),或者DataFrame組成的list。
on:列名,包含列名的list或tuple,或矩陣樣子的列
(如果是多列,必須有MultiIndex)。
跟上面的幾種方法一樣,用來指明依據哪一列進行合併。
如果沒有賦值,則依據兩個數據框的index合併。
how:合併方式, {‘left’, ‘right’, ‘outer’, ‘inner’},
默認 ‘left’調用函數的數據框。
lsuffix:字符串。用於左側數據框的重複列。
把重複列重新命名,原來的列名+字符串。
【如果有重複列,必須添加這個參數。】
rsuffix:同上。右側。
sort:布爾型,默認False。如果爲True,將鏈接鍵(on的那列)按字母排序。
其實,在應用過程中,挺簡單的。
只有index一致,直接用 df1.join(df2) 就OK了!