python 數據合併之join

  個人覺得數據框合併最簡單的莫過於join,一個小函數卻有大作用。具體介紹:

DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)

other:一個DataFrame、Series(要有命名),或者DataFrame組成的list。
on:列名,包含列名的list或tuple,或矩陣樣子的列
    (如果是多列,必須有MultiIndex)。
    跟上面的幾種方法一樣,用來指明依據哪一列進行合併。
    如果沒有賦值,則依據兩個數據框的index合併。
how:合併方式, {‘left’, ‘right’, ‘outer’, ‘inner’},
    默認 ‘left’調用函數的數據框。
lsuffix:字符串。用於左側數據框的重複列。
    把重複列重新命名,原來的列名+字符串。
    【如果有重複列,必須添加這個參數。】
rsuffix:同上。右側。
sort:布爾型,默認False。如果爲True,將鏈接鍵(on的那列)按字母排序。

其實,在應用過程中,挺簡單的。

只有index一致,直接用 df1.join(df2) 就OK了!

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章