詳解Python3 pandas.merge用法

原創

2019-09-08 15:13

pandas提供了一組高級的、靈活的、高效的核心函數，能夠輕鬆的將數據規整化。這節主要對pandas合併數據集的merge函數進行詳解，感興趣的朋友跟隨小編一起看看吧

摘要

數據分析與建模的時候大部分時間在數據準備上，包括對數據的加載、清理、轉換以及重塑。pandas提供了一組高級的、靈活的、高效的核心函數，能夠輕鬆的將數據規整化。這節主要對pandas合併數據集的merge函數進行詳解。(用過SQL或其他關係型數據庫的可能會對這個方法比較熟悉。)碼字不易，喜歡請點贊！！！

1.merge函數的參數一覽表

2.創建兩個DataFrame

3.pd.merge()方法設置連接字段。

默認參數how是inner內連接，並且會按照相同的字段key進行合併，即等價於on=‘key'。

也可以顯示的設置on=‘key'，這裏也推薦這麼做。

當兩邊合併字段不同時，可以使用left_on和right_on參數設置合併字段。當然這裏合併字段都是key所以left_on和right_on參數值都是key。

4.pd.merge()方法設置連接方法。

主要包括inner（內連接）、outer（外鏈接）、left（左連接）、right（右連接）。

參數how默認值是inner內連接，上面的都是採用內連接，連接兩邊都有的值。

當採用outer外連接時，會取並集，並用NaN填充。

外連接其實左連接和右連接的並集。左連接是左側DataFrame取全部數據，右側DataFrame匹配左側DataFrame。（右連接right和左連接類似）

5.pd.merge()方法索引連接，以及重複列名命名。

pd.merge()方法可以通過設置left_index或者right_index的值爲True來使用索引連接，例如這裏df1使用data1當連接關鍵字，而df2使用索引當連接關鍵字。

從上面可以發現兩個DataFrame中都有key列，merge合併之後，pandas會自動在後面加上（_x,_y）來區分，我們也可以通過設置suffixes來設置名字。

總結

以上所述是小編給大家介紹的詳解Python3 pandas.merge用法,希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回覆大家的。在此也非常感謝大家對神馬文庫網站的支持！
如果你覺得本文對你有幫助，歡迎轉載，煩請註明出處，謝謝！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python3 012：100到200的素數

題目判斷101-200之間有多少個素數，並輸出所有素數。程序分析判斷素數的方法：用一個數分別去除2到sqrt(這個數)，如果能被整除，則表明此數不是素數，反之是素數。用else可以進一步簡化代碼. import math

2020-07-08 05:45:09

Python3 個稅計算

題目企業發放的獎金根據利潤提成。利潤(I)低於或等於10萬元時，獎金可提10%；利潤高於10萬元，低於20萬元時，低於10萬元的部分按10%提成，高於10萬元的部分，可提成7.5%；20萬到40萬之間時，高於20萬元的部分，可提

2020-07-08 05:45:09

Python3 階乘求和

題目求1+2!+3!+…+20!的和。程序分析 1+2!+3!+…+20!=1+2(1+3(1+4(…20(1)))) res=1 for i in range(20,1,-1): res=i*res+1 print(

2020-07-08 05:45:09

Python3 磁盤讀寫

實例099：磁盤讀寫題目有兩個磁盤文件A和B,各存放一行字母,要求把這兩個文件中的信息合併(按字母順序排列), 輸出到一個新文件C中。程序分析無。 if __name__ == '__main__': import

2020-07-08 05:45:09

Python3 完全平方數

題目一個整數，它加上100後是一個完全平方數，再加上168又是一個完全平方數，請問該數是多少？程序分析因爲168對於指數爆炸來說實在太小了，所以可以直接省略數學分析，用最樸素的方法來獲取上限: n=0 while (n+1)

2020-07-08 05:45:09

Python3 這天第幾天

題目輸入某年某月某日，判斷這一天是這一年的第幾天？程序分析特殊情況，閏年時需考慮二月多加一天： def isLeapYear(y): return (y%400==0 or (y%4==0 and y%100!=0)

2020-07-08 05:45:09

Python3 copy

題目將一個列表的數據複製到另一個列表中。程序分析使用列表[:]，拿不準可以調用copy模塊。 import copy a = [1,2,3,4,['a','b']] b = a # 賦值 c = a[:] #

2020-07-08 05:45:09

Python3 數字組合

題目有四個數字：1、2、3、4，能組成多少個互不相同且無重複數字的三位數？各是多少？程序分析遍歷全部可能，把有重複的剃掉。 total=0 for i in range(1,5): for j in range(1,

2020-07-08 05:45:09

關於 Jupyter notebook 的 kernel error 問題

今天安裝了 Anaconda 後，打開 Jupyter notebook 之後，出現了 kernel error 錯誤（如下圖），找遍了網上的許多方法，各種複雜的方法都試過，都沒有成功，最後的解決辦法竟然是：以管理員的身份運行，就解決

2020-07-07 23:19:57

Anaconda 和 PyCharm 的安裝與配置

Let's start it! --------------------------------手動分割線--------------------------------------------- 一、安裝環境： WIN10 _x64專

2020-07-07 23:19:57

Python3 學習筆記之基礎語法

該文章的學習筆記參考資料來源於菜鳥教程 (https://www.runoob.com/), 感謝菜鳥教程，無私地提供了大量關於計算機編程的學習資料，感謝菜鳥教程！！ 1、編碼：默認情況下， Python3

2020-07-07 23:19:57

python生成pyc

所以發佈python軟件的過程爲： 1. 生產pyc文件: python3 -m compileall -b . 2. 刪除py文件: find . -name "*.py" |xargs rm -rf 3. 刪除pycache目錄: f

2020-07-07 22:43:30

開啓CSDN筆記模式

時間荏苒，今天以前同事請我下載CSDN資源，無意登錄賬號，已經碼農13年。把我所有筆記陸續更新到CSDN，重拾10餘年前的習慣。

2020-07-07 22:43:30

centos安裝思源黑體

cp /web/wwwroot/SourceHanSansSC.zip /usr/share/fonts/ 首先我們需要切換到CentOS中存放字體的文件目錄 cd /usr/share/fonts/ ，然後進行下載wget http

2020-07-07 22:43:30

Python日常問題集錦

Python日常問題集錦**is 與 ==**小數點後移的精度問題 is 與 == ==就是判斷兩個變量值是否相等.a = 'test' b = 'test' a == b True` is 判斷變量在內存中的位置值是否

2020-07-07 14:29:43

24小時熱門文章

最新文章

最新評論文章