pandas 如何將一列多樣複雜類型的數值批量apply轉換

原創

2018-08-25 06:26

一、前言：

在實際數據分析時，我們常常要對不規範的數據進行規整化，一般規整化的過程比較繁瑣。如果採用pandas 的apply 函數可以快速的批量規整。

二、案例

例如我們有一份旅客預定房間情況： abe 預訂了 1號房， tom 預訂了 2、4、5號房， sam 預訂了 3號房。現在我們希望知道這些旅客預訂的第一個房間。

1. 從一列序列值批量取元素

假設我們拿到下面一份程序員錄入的表：

其中，name 爲旅客名字， rooms 爲旅客預定的房間（可以有多個），rooms 的所有值都是序列類型的。

現在我們採用apply 內嵌 lambda 函數取序列第一個元素的方法，就可以方便地得到旅客預定的第一個房間：

2. 從一列複雜多樣數據類型的數值批量取元素

然而，實際當中錄入數據更可能把rooms 錄入單個的數據（即int 型），我們得到的初始表如下：

這個時候，前面的方法會報錯，因爲id = 0，2時， rooms 的值均不是list 類型，執行到 lambda x:x[0] 會報錯。

即便採用try except異常處理，雖然程序可以正常運行，但不能達到轉換的效果。

但假如我們在lambda 函數中考慮了異常的情況：就可以直接轉換了。（見我的上一篇博文 python lambda 函數處理異常。）

代碼如下：

def getLambda(x, exec_str, ep_str):

    val = 0
    try: 
        exec(exec_str)
    except:
        exec(ep_str)
    return val

df['1st_room'] = df['rooms'].apply(lambda x:getLambda(x, "val = x[0]", "val = x"))

我們得到的結果如下：

完美的解決了這個問題。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

分享一些Javaweb，JavaSwing項目

基於java開發的一個局域網端口掃描程序用java實現對java的格式化基於swing+mysql的搏擊俱樂部管理系統基於spring+mybatis的ssm失物招領管理系統基於jsp+spring+hibernate+s

2020-07-07 22:42:00

ios側滑菜單使用經驗

http://code.cocoachina.com/detail/307941/%E4%BB%BFQQ%E5%B7%A6%E4%BE%A7%E6%8A%BD%E5%B1%89%E6%95%88%E6%9E%9CleftSlideMenu

2020-07-07 20:57:21

【Java】淺析VO、DTO、DO、PO的概念、區別和用處

上一篇文章作爲一個引子，說明了領域驅動設計的優勢，從本篇文章開始，筆者將會結合自己的實際經驗，談及領域驅動設計的應用。本篇文章主要討論一下我們經常會用到的一些對象：VO、DTO、DO和PO。由於不同的項目和開發人員有不同的命名習

2020-07-07 17:32:57

818工程師職業的看法與體會。

首先本人不是一名工程師，目前還是一名做一天和尚撞一天鐘的研究生小白，電子信息專業，課程學習不錯，但是編程與項目經驗不足，喜歡圍觀各種程序猿、專業大神的帖子。看到一篇很給力的帖子，結合個人體會，和有心人一同分享！

2020-07-07 04:51:46

學習中必須解決的幾大問題

我們學習知識的過程其實就是一個不斷的解決問題的過程。當我們帶着問題去學習時，目的性就會更強，那樣就會迫使我們去除很多無用的信息，我們學習起來，效率就會提高很多。這就是問題驅動學習（在我們軟件行業叫做項目驅動學習）和普通學習

2020-07-06 21:11:44

2019校招農行面試經驗

小編今天剛和小夥伴們從農行面試回來，趁着手熱想寫下這篇文章和大家分享下經驗，我們是通知下午1.10來面試的，由於前面還有一組，所以輪到我們已經到了2.40了，漫長的等待消磨，嗚嗚嗚。 okay，下面正式開始，有5個面試官，一個主面

2020-07-06 19:53:16

windows查看佔用端口並殺死該進程

1、使用win+r調出控制檯，輸入cmd進入dos界面 2、輸入命令：netstat -ano，列出所有端口的情況，在列表中我們觀察被佔用的端口；或者使用netstat -ano | findstr "1099"快速定位(1099是需要

2020-07-06 08:38:40

Android WebView 使用過程中遇到的問題與總結

注意： WebView使用必須在AndroidManifest.xml中必須使用許可"android.permission.INTERNET",否則會出Web page not available錯誤。如果訪問的頁面中有Javascr

2020-07-06 03:36:19

findViewById(R.id.xx)使用位置的放置！

今天在使用XML佈局文件中定義的 android:id="@+id/bb 要顯示在界面時因開始的時候將findViewById(R.id.bb)放在了setContentView(R.layout.activity_main);之前，下

2020-07-06 03:36:19

春風襲來之——揮去的2015

俗話說一年之計在於春，一日之計在於晨。在這個春風襲來，活潑可愛的日子裏，我們送走了2015的辛酸、汗水、喜悅和成長，迎來一個嶄新的開始。在此，回顧一下去年的成功與失敗，總結一下經驗與教訓，整理一下心情，繼續前行。

2020-07-05 21:56:41

關於Vmware啓動虛擬機報錯“其中一個參數無效”的處理辦法

這個錯誤應該是虛擬機關閉的時候出現異常導致的。研究了很久都沒法解決，只有重新建一個虛擬機，把原虛擬機的硬盤文件*.vmdk加載進去，解決。

2020-07-05 16:35:22

Ubuntu(Linux) 使用snap安裝包導制eclipse不能正常安裝lombok的問題解決

背景華爲事件，讓國人不得不考慮在技術方面替代美國技術的問題，作者這幾天也嘗試安裝了一些常見的linux系統，包括國人的Deepin和ubuntu。在其中一些經驗整理出來，供大家一閱。問題重現技術人員安裝linux操作系統

2020-07-05 15:20:04

Beyond Compare 4 這個授權密鑰已被吊銷

我使用的是綠色版的BC，使用了一段時間後就會出現這個提示：在網上查了一下，很多人都說刪除“C:\Users\【用戶名】\AppData\Roaming\Scooter Software\Beyond Compare 4”這個目錄下的文

2020-07-04 21:12:20

Pyinstaller打包程序

寫好程序後，利用Pyinstaller將程序打包爲可執行文件首發地址：https://king-key.github.io 安裝Pyinstaller pip install pyinstaller 程序打包進入程序的

2020-07-04 17:44:03

Sublime Text中自定義代碼片段爲Python文件添加作者信息

首先，需要有Sublime Text,用過各種文本編輯器，以及IDE，但還是感覺Sublime Text是用的最舒服的。 1.有言在先在日常開發過程中，使用自定義的代碼片段，可以提高我們的開發效率。本文通過簡單的例子說明一下

2020-07-04 17:44:03

24小時熱門文章

最新文章

最新評論文章