數據清洗與準備

原創

2020-03-28 20:43

主要介紹數據處理過程中，常用到的幾個函數。

查看存在缺失值的特徵

#計算特徵缺失值個數
na_counts = data.isnull.sum()
#按缺失值個數降序輸出特徵
missing_values = na_counts[na_counts > 0].sort_values(ascending=False)

缺失值過濾

#默認情況下會刪除包含缺失值的行
data.dropna()

#刪除所有值均爲NA的行
data.dropna(how="all")

#若想刪除列，可以傳入參數axis=1
data.dropna(axis=1)

#修改被調用的對象，而不是生成一個備份
data.dropna(inplace=True)

#限制條件判斷區域，刪除某些列中有空值的行
data.dropna(subset=["列名"])

缺失值補全

data.fillna(value, method, axis, inplace, limit)
#value參數是用於填充缺失值的值，可爲標量或字典對象
#mothod參數是插值方法，默認是“ffill”，將前面同列的值作爲填充值
#axis是需要填充的軸，默認爲0
#inplace是修改被調用的對象，而不是生成一個備份
#limit用於前向或後向填充式最大的填充範圍

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python學習二：列表、循環、元組、字典

《毫無障礙學Python》鄧文淵著學習筆記 1.列表結構（List） (又稱清單，即爲其他語言的數組Array) 列表的使用：列表名 = [元素1,元素2,…] 中括號隔開，元素數據類型可同可不同，獲取元素值方法：下標訪問（下

2020-07-08 11:00:43

Python學習一：變量與數據類型、表達式、條件語句

《毫無障礙學Python》鄧文淵著學習筆記變量與數據類型、表達式、條件語句變量 score = 80 #Python變量不聲明就可使用，Python會根據變量值設定數據類型，該score爲int型 fruit = "香蕉"

2020-07-08 11:00:42

Python學習六：web數據抓取與分析

《毫無障礙學Python》鄧文淵著學習筆記 web數據抓取與分析 1.網址解析 . 　　通過Python的 urlparse組件中的 urlparse函數，可對網址進行解析，其返回值爲元組類型的ResultParse對象，通過其

2020-07-08 11:00:42

Python學習五：sqlite數據庫

《毫無障礙學Python》鄧文淵著學習筆記 sqlite數據庫注：需要有數據庫基礎（會用SQL語句創建表，對錶內容進行增刪改查操作即可） sqlite安裝教程參考：https://www.runoob.com/sqlite/

2020-07-08 11:00:42

Python學習四：文件操作

《毫無障礙學Python》鄧文淵著學習筆記文件操作 1. open() 函數 open() 函數打開文件　　python內建函數可打開指定文件用於對文件讀取、修改、添加內容　　open(filename[,mode]

2020-07-08 11:00:42

Python學習三：函數、導包、目錄（文件夾）管理

《毫無障礙學Python》鄧文淵著學習筆記 1.函數 1.1 函數基本（1）語法： . 　　def 函數名(參數1，參數2，參數3,…): 　　#參數可無　　　　程序塊　　return 返回值1,返回值2,返回值3…

2020-07-08 11:00:42

阿里雲 MaxCompute 2020-12 月刊

【12月新發布功能】 1、MaxCompute 查詢編輯器支持查詢加速提升數據分析能力 MaxCompute 數據分析支持查詢加速，當分析師通過SQL查詢數據時，速度可提升至秒級，爲數據分析師提供更優的數據分析體驗。適用客戶及場景數據分

2021-01-05 14:43:48

阿里雲 MaxCompute 2020-11 月刊

【11月新功能發佈】1、MaxCompute支持以RAM角色身份訪問使用服務在雲賬號、RAM用戶基礎上，支持以RAM角色身份訪問服務，滿足跨雲服務的安全數據交換以及與企業已有身份系統實現SSO對接訪問需求。適用客戶已自建身份系統需要以R

2020-12-03 09:55:49

阿里雲 MaxCompute 2020-9 月刊

【9月新功能發佈】 1. MaxCompute作業監控診斷工具Logview功能升級發佈此次Logview功能升級，擴展了MaxCompute作業的監控指標，提供作業回放功能，新增Fuxi Sensor支持查看作業內存及CPU使用。適用

2020-10-10 10:31:48

物聯網和人工智能在疫苗研發中的作用

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！出於顯而易見的原因，研發疫苗是人們目前的首要考慮目標。尋找安全有效的冠狀病毒疫苗是成千上萬甚至數百萬人的生命以及全球經濟健康的基礎。在疫

雲棲號資訊小哥

2020-08-03 14:07:50

適合 Python 入門的 8 款強大工具！

Python是一種開源的編程語言，可用於Web編程、數據科學、人工智能以及許多科學應用。學習Python可以讓程序員專注於解決問題，而不是語法。由於Python相對較小，且擁有各式各樣的工具，因此比Java和C++等語言更具優勢，同時豐富的

雲棲號資訊小編

2020-07-27 11:40:52

星辰大海：阿里數據體驗技術揭祕！

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！阿里妹導讀：阿里巴巴數據體驗技術團隊從一開始建立就致力於打造數據領域體驗技術的標杆。經過多年的深耕，形成了一整套面向兩個階段的用戶產品的

雲棲號資訊小編

2020-07-23 13:04:56

python--內置函數

1、python內置函數：類型轉換數學運算常用 int() max() all() range() help() float() min() any() set() format() long() sum() type()

2020-07-08 10:38:40

“高手”和“菜鳥”的區別

對於程序員來說，“高手”和”菜鳥“之間的區別實際上只有兩個因素：一是從事編程時間的長短不同，使經驗的多少有所區別；第二個因素就是手頭掌握資料的多少了，因爲很多問題並不是靠自己鑽研可以解決的，必須靠資料，試想在寫DOS彙編程序時如果沒

2020-07-08 11:15:30

領帶打法大全—如何打領帶，怎麼打領帶才能體現優雅氣質？

領帶是男士體現品位、氣質、職位、身份、經濟能力最重要的服裝配飾，如何打領帶、怎樣打領帶才能體現男性優雅氣質呢？夢芭莎將幫助各位男士解答這些困惑，從基礎打法到趣味打法，讓你以不變應萬變，體驗不同領帶打法的樂趣。４種領帶基本打法現在普

2020-07-08 09:50:18

24小時熱門文章

最新文章

最新評論文章