Pandas基礎入門(1)前言和包知識

學習彙總:點這裏

前言

pandas是一個Python軟件包,適用於非常適合許多不同類型的數據:

  1. 具有異構類型列的表格數據,例如在SQL表或Excel電子表格中
  2. 有序和無序(不一定是固定頻率)時間序列數據。
  3. 具有行和列標籤的任意矩陣數據(同類型或異類)
  4. 觀察/統計數據集的任何其他形式。實際上,數據根本不需要標記即可放入熊貓數據結構中

Pandas主要處理以下三個數據結構 :

  1. 系列(Series)
  2. 數據幀(DataFrame)
  3. 面板(Panel)

這些數據結構構建在Numpy數組之上,這意味着它們很快。

維數和描述

考慮這些數據結構的最好方法是,較高維數據結構是其較低維數據結構的容器。 例如,DataFrame是Series的容器,Panel是DataFrame的容器。

數據結構 維數 描述
系列 1 1D標記均勻數組,大小不變。
數據幀 2 一般2D標記,大小可變的表結構與潛在的異質類型的列。
面板 3 一般3D標記,大小可變數組。

構建和處理兩個或更多個維數組是一項繁瑣的任務,用戶在編寫函數時要考慮數據集的方向。 但是使用Pandas數據結構,減少了用戶的思考。例如,使用表格數據(DataFrame),在語義上更有用於考慮索引(行)和列,而不是軸0和軸1。

注意:所有Pandas數據結構是值可變的(可以更改),除了系列都是大小可變的。系列是大小不變的。

系列

系列是具有均勻數據的一維數組結構。

關鍵點

  1. 均勻數據
  2. 尺寸大小不變
  3. 數據的值可變

數據幀

數據幀(DataFrame)是一個具有異構數據的二維數組。

關鍵點

  1. 異構數據
  2. 大小可變
  3. 數據可變

面板

面板是具有異構數據的三維數據結構。在圖形表示中很難表示面板。但是一個面板可以說明爲DataFrame的容器。

關鍵點

  1. 異構數據
  2. 大小可變
  3. 數據可變
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章