Numpy對數組的操作:創建/變形(升降維等)/計算/取值/複製/分割/合併

1. 簡介

NumPy(Numerical Python) 是 Python 語言的一個擴展程序庫,支持大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。最主要的數據結構是ndarray數組。

NumPy 通常與 SciPy(Scientific Python)和 Matplotlib(繪圖庫)一起使用, 這種組合廣泛用於替代 MatLab。
SciPy 是一個開源的 Python 算法庫和數學工具包。SciPy 包含的模塊有最優化、線性代數、積分、插值、特殊函數、快速傅里葉變換、信號處理和圖像處理、常微分方程求解和其他科學與工程中常用的計算。
Matplotlib 是 Python 編程語言及其數值數學擴展包 NumPy 的可視化操作界面。

2. 創建

  • 創建一維數組

(1)直接創建:np.array([1, 2, 3, 4, 5, 6])
(2)從python的list中建立:np.array(list([1, 2, 3, 4, 5, 6]))

  • 創建常量值的一維數據

(1)創建以0爲常量值:np.zeros(n,dytpe=float/int)
(2)創建以1爲常量值:np.ones(n)
(3)創建一個空數組:np.empty(4)

  • 創建一個元素遞增的數組

(1)從0開始增長的遞增數組:np.arange(8)
(2)給定區間,自定義步長:np.arange(0,1,0.2)
(3)給定區間,自定義個數:np.linspace(-1,1,50)

  • 創建多維數組:創建單維數組,再添加進多維數組
# 數組的結構一定是np.array([]) 無論數組中間存放的是多少“層”數據
# 二維數組相當於存放的是“兩層”數組而已
arr1=np.array(list([1, 2, 3, 4, 5]))
arr2=np.array([arr1,[1,0,0,1,0]])								# 2*5的兩維數組
arr3=np.array(list([[0,0,1,1,1],[1,1,1,0,0],[2,3,4,5,6]]))		# 3*5的兩維數組

arrx=np.array([arr1,list([1, 2, 3, 4, 5],[1,1,1,0,0])])			# 報錯
arry=np.array([list([[ 1,2,3,  7, 11],[2,3,4,5,6]]),[1, 2, 3, 4, 5]])	# 報錯
  • 創建常量值的(n*m)維數據

(1)創建以0爲常量值:np.zeros((n*m),dytpe=float/int)
(2)創建以1爲常量值:np.ones((n*m))
(3)創建一個空數組:np.empty((n*m))

  • 創建隨機數字的數組

  • 生成隨機數種子:

(1)np.random.seed()
(2)np.random.RandomState()

  • 生成隨機數:
函數 取值 說明
1 np.random.rand(d0,d1,…,dn) [0,1) 根據給定維度生成數組,服從均勻分佈
2 np.random.randint(low, high=None, size=None, dtype=’l’) [0,low)或者[low,high) 根據size生成離散均勻分佈的整數值
3 np.random.randn(d0,d1,…,dn) 根據給定維度生成數組,服從標準正態分佈
4 np.random.random_sample(size=None) [0,1) 根據給定維度生成隨機浮點數
5 np.random.random(size=None) [0,1) 根據給定維度生成隨機浮點數
6 np.random.ranf(size=None) [0,1) 根據給定維度生成隨機浮點數
7 np.random.sample(size=None) [0,1) 根據給定維度生成隨機浮點數
  • 生成有分佈規律的隨機數組

(1)二項分佈:np.random.binomial(n, p, size)
(2)正態分佈:np.random.normal(loc, scale, size)

  • 將csv文件轉化成數組或陣列

使用 np.genfromtxt( ‘csv文件名’,delimiter = ‘文件中的分割符’ )函數將文件轉化成數組

 csv_array = np.genfromtxt('sample.csv', delimiter=',')
 print(csv_array)

3. 數組的變形

  • 生成數組/矩陣轉置的函數,即行列數字交換,使用.T
a = np.array([[32, 15, 6, 9, 14], 
              [12, 10, 5, 23, 1],
              [2, 16, 13, 40, 37]])
print(a.T)

-------------------
# 結果如下
[[32 12  2]
 [15 10 16]
 [ 6  5 13]
 [ 9 23 40]
 [14  1 37]]
  • 改變數組的形狀:

(1)arr.resize(n,m) :arr.resize(n,m)函數是原地修改數組,要求:元素的個數必須一致

a=np.arange(8)
a.resize(2,4)
print(a)

---------------------------
[[0 1 2 3]
 [4 5 6 7]]

(2)arr.reshape(n,m):如果某一個維度的參數爲-1,則表示元素總個數會遷就另一個維度來計算

a=np.arange(8).reshape(-1,1)
print(a)

-----------------
[[0]
 [1]
 [2]
 [3]
 [4]
 [5]
 [6]
 [7]]
  • 將一維升至二維:np.newaxis

np.newaxis實際上是直接增加維度的意思,我們一般不會給數組增加太多維度,這裏以一維增加到二維爲例:

(1)增加行維度:arr[np.newaxis, :]
(2)增加列維度:arr[: , np.newaxis]

a=np.arange(8)

a							# array([0, 1, 2, 3, 4, 5, 6, 7])
a.shape						# (8,)
a[np.newaxis, :]			# array([[0, 1, 2, 3, 4, 5, 6, 7]])
a.shape						# (8,)
a[: , np.newaxis]			# array([[0],[1],[2],[3],[4],[5],[6],[7]])
a.shape						# (8,)
  • 降維:arr.ravel()

arr.ravel()函數在降維時:默認是行序優先生成新數組(就是一行行讀);如果傳入參數“F”則是列序降維生成新數組

a=np.array([[1,2],[3,4]])
a.ravel()				
a.ravel('F')			

----------------------------
# 結果 array([1, 2, 3, 4])
# 結果 array([1, 3, 2, 4])

4. 計算

  • 對數組進行計算操作

(1)對元素進行加減計算

a=np.arange(8).reshape(2,4)				# array([[0, 1, 2, 3], [4, 5, 6, 7]])
b=np.random.randint(8,size=(2,4))		# array([[1, 2, 5, 3], [4, 1, 0, 6]])
a+b
a-b

----------------------------
# a+b和a-b結果分別是:
array([[ 1,  3,  7,  6],
       [ 8,  6,  6, 13]])
array([[-1, -1, -3,  0],
       [ 0,  4,  6,  1]])

(2)乘法:平方/矩陣中元素相乘

a=np.arange(8).reshape(2,4)				# array([[0, 1, 2, 3], [4, 5, 6, 7]])
b=np.random.randint(8,size=(2,4))		# array([[1, 2, 5, 3], [4, 1, 0, 6]])
a**2
a*b

-----------------------
# a矩陣平方/a*b矩陣中元素相乘結果分別:
array([[ 0,  1,  4,  9],
       [16, 25, 36, 49]])
array([[ 0,  2, 10,  9],
       [16,  5,  0, 42]])     

(3)矩陣*矩陣:

# 要求a矩陣的行要等於b矩陣的列數;且a矩陣的列等於b矩陣的行數
a=np.arange(8).reshape(2,4)				# array([[0, 1, 2, 3], [4, 5, 6, 7]])
b=np.random.randint(8,size=(4,2))		# array([[3, 0],[3, 3],[5, 6],[6, 7]])
c1 = np.dot(a,b)
c2 = a.dot(b)

----------------------
# ab矩陣相乘的結果:c1=c2 
array([[ 31,  36],
       [ 99, 100]])

(4)邏輯計算

【注】列表是無法作爲一個整體對其中的各個元素進行邏輯判斷的!

# 結果返回:一個數組,其中每個元素根據邏輯判斷的布爾類型的結果
a > 3	
-----------------------------
# 結果如下:
array([[False, False, False, False],
       [ True,  True,  True,  True]])

5. 取值

  • 獲取一維數組中的某個元素:操作和list列表的index一樣
a = np.array([5, 2, 7, 0, 11])

a[0]			# 結果爲 5
a[:4]			# 結果爲 從頭開始到索引爲4結束
a[2:]			# 結果爲 從索引爲2的開始到結尾
a[::2]			# 結果爲 從頭開始到結尾,每2個取一個值
  • 獲取多維數組的某個元素,某行或列值
a = np.array([[32, 15, 6, 9, 14], 
              [12, 10, 5, 23, 1],
              [2, 16, 13, 40, 37]])

a[2,1]					# 結果是一個元素 16
a[2][1]					# 結果是一個元素 16
a[1]					# 第2行 array([12, 10,  5, 23,  1])
a[:,2]					# 取出全部行,第2列 [15,10,16]
a[1:3, :]				# 取出[1,3)行,全部列
a[1,1:]					# array([10,  5, 23,  1])
  • 獲取滿足邏輯運算的
# 需要注意的是,我們數據進行邏輯計算操作得到的仍然是一個數組
# 如果我們想要的是一個過濾後的數組,就需要將"邏輯判斷"傳入數組中
a = np.array([[32, 15, 6, 9, 14], 
              [12, 10, 5, 23, 1],
              [2, 16, 13, 40, 37]])

a[a > 3]
a[(a > 3) | (a < 2)]	

------------------------------
# 結果分別是:
array([32, 15,  6,  9, 14, 12, 10,  5, 23, 16, 13, 40, 37])
array([32, 15,  6,  9, 14, 12, 10,  5, 23,  1, 16, 13, 40, 37])
  • 遍歷:結果是按行輸出
a = np.array([[32, 15, 6, 9, 14], 
              [12, 10, 5, 23, 1],
              [2, 16, 13, 40, 37]])
for x in a:
    print(x)

--------------------
[32 15  6  9 14]
[12 10  5 23  1]
[ 2 16 13 40 37]

6. 複製/分割/合併

  • 複製:arr.cope()
  • 分割:

(1)等分:np.split(arr, n, axis=0/1)(即行數或列數可以整除n時纔可以)
(2)不等分:np.array_split(arr, n) 默認按行分n份

a = np.array([[32, 15, 6, 9, 14, 21], 
              [12, 10, 5, 23, 1, 10],
              [2, 16, 13, 40, 37, 8]])
              
# 可以看到a矩陣是(3*6),所以使用np.split()只能嘗試行分成3份;或者列分成2/3/6份 
np.split(a,3,axis=0)	
np.split(a,3,axis=1)

np.array_split(a,2)
np.array_split(a,4,axis=1)

-------------------------------------------
[array([[32, 15,  6,  9, 14, 21]]),
 array([[12, 10,  5, 23,  1, 10]]),
 array([[ 2, 16, 13, 40, 37,  8]])]
   
[array([[32, 15],
        [12, 10],
        [ 2, 16]]), array([[ 6,  9],
        [ 5, 23],
        [13, 40]]), array([[14, 21],
        [ 1, 10],
        [37,  8]])]
        
[array([[32, 15,  6,  9, 14, 21],
        [12, 10,  5, 23,  1, 10]]), array([[ 2, 16, 13, 40, 37,  8]])]
        
[array([[32, 15],
        [12, 10],
        [ 2, 16]]), array([[ 6,  9],
        [ 5, 23],
        [13, 40]]), array([[14],
        [ 1],
        [37]]), array([[21],
        [10],
        [ 8]])]      
  • 合併:np.concatenate((arr1,arr2,arr3), axis=0/1) 默認接在數據下面
a=np.random.rand(2,3)
b=np.random.randint(1,size=(2,3))

np.concatenate((a,b,a))					# 接在下面
np.concatenate((a,b,a),axis=1)			# 接在後面

------------------------
array([[0.95912866, 0.81396527, 0.809493  ],
       [0.4539276 , 0.24173315, 0.63931439],
       [0.        , 0.        , 0.        ],
       [0.        , 0.        , 0.        ],
       [0.95912866, 0.81396527, 0.809493  ],
       [0.4539276 , 0.24173315, 0.63931439]])

​array([[0.95912866, 0.81396527, 0.809493  , 0.        , 0.        ,
        0.        , 0.95912866, 0.81396527, 0.809493  ],
       [0.4539276 , 0.24173315, 0.63931439, 0.        , 0.        ,
        0.        , 0.4539276 , 0.24173315, 0.63931439]])
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章