numpy中* @ mutiply dot的用法分析

引言:
最近同學在做機器學習作業時,代碼中遇到了* @ np.mutiply .dot這個幾個numpy的運算,發現有點暈,於是我在這裏做幾個簡單的對比,以及列舉需要注意的問題


首先先給一個比較簡單的用法解釋:
*:               根據數據類型的不同,可能是做點乘運算,也可能做矩陣乘法運算
@:               只做矩陣乘法運算
.dot:          只做矩陣乘法運算
np.mutiply只做點乘運算


爲了說明上述結論的正確性,下面首先對ndarray數據類型進行運算操作

In [1]: import numpy as np

In [2]: a = np.array(np.arange(4)).reshape(2,2)

In [3]: b = a

In [4]: a
Out[4]:
array([[0, 1],
       [2, 3]])

In [5]: b
Out[5]:
array([[0, 1],
       [2, 3]])

In [6]: np.multiply(a, b)
Out[6]:
array([[0, 1],
       [4, 9]])

In [7]: a * b
Out[7]:
array([[0, 1],
       [4, 9]])

In [8]: a.dot(b)
Out[8]:
array([[ 2,  3],
       [ 6, 11]])
In [9]: a @ b
Out[9]:
array([[ 2,  3],
       [ 6, 11]])

如果array不是方陣,我們再運行測試,得到如下結果

In [16]: a = np.array(np.arange(6)).reshape(3,2)

In [17]: a
Out[17]:
array([[0, 1],
       [2, 3],
       [4, 5]])

In [18]: b = a.T

In [19]: b
Out[19]:
array([[0, 2, 4],
       [1, 3, 5]])

In [20]: b * a
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-20-245d0d068c2b> in <module>()
----> 1 b * a

ValueError: operands could not be broadcast together with shapes (2,3) (3,2)

In [21]: np.multiply(b, a)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-23-bae4ae98f8ad> in <module>()
----> 1 np.multiply(b, a)

ValueError: operands could not be broadcast together with shapes (2,3) (3,2)
In [22]: b.dot(a)
Out[22]:
array([[20, 26],
       [26, 35]])

In [23]: b @ a
Out[23]:
array([[20, 26],
       [26, 35]])

從上面可以發現,針對ndarray而言:
*np.multiply 只能做點乘運算,當運算符兩邊的數據維度無法滿足點乘運算結果時,就會報錯
@.dot 只能做矩陣乘法運算


然後再對matrix數據類型進行運算操作

In [27]: a = np.matrix(np.arange(4)).reshape(2,2)

In [28]: a
Out[28]:
matrix([[0, 1],
        [2, 3]])

In [29]: b = a

In [30]: b
Out[30]:
matrix([[0, 1],
        [2, 3]])

In [31]: a * b
Out[31]:
matrix([[ 2,  3],
        [ 6, 11]])

In [32]: np.multiply(a,b)
Out[32]:
matrix([[0, 1],
        [4, 9]])

In [33]: a @ b
Out[33]:
matrix([[ 2,  3],
        [ 6, 11]])

In [34]: a.dot(b)
Out[34]:
matrix([[ 2,  3],
        [ 6, 11]])
In [35]: c = np.matrix(np.arange(6)).reshape(3,2)

In [36]: d = c.T

In [37]: c
Out[37]:
matrix([[0, 1],
        [2, 3],
        [4, 5]])

In [38]: d
Out[38]:
matrix([[0, 2, 4],
        [1, 3, 5]])

In [39]: np.multiply(d, c)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-39-6c3683491fc6> in <module>()
----> 1 np.multiply(d, c)

ValueError: operands could not be broadcast together with shapes (2,3) (3,2)

從上面可以發現,針對matrix而言:
* 會做矩陣乘法運算
np.multiply 依然只能做點乘運算,當運算符兩邊的數據維度無法滿足點乘運算結果時,就會報錯。
@.dot 依舊保持只做矩陣乘法運算


總結:
爲了防止記混或者出錯,有以下建議:

  1. 只使用@來做矩陣乘法運算
  2. 只使用np.multiply來做點乘運算
  3. 在使用其他框架,類似於tensorflow或者pytorch,建議先針對這四個運算法運算一遍,明白其運算邏輯再Coding!

如果覺得我有地方講的不好的或者有錯誤的歡迎給我留言,謝謝大家閱讀(點個贊我可是會很開心的哦)~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章