PyTorch BROADCASTING SEMANTICS
官網資料:https://pytorch.org/docs/stable/notes/broadcasting.html
Broadcasting 是指不同大小的兩個 array 應該怎樣處理的操作。通常情況下,小一點的數組會被 broadcast 到大一點的,這樣才能保持大小一致。
兩個 Tensors 只有在下列情況下才能進行 broadcasting 操作:
- 每個 tensor 至少有一維
- 遍歷所有的維度,從尾部維度開始 ,每個對應的維度大小要麼相同; 要麼其中一個是 1; 要麼其中一個不存在
舉例說明
import torch
- 相同維度,一定可以 broadcasting。故可以互相操作
x=torch.empty(2,4,3)
y=torch.empty(2,4,3)
print(x.shape)
print(y.shape)
torch.Size([2, 4, 3])
torch.Size([2, 4, 3])
x.add(y)
tensor([[[1.0061e-42, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00]],
[[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00]]])
- x 沒有符合“至少有一個維度”,所以不可以 broadcasting. 故不能直接操作
x=torch.empty((0,))
y=torch.empty(2,2)
print(x.shape)
print(y.shape)
torch.Size([0])
torch.Size([2, 2])
x.add(y)
---------------------------------------------------------------------------
RuntimeError Traceback (most recent call last)
<ipython-input-24-2f346478ebe1> in <module>()
----> 1 x.add(y)
RuntimeError: The size of tensor a (0) must match the size of tensor b (2) at non-singleton dimension 1
- 遍歷所有的維度,從尾部維度開始 ,每個對應的維度大小要麼相同; 要麼其中一個是 1; 要麼其中一個不存在
需要變化維度才能操作
# 按照尾部維度對齊
x=torch.empty(5,3,4,1)
y=torch.empty( 3,1,1)
# x 和 y 是 broadcastable
# 1st 尾部維度: 都爲 1
# 2nd 尾部維度: y 爲 1
# 3rd 尾部維度: x 和 y 相同
# 4th 尾部維度: y 維度不存在
如果兩個 tensors 可以 broadcasting,那麼計算過程是這樣的:
- 如果 x 和 y 的維度不同,那麼對於維度較小的 tensor 的維度補 1,使它們維度相同。
- 然後,對於每個維度,計算結果的維度值就是 x 和 y 中較大的那個值。
x 和 y 是 broadcastable,即使唯獨不同也可以操作,操作後的結果,取唯獨最大的一端
x=torch.empty(5,1,4,1)
y=torch.empty( 3,1,1)
print(x.shape)
print(y.shape)
torch.Size([5, 1, 4, 1])
torch.Size([3, 1, 1])
(x+y).size()
torch.Size([5, 3, 4, 1])
來看一個不對的例子:原因 x和y 不是broadcastable,主要 2和3對應的維度不滿足條件
x=torch.empty(5,2,4,1)
y=torch.empty( 3,1,1)
(x+y).size()
---------------------------------------------------------------------------
RuntimeError Traceback (most recent call last)
<ipython-input-37-7836c771d982> in <module>()
1 x=torch.empty(5,2,4,1)
2 y=torch.empty(3,1,1)
----> 3 (x+y).size()
RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 1