tx、ty:預測的座標偏移值,經過sigmoid變換。
Cx、Cy:在本圖是1,這樣經過計算後,就得到了預測bbox的中心點座標。
tw、th:尺度縮放。
bx、by:預測出的bbox的中心點座標。通過計算得出。
bw、bh:預測出的bbox的寬和長。通過計算得出。
Pw、Ph:anchor box經過縮小之後,映射到feature中的寬和高。
1、yolov3中每個grid cell在feature map中的寬和高均爲1。
2、Cx、Cy在feature map中是grid cell的左上角座標,本圖的Cx=1,Cy=1,就是第二行第二列的grid cell的左上角座標。
3、Pw、Ph是anchor box經過縮小之後,映射到feature中的寬和高,是通過原始座標/stride後得到的,其中stride代表每個像素對應原圖的大小。
4、網絡學習的是tx、ty、tw、th這四個offset。