論文地址:https://arxiv.org/abs/1809.02714
Siamese體系的論文使外觀模型具有局域性local特徵,對外觀更變不具備魯棒性,本文加入attention機制使得網絡在離線訓練時更加關注非局部特徵(non-local)。
主要貢獻:
1、新型框架:捕獲對外觀變化健壯的non-local特徵,並減少層間的共享參數數量。
2、self-attention:響應映射具有non-local特徵,捕獲目標對象的語義信息。
3、解決梯度彌散問題,利用特徵重用,提高泛化能力。