目標檢測和分類的域適配研究簡述

1、檢測

1、Progressive Domain Adaptation for Object Detection 2020年

本文們提出用中間域來彌補域之間的差距,逐步解決更容易的適應子任務。該中間域是通過對源圖像進行轉換來模擬目標域內的圖像來實現的。爲了解決領域轉移問題,我們採用對抗性學習來在特性級別上對齊發行版本。此外,採用加權任務損失的方法處理中間域的不平衡圖像質量。實驗結果表明,該方法在目標域上的性能優於現有方法。

2、Adapting Object Detectors via Selective Cross-Domain Alignment 2019年

最先進的目標檢測器通常是在公共數據集上訓練的。當應用到不同的領域時,通常會遇到很大的困難,因爲這些領域的成像條件差別很大,並且無法獲得相應的註釋數據(或者獲取費用昂貴)。一種自然的補救方法是通過對齊兩個域上的圖像表示來調整模型。這可以通過對抗性學習來實現,並且在圖像分類等任務中被證明是有效的。但是,我們發現在目標檢測中,這種方法所取得的改進是非常有限的。一個重要的原因是,傳統的領域適應方法努力將圖像作爲一個整體進行對齊,而目標檢測,從本質上來說,關注的是可能包含感興趣的目標的局部區域。基於此,我們提出了一種新的領域適應方法用於目標檢測,以處理“在哪裏看”和“如何對齊”的問題。我們的關鍵思想是挖掘有區別的區域,即那些直接與目標檢測相關的區域,並專注於跨兩個域對齊它們。實驗表明,在各種領域轉移場景下,該方法的性能顯著優於現有方法,改進幅度約爲4% ~ 6%,同時保持了良好的可伸縮性。

3、Few-shot Adaptive Faster R-CNN 2019年

爲了減小域漂移導致的檢測性能下降,我們提出了一種新的小樣本自適應方法,該方法只需要少量的目標域圖像和有限的邊界框標註。爲此,我們首先觀察到幾個重大挑戰。首先,目標域數據嚴重不足,使得現有的大部分域適應方法無效。其次,目標檢測涉及到同時進行定位和分類,進一步複雜化了模型的適應過程。第三,模型存在過適應(類似於用少量數據示例進行訓練時的過擬合)和不穩定風險,可能導致目標域檢測性能下降。爲了解決這些問題,我們首先引入了源和目標特徵的配對機制,以緩解目標域樣本不足的問題。然後,我們提出了一種雙級模塊來將源訓練的檢測器適應於目標域:1)基於分割池的圖像級自適應模塊統一提取並比對不同比例和高寬比的位置局部patch特徵;2)實例級自適應模塊在語義上對齊成對的對象特性,同時避免類間的混淆。同時,採用源模型特徵正則化(SMFR)方法穩定了兩個模塊的自適應過程。結合這些貢獻,給出了一種小樣本自適應快速rcnn框架,稱爲FAFRCNN,它能有效地適應具有少量標記樣本的目標域。多數據集實驗表明,我們的模型在感興趣的少鏡頭域自適應(FDA)和無監督域自適應(UDA)條件下都取得了最新的性能。

4、Self-Training and Adversarial Background Regularization for Unsupervised Domain Adaptive One-Stage Object Detection 2019年

基於深度學習的對象檢測器有了顯著的改進。然而,當列車數據和測試數據具有不同的分佈時,基於監督學習的方法表現不佳。爲了解決這個問題,領域適應將知識從標籤充足的領域(源領域)轉移到標籤缺乏的領域(目標領域)。自訓練有助於類域適應,是實現域適應的有效途徑之一。不幸的是,使用僞標籤作爲ground-truth的幼稚方法會由於錯誤的僞標籤而降低性能。提出了一種基於弱自訓練(WST)和敵對背景分數正則化(BSR)的區域自適應單階段目標檢測方法。WST降低了僞標籤不準確對學習過程的負面影響,穩定了學習過程。BSR幫助網絡提取目標背景的識別特徵,減少領域位移。這兩個組成部分是互補的,因爲BSR加強了前景和背景之間的區別,而WST加強了階級區分。實驗結果表明,該方法有效地提高了無監督區域自適應設置下的單階段目標檢測性能。

5、A Robust Learning Approach to Domain Adaptive Object Detection 2019年

在目標檢測的實際應用中,域漂移是不可避免的。例如,在自動駕駛汽車中,目標域由不受約束的道路環境組成,這些環境在訓練數據中是不可能全部觀察到的。同樣,在監視應用程序中,由於隱私規定,可能缺乏足夠有代表性的培訓數據。在本文中,我們從魯棒學習的角度來解決領域自適應問題,並證明了這個問題可以用帶噪聲標籤的訓練來表述。我們提出了一個健壯的對象檢測框架,該框架對邊界框、類標籤、位置和大小標註中的噪聲具有彈性。爲了適應域的移動,在目標域上訓練模型,使用在源域上訓練的檢測模型得到的一組有噪聲的目標邊界盒。我們評估了我們的方法在各種源/目標域對中的準確性,並證明了該模型顯著改善了SIM10K、城市景觀和KITTI數據集上的多域適應場景的最新水平。

6、Multi-adversarial Faster-RCNN for Unrestricted Object Detection 2019年

傳統的目標檢測方法本質上是假設訓練和測試數據都是在一個有限制的目標域內採集的,具有昂貴的標記代價。爲了緩解領域依賴和標註繁瑣的問題,本文提出利用具有足夠標籤的輔助源領域訓練出的領域知識來檢測不受限制環境下的目標。具體地說,我們提出了一個多對抗式快速- rcnn (MAF)框架用於不受限制的目標檢測,該框架內在地解決了域視差最小化以在特徵表示中實現域適應。本文的優點有三方面:1)針對圖像分佈導致的域視差問題,提出了一種層次域特徵對齊模塊,該模塊設計了多個對立的域分類器子模塊,用於分層的域特徵混淆;2)提出了一種用於分級特徵圖調整大小的信息不變尺度縮減模塊(SRM),以提高對抗性域自適應的訓練效率;3)爲了提高區域適應性,將與檢測結果相結合的建議特徵輸入到提出的加權梯度反轉層(WGRL)中,用於描述難混淆的區域樣本。我們在不受限制的任務中評估MAF,包括Cityscapes、KITTI、Sim10k等,實驗顯示了現有檢測器的最先進性能。

7、Cross-Domain Weakly-Supervised Object Detection through Progressive Domain Adaptation 2018年

在沒有實例級註釋的情況下,我們可以檢測各種圖像域中的常見對象嗎?在本文中,我們提出了一個新的任務框架,跨域弱監督目標檢測,解決了這個問題。對於本文,我們可以訪問源域中具有實例級註釋的圖像(如自然圖像)和目標域中具有圖像級註釋的圖像(如水彩圖像)。此外,目標域中要檢測的類是源域中的所有類或類的子集。從一個在源域上預先訓練的完全監督的目標檢測器開始,我們提出了一種兩步漸進的域適應技術,通過對人工和自動生成的兩種類型的樣本對檢測器進行微調。我們在新收集的包含三個圖像域的數據集上測試了我們的方法,與性能最好的基線相比,在平均平均精度(mAP)方面取得了大約5到20個百分點的改進。

8、Domain Adaptive Faster R-CNN for Object Detection in the Wild 2018年

目標檢測通常假設訓練和測試數據是從一個相同的分佈中提取的,然而,在實踐中並不總是如此。這種分佈不匹配將導致顯著的性能下降。在這項工作中,我們的目標是提高目標檢測的跨域魯棒性。我們在兩個層次上處理域移位:1)圖像層次的移位,比如圖像樣式、光照等;2)實例層次的移位,比如對象外觀、大小等。我們基於最近最先進的更快的R-CNN模型建立我們的方法,並在圖像級和實例級設計了兩個領域適應組件,以減少領域差異。這兩個領域適應構件都是基於h -散度理論,通過對抗性訓練的方式學習一個領域分類器來實現的。在更快的R-CNN模型中,通過一致性正則化進一步加強不同層次的域分類器來學習域不變區域建議網絡(RPN)。我們使用包括Cityscapes、KITTI、SIM10K等在內的多個數據集來評估我們新提出的方法。結果表明,我們提出的方法是有效的魯棒目標檢測在各種領域的移動場景。

9、Domain Adaptation of Deformable Part-Based Models 2014年

當訓練數據(源域)和應用場景(目標域)存在內在差異時,對象分類器的準確性會顯著下降。因此,使分類器適應它們必須操作的場景是極其重要的。提出了一種新的區域自適應(DA)方法用於目標檢測。作爲概念上的證明,我們專注於採用最先進的基於變形部分的模型(DPM)進行行人檢測。我們引入了一種自適應結構支持向量機(a - ssvm),它可以在不同的領域之間適應預先學習的分類器。通過考慮特性空間中的固有結構(例如DPM中的部件),我們提出了一個結構感知的a - ssvm (SA-SSVM)。A-SSVM和SA-SSVM都不需要重新訪問源域培訓數據來執行適應。相反,只使用少量的目標域訓練示例(例如行人)。爲了解決沒有目標域註釋樣本的情況,我們提出了一種基於自適應學習(SPL)策略和高斯過程迴歸(GPR)的自適應DPM。評估了兩種類型的適應任務:從合成行人和一般人(PASCAL VOC)到從車載攝像機拍攝的行人圖像。結果表明,我們的建議避免精度下降高達15點時,比較適應和非適應探測器。

10、LSDA: Large Scale Detection through Adaptation 2014年

縮放目標檢測的一個主要挑戰是很難獲得大量類別的標記圖像。最近,深度卷積神經網絡(CNNs)在物體分類的基準測試中脫穎而出,部分原因是它訓練了120萬多張標記分類圖像。不幸的是,這些標籤中只有一小部分可用於檢測任務。從搜索引擎中收集大量圖像級標籤要比收集檢測數據並用精確的邊框標記要便宜和容易得多。在本文中,我們提出了大規模自適應檢測(LSDA)算法,該算法學習到兩種任務之間的區別,並將這種知識轉移到沒有邊框標註數據的類別分類器中,使其成爲檢測器。我們的方法可以檢測成千上萬個類別,這些類別沒有邊框標註,但有大量的分類數據。對ImageNet LSVRC-2013檢測挑戰的評估證明了我們的方法的有效性。該算法通過使用ImageNet樹中的葉節點的可用分類數據,使我們能夠生成7.6K的檢測器。我們還演示瞭如何修改我們的體系結構來生成一個快速檢測器(7.6K檢測器以2fps運行)。

2、分類

1、Unsupervised Domain Adaptation by Backpropagation 2014年

性能最好的深層架構是在大量標記數據上進行訓練的。在某項任務缺少標記數據時,域適應通常提供了一個有吸引力的選擇,因爲可以獲得性質相似但來自不同領域的標記數據(例如合成圖像)。在此,我們提出了一種新的領域適應方法,該方法可以訓練來自源域的大量標記數據和來自目標域的大量未標記數據(不需要標記目標域數據)。隨着訓練的進行,該方法促進了“深度”特徵的出現,這些特徵(i)對源域上的主要學習任務具有區分能力,(ii)對於域之間的轉換不變性。我們表明,這種適應行爲可以在幾乎任何前饋模型中實現,通過增加少量的標準層和一個簡單的新的梯度反轉層。由此產生的增強架構可以使用標準的反向傳播進行訓練。總的來說,使用任何深度學習包都可以輕鬆實現這種方法。在一系列的圖像分類實驗中,該方法取得了良好的分類效果,在大域移位的情況下取得了較好的自適應效果,並且在Office數據集上取得了較好的效果。

2、Learning Transferable Features with Deep Adaptation Networks 2015年

最近的研究表明,深度神經網絡可以學習可轉移的特徵,這些特徵可以很好地應用於新的領域適應任務。然而,隨着深度特徵沿着網絡由一般特徵向特定特徵過渡,特徵在較高層次上的可移動性顯著下降,領域差異增大。因此,正式地減少數據集偏差和增強任務特定層的可轉移性是很重要的。本文提出了一種新的深度自適應網絡結構,將深度卷積神經網絡推廣到領域自適應場景中。在DAN中,所有特定任務層的隱藏表示法都嵌入到一個複製的核hilbert空間中,在這個空間中,不同域分佈的主題嵌入可以顯式匹配。採用最優多核選擇方法進行均值嵌入匹配,進一步減小了域差異。DAN可以在統計保證的情況下學習可轉移特徵,並通過核嵌入的無偏估計來實現線性尺度擴展。大量的經驗證據表明,提出的架構產生了最先進的圖像分類錯誤率的標準領域適應基準。

3、Simultaneous Deep Transfer Across Domains and Tasks 2015年

最近的報告表明,一個在大規模數據集上訓練的通用的監督深度CNN模型可以減少數據集偏差,但不能消除數據集偏差。在一個新的領域中對深層模型進行微調需要大量的標記數據,這對於許多應用程序來說是不可用的。我們提出了一種新的CNN結構來利用未標記和稀疏標記的目標域數據。該方法同時優化了域不變性以促進域傳輸,並使用軟標籤分佈匹配丟失來實現任務間的信息傳輸。我們提出的適應方法在監督和半監督適應環境下評估了兩個標準的視覺域適應任務,其經驗性能超過了之前發表的結果。

4、REVISITING BATCH NORMALIZATION FOR PRACTICAL DOMAIN ADAPTATION 2016年

深度神經網絡(DNN)在圖像分類和目標檢測等計算機視覺應用中取得了前所未有的成功。然而,在訓練階段這仍然是一個常見的煩惱,一個人必須準備至少數以千計的標記圖像,以微調網絡到一個特定的領域。最近的研究表明,DNN對訓練數據集有很強的依賴性,如果不進行微調,學習到的特徵很難轉移到不同但相關的任務中。在本文中,我們提出了一個簡單而強大的補救措施,即自適應批處理歸一化(AdaBN),以提高一個DNN的泛化能力。該方法通過調整網絡上各批處理歸一化層的統計量,實現了域自適應任務的深度自適應。與其他深度學習領域自適應方法不同,該方法不需要額外的組件,且不需要參數。它的檔案最先進的表現,儘管它令人驚訝的簡單。此外,我們證明了我們的方法與其他現有的方法是互補的。將AdaBN與現有的領域適應處理相結合可以進一步提高模型性能。

5、Coupled Generative Adversarial Networks 2016年

我們提出耦合生成對抗網絡(CoGAN)來學習多域圖像的聯合分佈。現有的方法要求訓練集中不同區域對應圖像的元組,而CoGAN可以學習不需要任何對應圖像元組的聯合分佈。它可以通過從邊緣分佈中抽取樣本來學習聯合分佈。這是通過強制執行一個權值分配約束來實現的,該約束限制了網絡容量,有利於聯合分佈解決方案而不是邊際分佈的乘積。我們將CoGAN應用於多個聯合分佈學習任務,包括學習顏色和深度圖像的聯合分佈,以及學習具有不同屬性的人臉圖像的聯合分佈。對於每個任務,它成功地學習了聯合分佈,而不需要相應的圖像元組。我們還演示了它在領域適應和圖像變換方面的應用。

6、Unsupervised Domain Adaptation with Residual Transfer Networks 2016年

深度神經網絡最近的成功依賴於大量的標記數據。對於沒有標記數據的目標任務,域適應可以將學習者從不同的源域轉移過來。本文提出了一種新的深度網絡域自適應方法,它可以同時從源域的標記數據和目標域的未標記數據中學習自適應分類器和可轉移特徵。我們放鬆了以前方法所做的共享分類器假設,並假設源分類器和目標分類器之間存在一個殘差函數。我們使分類器自適應,通過插入數層深度網絡顯式學習殘差函數參考目標分類器。我們將多層特徵嵌入到重建核希爾伯特空間(RKHSs)中,並匹配特徵分佈進行特徵適應。採用新的殘差層和損失函數擴展前饋模型,可以有效地訓練前饋模型的自適應行爲。經驗證據表明,該方法在標準領域自適應數據集上優於現有的方法。

7、Deep Transfer Learning with Joint Adaptation Networks 2016年

深度網絡已經成功地應用於學習可轉移的特徵,使模型從一個源域適應到另一個目標域。在本文中,我們提出了聯合自適應網絡(JAN),它通過基於聯合最大平均誤差(JMMD)準則來調整多個領域特定層的聯合分佈來學習傳輸網絡。採用對抗性訓練策略最大化JMMD,使源域和目標域的分佈更容易區分。學習可以用線性時間內由反向傳播計算出的梯度進行隨機梯度下降。實驗證明,我們的模型在標準數據集上產生了最新的結果。

8、Deep CORAL: Correlation Alignment for Deep Domain Adaptation 2016年

深度網絡已經成功地應用於學習可轉移的特徵,使模型從一個源域適應到另一個目標域。在本文中,我們提出了聯合自適應網絡(JAN),它通過基於聯合最大平均誤差(JMMD)準則來調整多個領域特定層的聯合分佈來學習傳輸網絡。採用對抗性訓練策略最大化JMMD,使源域和目標域的分佈更容易區分。學習可以用線性時間內由反向傳播計算出的梯度進行隨機梯度下降。實驗證明,我們的模型在標準數據集上產生了最新的結果。

9、Adversarial Discriminative Domain Adaptation 2017年

對抗性學習方法是一種很有前途的訓練魯棒深度網絡的方法,可以產生複雜的樣本跨不同的領域。儘管存在域偏移或數據集偏差,它們也可以提高識別能力:最近引入了一些對抗的無監督域自適應方法,它們可以減少訓練和測試域分佈之間的差異,從而提高泛化性能。之前的生成方法顯示出引人注目的可視化效果,但在有區別的任務上不是最佳的,並且可以限制在較小的轉變。先前的區分方法可以處理更大的領域轉移,但強加在模型上的權重,並沒有利用基於gan的損失。我們首先爲對抗適應勾勒出一個新的廣義框架,它將最近最先進的方法作爲特例納入其中,並且我們使用這個廣義的觀點來更好地關聯之前的方法。我們提出了一個以前未開發的例子,我們的一般框架結合了歧視建模,無約束的權重共享,和GAN損失,我們稱之爲對抗歧視領域適應(ADDA)。我們證明了ADDA比領域對抗性的方法更有效,也更簡單,並且通過在標準的跨領域數字分類任務和新的更困難的跨模態目標分類任務上超越最先進的無監督自適應結果,證明了我們的方法的前景。

10、CENTRAL MOMENT DISCREPANCY (CMD) FOR DOMAIN-INVARIANT REPRESENTATION LEARNING 2017年

研究了神經網絡在域自適應背景下的域不變表示的學習。我們提出了一種新的正則化方法,最大限度地減少了隱藏激活空間中特定領域的潛在特徵表示之間的差異。雖然存在一些標準分佈匹配方法可以解釋爲矩的加權和的匹配,如最大平均偏差,但一個顯式的高階矩的順序匹配之前沒有考慮。我們提出利用階矩差來匹配概率分佈的高階中心矩。我們的模型不需要計算昂貴的距離和核矩陣計算。利用矩序列對概率分佈的等價表示,定義了一個新的距離函數,稱爲中心矩差(CMD)。證明了CMD是緊區間上概率分佈集上的一個度量。我們進一步證明了概率分佈在緊區間上的收斂性。新的度量意味着各隨機變量的分佈是收斂的。我們在兩個不同的基準數據集上測試我們的方法,分別用於對象識別(Office)和產品評論情緒分析(Amazon評論)。CMD在辦公室的大多數領域適應任務上取得了最新的最先進的性能,在Amazon評論上優於那些訓練了最大平均差異、變分公平自編碼器和領域對抗神經網絡的網絡。參數敏感性分析表明,該方法在一定區間內的參數變化是穩定的。實驗的源代碼是公開的1。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章