先介紹兩個概念:
零樣本識別:我們有一些有標籤數據,想讓它識別沒有標籤的數據,比如 有貓和狗的有標籤數 據,想識別豬,這種情況必須提供一些其他數據,比如標籤的屬性
少量樣本識別:直接舉例,貓和狗數據有100000張,豬隻有10張
文章的大體思想是 模擬人類進行識別,我們人之所以能夠識別一個新的東西,在於我們人的視覺系統天生的能夠對任意物體提取特徵,並進行比較。因爲我們能夠比較不同物體,所以我們根本無所謂看到的東西是不是以前就見過。這就是我們人具備少樣本學習能力的關鍵原因。
對於機器來說,我們首先進行提取特徵,可以先用已有標籤的數據進行分類訓練得到一個CNN網絡用來提取特徵。
然後,對於少樣本識別,可以用提取的特徵 和 想要測試的樣本進行比較,對於零樣本識別,我們用首先用屬性去訓練一個神經網絡,再把它的輸出和特徵進行比較, 這裏的比較可以是一個顯式的方法,比如歐式距離,但是由於我們並不知道什麼樣的度量方式是最有效的,我們可以用一個神經網絡去訓練它,用MSE作爲相似度的比較,得到測試樣本與每一個訓練樣本(屬性)相似度的結果。選擇相似度最高的。
個人理解,有不對的地方請多指正