這一篇是AAAI 2017的best paper。出自Stanford ,隨手查了一下,二作Stefano Ermon指導的AAAI 2017的另一篇paper,拿了Best Student Paper Award (CompSust Track)。在此膜拜一發。
一.題目理解
不得不說,一篇好的paper,題目很重要,是否吸引人。比如這一篇,猛地一看感覺很有內容,想法很新穎。
label-free : 訓練時,不使用任何標籤數據
Supervision :不用帶有label的數據,乾的卻是監督學習的事情。
Physics and Domain Knowledge:採用領域相關的知識,來作爲訓練時的監督信息。
由題目可得,作者是要用domain相關的知識,來代替傳統監督學習中的標籤信息,從而達到不使用label情況下,監督學習的目的。
二.Motivation
1.標籤數據是稀少並且昂貴的,但是監督學習,往往需要大量的標籤數據
2.如果不帶標籤訓練數據,往往陷入無監督學習的境地,而無監督學習得到的特徵往往是樸素的,沒有特定的含義與語義,這對於特定的任務而言,往往是不夠的。
因此,希望通過一種方法,在監督學習的同時,而不需要使用標籤數據,來儘可能達到甚至是超過,帶標籤的監督學習的精度。
三.Contribution
主要貢獻:提出了一種,通過限制條件,即domain相關的知識來約束輸出空間, 來進行監督學習的方法。
這樣一種方法的好處有兩點:
1.訓練時不需要label
2.這樣一種domain相關的約束,往往是對於多種數據集同時有效的,所以,這樣一種方式是generality的。
四.Problem setup
對於傳統的監督學習而言:
其中,
而在這篇paper中,學習的一種表示是:
其中,
因爲domain相關的約束對於特定的問題而言,往往是必要不充分的,因此如果僅僅依靠domain來約束的話,很有可能導致學習的
這裏可以看到,學習的過程中是不包含標籤
那麼這個
g 具體的表達式是什麼?可以這麼說,沒有固定的一種表達,不同的task,不同的domain,可能g 不盡相同,作者只是提出了這樣一種想法。而爲了驗證這種想法的正確性,作者在三種不同的任務上(兩種連續任務,一種離散任務),設計了g ,並且做了相應的測試。接下來,分別細講這三種任務。
五.Experiment1:Tracking an object in free fall
5.1 background
這個task面臨的是,通過視頻錄下,將一個物體拋在空中過程。這個視頻中的每一幀看成一個image
那麼
input: N張視頻中連續的image。即
output:
即需要通過網絡,學習一個函數
5.2Design
對於傳統的機器學習而言,可能會這麼做——CNN(label: height)
但是,對於本文而言,label-free,如何設計
g ?
5.2.1 domain knowledge
物體在空中的運動,基本遵循,牛頓第二定律即,:
其中直觀上講,函數
f 需要遵循牛頓第二定律的方程。
5.2.2 約束函數 g
作者是這麼將牛頓第二定律方程結合進來的。
首先
這個方程是怎麼得到的呢?
我們將 看成一個線性迴歸方程,即
其中v0 可以看成是w ,y0 看成b ,i△t 看成xi 那麼,根據對於線性迴歸方程通過最小二乘法求解,可以得到:
其中
由此便可得到:
那麼得到的
y^ 便可以看做是f(x) 的滿足於牛頓第二定律的表達。我們可以想到,通過神經網絡得到的高度
f(xi) 與yi 應是儘可能相近的。
因此最後的g 爲:
5.3 Experiment
Date set:電腦錄下的65段不同的拋物軌跡,共602張圖片,
Train set: 40 段軌跡
Tese set : 25 trajectories
Framwork:
Conv/ReLU/MaxPool ->
Conv/ReLU/MaxPool ->
Conv/ReLU/MaxPool->
Connected/ReLU ->
Connected/ReLU ->
regression output
5.4 Result
六.Experiment2:Tracking the position of a walking man
6.1 background
和第一個實驗類似,只不過這次預測的是行走的人的position(橫座標)
input:N張視頻中連續的image。即
輸出是:
即需要通過網絡,學習一個函數
6.2Design
6.2.1 domain knowledge
行人在短時間內的運動是勻速的,即:
6.2.2 約束函數g
如果直接按照第一個實驗,這麼設計的話,會很可能得到
f 的平凡解,比如
也是滿足勻速條件,要是僅用勻速這個domain來約束的話,很可能得到得到這樣一種平凡解,而平凡解顯然是我們不希望出現,因此爲了解決這樣一個問題,作者加入了一些正則項:
其中,h1(x) 爲了使得fx 方差儘可能大,避免平凡解(常數)
h2(x) 爲了避免fx 方差過大,而約束0<fx<10 之間因此最後的
g :
6.3 Experiment
Date set:電腦錄下的11段在6個不同場景的拋物軌跡,共507張圖片,
Train set: 50%
Framwork:
Conv/ReLU/MaxPool ->
Conv/ReLU/MaxPool ->
Conv/ReLU/MaxPool->
Connected/ReLU ->
Connected/ReLU ->
regression output
6.4 Result
七.Experiment3:Detecting objects with causal relationships
7.1 background
這是一個離散問題
input:一張image,(圖片可能有四種生物,黃色的公主,紅色的馬里奧,還有棕色和綠色的怪物)
輸出是:
即需要通過網絡,學習一個函數
預測每張圖片中是否有公主
7.2Design
7.2.1 domain knowledge
這裏的domain knowledge是一個邏輯關係,即當出現公主的時候,馬里奧一定出現,即
也就是說,可能的預測值是:
7.2.2 約束函數g
如果直接用這樣一種邏輯約束的話,即:
很容易遇到平凡解,比如
因此在這裏,加了三個正則項:
其中,h1(x) 中ρ(x) 是對圖片進行各種平移選擇變換,這個正則項的目的是爲了不考慮圖片中公主或者馬里奧的位置,更關注於是否存在這兩個物體,
h2(x) 爲了使得fx 方差儘可能大,避免平凡解(常數)
h3(x) 爲了增加輸出熵,即 每個概率爲1/3爲輸出熵最大。因此可以得到
g :
此外,即使加上這三個正則項,還是可能出現一些不願意看到的解:
比如正確的輸出是:,
那麼根據這樣一種關係,
還可能得到 滿足domain和約束,爲了解決這樣一種平凡解,作者是這麼做的
對於預測公主的網絡,即
f1 ,在一定卷積後的map上預測是否出現公主,要是出現公主,那麼在對應f2 ,公主對應的像素全都不考慮,即:
7.3 Experiment
Data Set: not mention
Test Set: 100 imagesFramework(
f1orf2 ):
Conv/ReLU/MaxPool ->
Conv/ReLU/MaxPool ->
Conv/ReLU/MaxPool->
channel mean ->
Connected/ReLU ->
Connected/ReLU ->
regression outputResult: not mention???
很奇怪,居然沒有說明,最後做的結果是如何的,筆者自行yy,可能作者在這個實驗上,做的效果不是很好,所以就沒有提及。
八.Conclusion
總結來看,不愧是best paper ,想法很好
但是,不足的是第三個實驗,有點不夠完善,和牽強。此外,對於domain相關約束設計,需要十分巧妙,而且,感覺應用的面不是很廣,因爲不是所有的task,都有類似於牛頓定律這種強約束。
因此,可能在挖坑,慎跳。