5分鐘瞭解受限玻爾茲曼機(RBM)

聲明:譯自A Beginner’s Guide to Restricted Boltzmann Machines (RBMs)

Definition & Structure

受限玻爾茲曼機(RBM)由深度學習先驅Geoffrey Hinton提出,可用於降維、分類、迴歸、協同過濾、特徵提取和主題建模(topic modeling)。

RBM是一個淺層網絡,包括輸入層(input layer/visible layer)和隱藏層(hidden layer)。它的前向傳遞與常見的人工神經網絡一致。

activation f((weight w * input x) + bias b ) = output a

前向傳遞中,輸入爲xx,輸出爲aa,權重爲ww,偏執爲bb

Reconstruction

RBM是一種無監督學習方法,其反向傳遞繼續使用當前的(w,b)(w,b)進行線性計算。

反向傳遞中,輸入爲aa,輸出爲rr,權重爲ww,偏執爲bb。此時的輸出rr可以看做是重構輸入(reconstructions),rrxx的差值作爲誤差。在模型訓練開始時,(w,b)(w,b)是隨機初始化的,所以誤差較大,隨着訓練次數的增多,誤差慢慢減小。

RBM是一種生成學習方法,即學習輸入數據的概率模型。可以把xxrr都看做概率曲線p(x)p(x)q(x)q(x),RBM的目標就是是這兩條概率曲線重合。KL散度(Kullback Leibler Divergence)被用來描述兩個概率分佈的一致性,KL散度DKL(PQ)D_{KL}(P\|Q)越小,兩個分佈越相似。

爲了讓兩個分佈相似,RBM需要不斷的調整參數(w,b)(w,b)使q(x)q(x)如上圖所示進行移動。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章