聲明:譯自A Beginner’s Guide to Restricted Boltzmann Machines (RBMs)
Definition & Structure
受限玻爾茲曼機(RBM)由深度學習先驅Geoffrey Hinton提出,可用於降維、分類、迴歸、協同過濾、特徵提取和主題建模(topic modeling)。
RBM是一個淺層網絡,包括輸入層(input layer/visible layer)和隱藏層(hidden layer)。它的前向傳遞與常見的人工神經網絡一致。
activation f((weight w * input x) + bias b ) = output a
前向傳遞中,輸入爲,輸出爲,權重爲,偏執爲。
Reconstruction
RBM是一種無監督學習方法,其反向傳遞繼續使用當前的進行線性計算。
反向傳遞中,輸入爲,輸出爲,權重爲,偏執爲。此時的輸出可以看做是重構輸入(reconstructions),與的差值作爲誤差。在模型訓練開始時,是隨機初始化的,所以誤差較大,隨着訓練次數的增多,誤差慢慢減小。
RBM是一種生成學習方法,即學習輸入數據的概率模型。可以把和都看做概率曲線和,RBM的目標就是是這兩條概率曲線重合。KL散度(Kullback Leibler Divergence)被用來描述兩個概率分佈的一致性,KL散度越小,兩個分佈越相似。
爲了讓兩個分佈相似,RBM需要不斷的調整參數使如上圖所示進行移動。