ALS算法的基本思想

SparkALS算法基本思想

ALS算法是基於模型的推薦算法。起基本思想是對稀疏矩陣進行模型分解,評估出缺失項的值,以此來得到一個基本的訓練模型。然後依照此模型可以針對新的用戶和物品數據進行評估。ALS是採用交替的最小二乘法來算出缺失項的。交替的最小二乘法是在最小二乘法的基礎上發展而來的。由於本人數學有限,就大體的介紹下最小二乘法的思想

最小二乘法

以下是用戶A、B、C對物品A、B、C的打分

用戶\物品 物品A(id=1) 物品B(id=7)) 物品C(id=9)
用戶A(id=4) 5 ? 4
用戶B(id=2) ? ? 3
用戶C(id=3) 1 3 5

上圖的矩陣可以按照(用戶id,物品id)=評分的方式,在一個X/Y軸的一個點,只不過這些點有的有具體的值,有的沒有,那麼我們可以根據已經有值的點計算出一個函數F,使得這個函數F的曲線近似的穿插這些點,並使這些點的真值(表中的評分)與函數F測算值的方差之和最小(可以認爲方差之和爲0)。這樣就可以獲得一個方差函數FF,針對方差函數FF求偏導,就可以計算出函數F。
描述的不太清楚,可以參見博客http://blog.csdn.net/yauphy1/article/details/43735763

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章