協同過濾推薦中利用SVD提高推薦的效果

原創

2019-01-01 16:44

1.什麼是SVD :
SVD指的是奇異值分解 SVD SVD的物理意義

2.利用Python實現SVD

from numpy import linalg as la

# Numpy有一個稱爲linalg的線性代數工具,其中svd計算方法如下
U,Sigma,VT = la.svd(dataMat)

3.利用SVD提高效率
生產實際中的數據比較稀疏，在生產中不管是基於用戶的相似度計算還是基於物品的相似度計算
都需要較多的時間和很多的計算力，通過SVD可以將映射到低緯空間中去

4.基於SVD的評估方法Python實現（參考自機器學習實戰）

def svdEst(dataMat, user, simMeas, item):
    n = shape(dataMat)[1]
    simTotal = 0.0; ratSimTotal = 0.0
    U,Sigma,VT = la.svd(dataMat)# numpy 的svd計算
    Sig4 = mat(eye(4)*Sigma[:4]) #numpy.eye() 生成對角矩陣
    # 機器學習實戰的P264中代碼對應的公式推導 https://blog.csdn.net/appleyuchi/article/details/82913217
    xformedItems = dataMat.T * U[:,:4] * Sig4.I

    for j in range(n):
        userRating = dataMat[user,j]
        if userRating == 0 or j==item: continue
        similarity = simMeas(xformedItems[item,:].T,\
                             xformedItems[j,:].T)
        print 'the %d and %d similarity is: %f' % (item, j, similarity)
        simTotal += similarity
        ratSimTotal += similarity * userRating
    if simTotal == 0: return 0
    else: return ratSimTotal/simTotal

其中計算按照奇異值能到達總能量的90% 計算；dataMat.T U[:,:4] Sig4.I 的推導請參見：推導

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

協同過濾推薦中利用SVD提高推薦的效果

xgboost原理

爲啥準確率不是個很好的評估標準？用作爲評估標準爲啥有侷限性

什麼是ROC曲線

爲什麼要對數值類型的特徵做歸一化，樹形算法爲啥不需要歸一化？

簡單的三層神經網絡

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結