推薦系統雜說

推薦方法

  • 基於規則的推薦
  • 基於傳統機器學習的推薦
  • 基於深度學習的推薦

推薦模型

  • 規則模型:規則定義,簡單的算術公式
  • 機器學習模型訓練:數據訓練後的算術公式
  • 機器學習模型預測:待預測數據經過訓練模型算術公式後的結果

模型評價指標

  • 離線指標:查全率,查準率,auc等
    • 離線指標是在線指標的一個准入標準
  • 在線指標:點擊率,交易轉換率等
  • A/B測試

系統模型圖

在這裏插入圖片描述

核心

召回

個性化召回算法ALS(粗排)
  • 最小二乘法
  • 利用矩陣分解的結果無限逼近現有數據,得到隱含特徵
  • 利用隱含特徵預測其餘結果

舉例

  1. 用戶行爲數據
    在這裏插入圖片描述
  2. 用戶特徵
    在這裏插入圖片描述
  3. 產品特徵
    在這裏插入圖片描述
  4. 公式
    在這裏插入圖片描述

說明

  • 將user矩陣和product矩陣的轉置相乘
  • 獲取無限逼近真於實數據的分數
  • 同時預測其餘節點的分數,排序後輸出

排序

個性化排序算法LR(精排)
  • 邏輯迴歸
  • Y = ax1+b2+c3+d4+…
  • 計算擬合公式

圖解
在這裏插入圖片描述

特徵處理
  • 連續特徵:壓縮數據到0-1
    • z-score標準化(x-mean)/std ,mean平均值 std標準差
    • max-min標準化(x-min)/(max-min )
  • 離散特徵:one-hot編碼
  • 連續特徵離散化:bucket編碼,可以按區間分檔,每檔一個[0,1]特徵
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章