推薦方法
- 基於規則的推薦
- 基於傳統機器學習的推薦
- 基於深度學習的推薦
推薦模型
- 規則模型:規則定義,簡單的算術公式
- 機器學習模型訓練:數據訓練後的算術公式
- 機器學習模型預測:待預測數據經過訓練模型算術公式後的結果
模型評價指標
- 離線指標:查全率,查準率,auc等
- 離線指標是在線指標的一個准入標準
- 在線指標:點擊率,交易轉換率等
- A/B測試
系統模型圖
核心
召回
個性化召回算法ALS(粗排)
- 最小二乘法
- 利用矩陣分解的結果無限逼近現有數據,得到隱含特徵
- 利用隱含特徵預測其餘結果
舉例
- 用戶行爲數據
- 用戶特徵
- 產品特徵
- 公式
說明
- 將user矩陣和product矩陣的轉置相乘
- 獲取無限逼近真於實數據的分數
- 同時預測其餘節點的分數,排序後輸出
排序
個性化排序算法LR(精排)
- 邏輯迴歸
- Y = ax1+b2+c3+d4+…
- 計算擬合公式
圖解
特徵處理
- 連續特徵:壓縮數據到0-1
- z-score標準化(x-mean)/std ,mean平均值 std標準差
- max-min標準化(x-min)/(max-min )
- 離散特徵:one-hot編碼
- 連續特徵離散化:bucket編碼,可以按區間分檔,每檔一個[0,1]特徵