轉載:
https://www.ctolib.com/mJackie-RecSys.html
https://github.com/mJackie/RecSys
https://github.com/mJackie/RecNews
RoadMap
推薦系統
計算廣告
統計學習模型
技術文章
實踐工具
深度學習模型
技術文章
實踐代碼
相關比賽
CriteoDisplayAdvertisingChallenge
- Rank1: 借鑑了Facebook的方案: GBDT 特徵編碼 + FFM
- Rank3: Quadratic Feature Generation + FTRL 傳統特徵工程和 FTRL 線性模型的結合
AvazuClickThroughRatePrediction
- Rank1: Feature Engineering + FFM + Ensemble, 只基於 FFM 進行集成
- Rank2: Feature Engineering + GBDT 特徵編碼 + FFM + Blending
- Rank1: GBDT,用了嫁接技術處理樣本分佈不一致
- Rank2: GBDT單模型+大量特徵工程
- Rank3: https://github.com/DiligentPanda/Tencent_Ads_Algo_2018
- Rank6: https://github.com/nzc/tencent-contest
技術博客
經典論文清單
篩選文章的標準:前沿或者經典的,工程導向的,google、阿里、facebook等一線互聯網公司出品的:
Wide & Deep Learning for Recommender Systems
google 的 wide&deep,必看論文,經典到難以附加
DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction
華爲對wide&deep的改進,加了wide層的交叉項。如今工業界的主流模型
Practical lessons from predicting clicks on ads at facebook
facebook GBDT+LR的經典方案。雖然如今已不是主流方案,但論文中的思想很值得學習。
Deep Neural Networks for YouTube Recommendations
介紹了Youtube推薦系統工業界架構與方案,經典必看
Real-time Personalization using Embeddings for Search Ranking at Airbnb
KDD2018 best paper,Embedding 必看論文,非常經典
Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate
阿里的多目標學習經典方案,同時優化CTR & CVR
Real-time Personalization using Embeddings for Search Ranking at Airbnb
介紹了 airbnb 搜索排序模型的演進,工業性質很強,值得參考