深度推薦系統與CTR預估2019年上半年值得精讀的論文

本文來自“深度推薦系統”專欄,這個系列將介紹在深度學習的強力驅動下,給推薦系統工業界所帶來的最前沿的變化。本文主要總結一下深度推薦系統與CTR預估2019年值得精讀的論文。

微博上近日流傳一個段子,“2020年曾是各大科幻片中遙遠的未來,但是現在離這個遙遠的未來也只有6個月時間了”。只是藉此感慨一下2019年轉瞬之間半年的時間已經過去了,目前深度學習火熱朝天,深度學習在推薦系統和CTR預估工業界的論文也是一篇接着一篇良莠不齊。

接下來主要總結一下2019年上半年工業界深度推薦系統與CTR預估上值得精讀的論文。個人整理難免遺漏,也歡迎各位同行朋友評論另外哪些想額外推薦精讀的論文。

1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google
作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;

論文Keynote

位列首位的當屬Youtube推薦強化學習的兩篇論文。雖然強化學習目前在推薦系統和CTR預估領域工業界由於系統複雜、效果未有顯著提升等衆所周知的原因確實不夠成熟也尚未大規模應用起來。但是Youtube推薦的這兩篇論文從某種程度上讓強化學習的應用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實驗效果顯示這個是YouTube單個項目近兩年來最大的reward增長,也從某種程度上會激發各大公司的研究者們繼續跟進的興趣。

這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應用在動作空間數以百萬計的Youtube在線推薦系統中。

2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google

作者:Eugene Ie, Vihan Jain, Jing Wang, …, Jim McFadden, Tushar Chandra, Craig Boutilier;

論文

這是Youtube推薦應用強化學習的第二彈,主要貢獻是提出了一種名爲SLATEQ的Q-Learning算法,優化推薦系統裏面同時展示給用戶多個item情況的長期收益LTV(Long-term Value),將長期收益加入排序多目標中進行建模優化。重點在於與baseline使用的深度網絡和輸入特徵都完全一樣。詳見:Youtube推薦已經上線RL了,強化學習在推薦廣告工業界大規模應用還遠嗎?

3. Deep Learning Recommendation Model for Personalization and Recommendation Systems
作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,…, Bill Jia, Liang Xiong, Misha Smelyanskiy;

論文代碼解讀

FaceBook推薦最新論文,通過建模與系統協同設計提出一種butterfly-shuffle的機制來提升模型並行化,離線訓練上在沒有任何超參調優下收斂速度與準確率優於DCN,並開源了代碼。

4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei

作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;

論文

華爲 at WWW 2019,提出基於卷積神經網絡的CTR特徵生成方法FGCNN,包含特徵生成和深度分類器兩部分,可以和任意CTR預估模型進行組合。

5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba

作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;

論文代碼

阿里 at KDD 2019,提出DSTN模型用於點擊率CTR預估,考慮更多空域與時域的輔助信息包括上下文展示過的ad以及歷史點擊/未點擊ad來更好地預測目標item的點擊率。從論文實驗數據看,效果大幅度超過DeepFM和GRU,並開源了代碼。

6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks

作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;

論文代碼

最新的深度CTR預估模型AutoInt,通過過Multi-head注意力機制將特徵投射到多個子空間中,並在不同的子空間中捕獲不同的特徵組合形式,效果超過xDeepFM等達到最好。

7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent

作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin

論文解讀

騰訊 at KDD2019,微信看一看團隊對傳統Look-alike進行了改造,提出實時Look-alike算法RALM,解決推薦系統多樣性問題,效果好於YoutubeDNN。

8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems

作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;

論文TDM論文

還記得阿里 at KDD 2018的深度樹匹配召回模型TDM嗎?升級版JTM提出索引與模型同時優化的方案,大幅提升召回效果。

9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent

作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu

論文解讀數據資源

騰訊 at KDD2019,構建了ConcepT概念挖掘標記系統,利用query搜索點擊日誌從用戶視角提取不同的概念,以提高對短文本(query)和長文章(document)的理解,從而推動推薦,搜索等業務的提升。實驗證明,ConcepT在 QQ 瀏覽器信息流業務中性能優異,曝光效率相對提升6.01%。

10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba

作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;

論文代碼

阿里 at IJCAI2019,考慮到不同用戶行爲序列的session內行爲同構與session之間行爲異構的特性提出了基於sesssion的CTR預估模型DSIN。使用self-attention機制抽取session內用戶興趣,使用Bi-LSTM針對用戶跨session興趣進行建模。

11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent

作者:Fuxing Hong, Dongbo Huang, Ge Chen;

論文代碼

騰訊 at AAAI2019,提出IFM通過特徵以及特徵組不同角度靈活學習特徵間交互的重要性,並提出了通用的Interation-NN框架和DeepIFM來捕捉高階交互,效果優於DeepFM並開源了代碼。

12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall

作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, …, Qiwei Chen, Wei Li, Dik Lun Lee

論文解讀

阿里天貓提出MIND模型通過Dynamic Routing的方法從用戶行爲和用戶屬性信息中動態學習出多個表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來提升召回的豐富度和準確度,效果好於YoutubeDNN。

13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba

作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;

論文

阿里 at KDD2019,通過系統設計解決用戶超長行爲歷史下CTR建模與在線預測性能瓶頸,效果好於GRU4Rec和DIEN。

14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft

作者:Mingxiao An,Fangzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie;

論文

微軟 at ACL 2019,LSTUR用於在新聞推薦任務中同時學習用戶長期和短期的興趣表示。模型的整體結構可分爲新聞編碼器、用戶長期興趣和短期興趣模型、以及候選新聞的個性化分數預測模型,效果好於GRU4Rec。

15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019

作者:Chen Ma, Peng Kang, Xue Liu;

論文代碼

KDD2019,HGN提出通過feature與instance gating的多層級結構結合BPR來更好的捕獲用戶的長短期興趣,效果好於GRU4Rec以及NextItRec。

16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba

作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou

論文解讀

阿里巴巴搜索推薦事業部的新研究,首次使用強大的 Transformer 模型捕獲用戶行爲序列的序列信號,供電子商務場景的推薦系統使用。原有DIN 提出使用注意力機制來捕獲候選項與用戶先前點擊商品之間的相似性,但未考慮用戶行爲序列背後的序列性質。離線實驗和在線 A/B 測試表明,BST 與現有方法相比有明顯優勢。目前 BST 已經部署在淘寶推薦的 rank 階段,每天爲數億消費者提供推薦服務[2]。

17. Operation-aware Neural Networks for User Response Prediction

作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;

論文代碼

深度CTR預估新積木:PNN + FFM - FM = ONN模型,效果好於DeepFM和PNN。

18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba

作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;

論文

Transformer引入推薦系統工業界,利用用戶歷史點擊序列預測下一個點擊item,效果超過GRU4Rec。

19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba

作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;

論文

阿里 at SIGIR2019,膠囊神經網絡應用於推薦提出CARP模型來從評論中更好地建模用戶對商品的喜好程度,效果好於最新的ANR等。

20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba

作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;

論文代碼

阿里 at IJCAI2019,提出DeepMCP模型通過匹配、關聯、預測三個子模塊更好地建模用戶-ad,ad之間以及特徵-CTR關係,效果優於DeepFM並開源了代碼。

本文授權轉載自知乎專欄“深度推薦系統”。原文鏈接:https://zhuanlan.zhihu.com/p/72597928

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章