關於推薦系統,RecSys 2019大會都討論了什麼?(附論文下載)

關鍵詞:推薦系統、深度學習、以用戶爲中心、可再現性和多任務處理

2019年的推薦系統大會(Recsys) 於今年的9月份在丹麥哥本哈根舉行,來自世界各地的909位專家、學者參與了此次會議,迄今爲止規模最大的一次。大會涵蓋了與推薦系統相關的主題,從推薦系統的社會影響到搭建推薦系統所用的算法。

今年,除了從算法和方法的角度來看待“推薦系統”這一領域外,我們還通過發現、解決推薦系統中存在的問題來進一步認識這一領域的發展。這次會議的參會人員中還出現了社會科學家的身影。這在提醒我們,推薦系統這種技術正在影響着我們的生活,影響着人們的信息互動、娛樂消費。有句話說得好,“能力越大,責任越大”。作爲技術人員,我們不僅要對用戶負責,還要對和我們一起共事的同事負責。接下來的章節我們會詳細地介紹這些問題,以及一些算法和應用程序。

社會影響

今年的大會特別強調了推薦系統的綜合性和社會影響。第一位主題演講人Mireille Hildebrandt談到了GDPR如何改變經營者的動機,即誰能決定廣告商或發佈者等人的處理目的和處理方式,讓其除了從盈利的角度出發進行優化外,還要考慮透明度和更好的方法。(注:GDPR,General Data Protection Regulation,即《通用數據保護條例》,2018年5月由歐盟出臺,目的在於遏制個人信息被濫用,保護個人隱私)

第二位主題演講者Eszter Hargittai談到了人們的在線行爲,不同平臺之間人們在線行爲的差異以及人們的在線行爲是如何導致算法出現偏差的。最後,小組討論瞭如何建立對社會負責的推薦系統的問題。

可重現性及改進

可重現性早已成爲當前困擾推薦系統領域的重要話題。但是,讓人人都可以使用某段代碼還不夠,還需要解決的一個基本問題是,如何進行試驗以及如何衡量改進辦法的好壞:基線有時調得不夠準,數據集和任務集的選擇有時也不夠嚴謹,測試改進措施有時也沒什麼意義。

A Worrying Analysis of Recent Neural Recommendation Approaches一文,比較了幾種較爲複雜的神經CF變體方法,並且重現了這幾種方法呈現的結果,還擊敗了其他調好的簡單基線。這篇文章被評爲“最佳論文”,這釋放出的信號是,我們還需要在該領域投入更多,需要更加努力。

多目標/多任務優化

推薦系統的使用通常涉及多個目標,爲了解決此問題,可以在多任務設置中表達問題。

優化

越來越多的推薦系統尋求針對多個目標進行優化的方法。例如,不僅要針對視頻的播放量進行優化,還要對視頻的點贊數和評論數也進行優化。爲此,系統將具有多個損失函數,每個目標一個。在某些必要時刻,我們需要把這些損失合併爲一個,因此,需要爲每個損失分配一個權重。例如,

視頻的瀏覽量與用戶對視頻留言評論相比,前者的重要性可能是後者的兩倍。當處理許多目標時,手動設置這些權重既不是最佳選擇,也可能很麻煩。獲得“最佳論文”提名的另一篇論文 A Pareto-Efficient Algorithm for Multiple Objective Optimization in E-Commerce Recommendation(《電商推薦中多目標優化的帕累託效率算法》,譯者注),介紹了一種自動計算權重的方法,從而達到犧牲某一目標來改變某一權重的狀態(帕累託效率狀態,在不犧牲其他目標的情況下無法改善單個目標)。爲了達到帕累託最佳效率,通常做法是這樣的:

•進化啓發法:無法保證帕累託效率

•標量化方法:將所有目標合併爲一個目標,即損失的加權總和。通常,標量權重由人工確定。

•在本文中,作者考慮了標量方法,並提出了兩步算法,在理論保證的情況下學習標量權重。更新權重的步驟等於解決具有約束的二次方問題。

架構

Google發表了兩篇論文,展示了用於視頻檢索和排名的多目標架構。其中一篇是: Recommending what video to watch next: a multitask ranking system。這篇文章建議使用複雜的框架處理複雜的互動,從而學習如何推薦視頻:

•多個目標:參與度、滿意度

•多種嵌入:圖像、文本

•使用專家模型的多門混合實現上述目標

在這裏插入圖片描述
之後推出的兩門課程仍圍繞這個主題展開,大家對此興趣盎然。

從隱式反饋中學習

推薦系統通常不直接衡量用戶滿意度,而是建立在隱式反饋信號(如點擊次數、觀看次數等)上。許多論文提出了更好地利用隱式反饋的方法。

Relaxed Softmax for PU Learning 提出了一種處理否定採樣的新方法,這是無標記學習中常見的步驟(從隱式反饋中學習與該任務密切相關),大多數方法都假設從固態分佈中採樣否定。本文提出了一種基於boltzmann分佈的新的負採樣方案,其中選擇的負採樣更接近算法的決策邊界,從而能夠提供更多信息。

Leveraging Post-click Feedback for Content Recommendations這篇文章解決了點擊後信息反饋的問題。他們關注具有點擊後信息(即是否收聽或跳過了歌曲)的現實世界中的音樂和視頻數據集,並在點對和成對模型上顯示了AUC的改進(分別爲18.3%和2.5%)。

作者提出了一個通用的概率框架,用於融合三組不相交的觀察結果:點擊完成、點擊然後跳過或不點擊。每種類型反饋的置信度都是通過高斯分佈的方差建模,然後執行最大似然估計。

在展示廣告中,特徵分佈可能是不固定的,預測點擊的模型需要定期更新。挑戰之一是無法立即獲得最新的用戶反饋。在 Addressing Delayed Feedback for Continuous Training with Neural Networks in CTR prediction一文中,作者解決了延遲反饋的問題。
在這裏插入圖片描述

在相關的工作中,使用的損耗是延遲的反饋損耗(假定使用單獨的模型來確定反饋延遲)和PU損耗(將偏置數據中的所有負樣本視爲未標記)。作者提出了兩種損失函數,這些函數可以帶來最佳的離線性能,並可以在特定模型上轉化爲在線收益:

•基於重要性抽樣的FN加權(FN weighted )。樣品首先被標記爲陰性,用戶參與後立即顯示肯定標籤。

•FN校準(FN calibration)損耗的校準版本

在反饋很明確的情況下(例如購買),即使沒有推薦,用戶也可能已經購買了該商品。提升(也稱爲增量)在此定義爲由推薦引起的用戶操作的增加。 Uplift-based Evaluation and Optimization of Recommenders一文提出了一種新的離線評估協議和基於提升的推薦的優化方法。

From Preference into Decision Making: Modeling User Interactions in Recommender Systems 一文引入了頁面級RNN,除了可以獨立考慮每個項目和操作外,還解決了頁面上多個項目相互影響、多個不同操作及不同種類的操作等問題。
在這裏插入圖片描述

基於內容的推薦

基於內容的方法對於解決冷啓動問題有很大幫助:某些項目的視圖很少,某些項目則是全新的。

CB2CF: A Neural Multiview Content-to-Collaborative Filtering Model for Completely Cold Item Recommendations 通過生成僅包含以下內容的CF嵌入來解決此問題:

•分類特徵

•連續特徵

•詞嵌入

然後,使用簡單的CNN將上述特徵映射到CF嵌入。結果表明,CB2CF不如CF,但優於單獨的CB,並解決了冷啓動問題。

在這裏插入圖片描述
HybridSVD: When Collaborative Information is Not Enough提出了一種方法,通過擴展傳統的基於SVD的方法,同時使用協同信息和基於內容的相似性來構建產品和用戶嵌入。關鍵思想是將用戶輔助矩陣或由內容構建的相似項參數化,得出雙線性形式,替換交互表中Gram矩陣中的標量乘積項。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章