推薦系統的工作流程

原創

2019-08-16 14:38

在互聯網飛速發展的現代社會，人們每天都要受到成百上千條信息的轟炸，APP推送、新聞熱點、信息流廣告……一個有效的“信息過濾器”已經成爲了人們日常生活的剛需，也是信息供應商在激烈的市場環境中脫穎而出的必殺技。

推薦系統正扮演着這樣一個角色，它如同篩子一般，幫我們找到最想要的內容。但是，推薦系統過高的技術門檻和研發成本把很多企業擋在了門外。第四範式基於機器學習技術推出的智能推薦產品先薦，專注於內容行業的個性化推薦，憑藉自身的技術優勢有效解決着這一難題，已經服務了36氪、花瓣、果殼等知名媒體，不斷受到行業內的廣泛好評。

在接下來的文章中，先薦將系統地講解推薦系統的相關知識，希望各位技術愛好者能對推薦系統有更多、更多的瞭解。首先，我們將從推薦系統的工作流程講起。

1. 信息收集階段

這一階段會收集用戶的相關信息，用以生成預測任務的用戶畫像，這些信息包括用戶屬性、用戶行爲或用戶訪問的資源。只有用戶畫像完全建立後，推薦系統才能開始運行。推薦系統需要儘可能多地瞭解用戶，這樣的話從一開始就能爲用戶提供合理的推薦結果。

推薦系統依賴於不同類型的輸入，例如最直接的顯式反饋，即用戶直接輸入感興趣的內容，或隱式反饋，即通過觀察用戶行爲間接地推斷用戶偏好，還可以通過顯式和隱式反饋的組合來獲得混合反饋。

以網絡學習平臺爲例，用戶畫像是與特定用戶相關聯的個人信息的集合。這些信息包括該用戶的認知技能、智力水平、學習方式、興趣愛好以及交互行爲等。用戶畫像通常用於用戶模型構建時信息檢索所需。換句話說，用戶畫像粗略地反映了用戶模型。要想做成功一個推薦系統，很大程度上取決於其對用戶興趣的表徵能力。要想獲得準確的推薦結果，準確的用戶模型必不可少。

1.1 顯式反饋

網站一般會在用戶操作界面上提示用戶對內容做出評價，以便構建和改進該用戶的用戶模型。推薦結果的準確性取決於用戶提供的評級數量。用戶的評級數量越多，推薦結果越準確。顯式反饋的唯一缺點是，非常依賴用戶評級的積極性，而且，用戶不是時時刻刻願意做出評級。不過，相比之下，顯示反饋不涉及到從用戶行爲中獲取用戶偏好這一步，因此提供的數據更可靠，整個推薦過程也更透明，能夠更好地感知推薦系統的質量，從而提高用戶滿意度。

1.2 隱式反饋

網站後臺通過監測用戶的不同行爲，自動推測用戶的興趣偏好，例如購買歷史、導航歷史，在某些網頁上停留的時間、用戶點擊的鏈接、按鈕、以及電子郵件內容等。隱式反饋從用戶行爲中推斷用戶的偏好，減輕了用戶的評級負擔。隱式反饋對用戶評級的積極性要求不高，準確性也較低。

也有一些人認爲，用戶隱性反饋的數據實際上更客觀，在隱式反饋的情況下，用戶不需要以社會大衆期望的方式做出反應，也沒有任何維護自我形象的需求，因此提供的數據更真實。

1.3混合反饋

隱式和顯式反饋的優勢可以在混合系統中結合，以最大限度地降低二者的不足並實現性能最佳的推薦系統。具體來看，用隱式反饋的數據來校驗顯式反饋的數據，或僅允許用戶在表達明確興趣時給出顯式反饋。

2. 算法學習階段

在這一階段，系統會通過學習算法，過濾上一階段得到的用戶反饋，並提取用戶特徵。關於這一部分的詳細內容，我們會在後續的文章中介紹。

3. 預測/推薦階段

在這一階段，系統會預測用戶可能喜歡的內容類型。這一步可以直接基於在信息收集階段收集的數據集（基於存儲器或基於模型）來實現，也可以通過後臺監測到的用戶行爲來實現。

在下一篇文章中，我們將會詳細介紹推薦的過濾技術，敬請期待。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

推薦系統的工作流程

1. 信息收集階段

1.1 顯式反饋

1.2 隱式反饋

1.3混合反饋

2. 算法學習階段

3. 預測/推薦階段

愛奇藝個性化推薦排序實踐

人工智能領域的頂級學術會議大全（二）

人工智能領域的頂級學術期刊大全（一）

學習推薦系統必看的10篇RecSys論文，收藏！（官方推薦）

關於推薦系統，RecSys 2019大會都討論了什麼？（附論文下載）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結