推薦系統的工作流程

在互聯網飛速發展的現代社會,人們每天都要受到成百上千條信息的轟炸,APP推送、新聞熱點、信息流廣告……一個有效的“信息過濾器”已經成爲了人們日常生活的剛需,也是信息供應商在激烈的市場環境中脫穎而出的必殺技。

推薦系統正扮演着這樣一個角色,它如同篩子一般,幫我們找到最想要的內容。但是,推薦系統過高的技術門檻和研發成本把很多企業擋在了門外。第四範式基於機器學習技術推出的智能推薦產品先薦,專注於內容行業的個性化推薦,憑藉自身的技術優勢有效解決着這一難題,已經服務了36氪、花瓣、果殼等知名媒體,不斷受到行業內的廣泛好評。

在接下來的文章中,先薦將系統地講解推薦系統的相關知識,希望各位技術愛好者能對推薦系統有更多、更多的瞭解。首先,我們將從推薦系統的工作流程講起。

1. 信息收集階段

這一階段會收集用戶的相關信息,用以生成預測任務的用戶畫像,這些信息包括用戶屬性、用戶行爲或用戶訪問的資源。只有用戶畫像完全建立後,推薦系統才能開始運行。推薦系統需要儘可能多地瞭解用戶,這樣的話從一開始就能爲用戶提供合理的推薦結果。

推薦系統依賴於不同類型的輸入,例如最直接的顯式反饋,即用戶直接輸入感興趣的內容,或隱式反饋,即通過觀察用戶行爲間接地推斷用戶偏好,還可以通過顯式和隱式反饋的組合來獲得混合反饋。

以網絡學習平臺爲例,用戶畫像是與特定用戶相關聯的個人信息的集合。這些信息包括該用戶的認知技能、智力水平、學習方式、興趣愛好以及交互行爲等。用戶畫像通常用於用戶模型構建時信息檢索所需。換句話說,用戶畫像粗略地反映了用戶模型。要想做成功一個推薦系統,很大程度上取決於其對用戶興趣的表徵能力。要想獲得準確的推薦結果,準確的用戶模型必不可少。

1.1 顯式反饋

網站一般會在用戶操作界面上提示用戶對內容做出評價,以便構建和改進該用戶的用戶模型。推薦結果的準確性取決於用戶提供的評級數量。用戶的評級數量越多,推薦結果越準確。顯式反饋的唯一缺點是,非常依賴用戶評級的積極性,而且,用戶不是時時刻刻願意做出評級。不過,相比之下,顯示反饋不涉及到從用戶行爲中獲取用戶偏好這一步,因此提供的數據更可靠,整個推薦過程也更透明,能夠更好地感知推薦系統的質量,從而提高用戶滿意度。

1.2 隱式反饋

網站後臺通過監測用戶的不同行爲,自動推測用戶的興趣偏好,例如購買歷史、導航歷史,在某些網頁上停留的時間、用戶點擊的鏈接、按鈕、以及電子郵件內容等。隱式反饋從用戶行爲中推斷用戶的偏好,減輕了用戶的評級負擔。隱式反饋對用戶評級的積極性要求不高,準確性也較低。

也有一些人認爲,用戶隱性反饋的數據實際上更客觀,在隱式反饋的情況下,用戶不需要以社會大衆期望的方式做出反應,也沒有任何維護自我形象的需求,因此提供的數據更真實。

1.3混合反饋

隱式和顯式反饋的優勢可以在混合系統中結合,以最大限度地降低二者的不足並實現性能最佳的推薦系統。具體來看,用隱式反饋的數據來校驗顯式反饋的數據,或僅允許用戶在表達明確興趣時給出顯式反饋。

2. 算法學習階段

在這一階段,系統會通過學習算法,過濾上一階段得到的用戶反饋,並提取用戶特徵。關於這一部分的詳細內容,我們會在後續的文章中介紹。

3. 預測/推薦階段

在這一階段,系統會預測用戶可能喜歡的內容類型。這一步可以直接基於在信息收集階段收集的數據集(基於存儲器或基於模型)來實現,也可以通過後臺監測到的用戶行爲來實現。
推薦系統的工作流程

在下一篇文章中,我們將會詳細介紹推薦的過濾技術,敬請期待。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章