沒有用戶數據時如何搭建推薦系統?用這三種辦法!

即使沒有用戶數據,我們仍能搭建高效的推薦系統,向用戶展示更多優質內容,讓用戶參與其中。沒有用戶數據時如何搭建推薦系統?用這三種辦法!

太長不看版:

第一步便是搭建基於內容的推薦系統,這種推薦系統會給用戶推薦其他類似的商品,但並不依賴其他用戶的數據。這些特徵(即數學表達式,推薦算法需藉助內容條目不同方面的表達式才能得以運算)來自於內容條目本身,並非用戶行爲。有了書面文本,我們便可以使用語義技術提取文本特徵。

以上述推薦系統爲基準模型,我們可以引入其他特徵,如提取自文本的元數據,儘可能地優化該系統。 雖然沒有明確的用戶標識,但利用用戶賬號代理仍能實現個性化推薦。 假設用戶每次訪問該系統時都瀏覽了多件商品,那麼可以根據該會話內的實時趨勢,搭建本地的基於會話的推薦系統。

正文版:

“在沒有用戶數據的情況下該如何搭建推薦系統呢?”我們曾多次遇到過該問題,今天我試着回答一下。

本文將向大家呈現關於推薦系統如何工作的一系列基礎知識,(在重要部分)會使用一些行業術語。當涉及到技術問題時,會跟大家說明具體的技術環境。

一般來說,在沒有用戶數據的情況下,有三種可行的辦法來搭建推薦系統。我把它們按照複雜程度在下邊列了出來,此外,假設大家此刻能利用手邊一切可利用的數據。這三種方法,每一種後者比前者能更好地利用唯一標識和用戶信息等用戶數據,但實際上,大家手頭並沒有這些數據。

搭建基於內容的推薦系統
首先,我們可以以某些標籤或其他內容元數據等爲特徵,搭建一個標準的基於內容的推薦系統。我們可以應用TF-IDF模型來評估算法,在該模型中,這些標籤代表了經預先計算好的詞典中的每一個單詞(該詞典僅僅指某種數據結構,是語篇中所有的單詞集合。)

具體來說,假設我們充分利用所有的標籤以及其他特徵來構建該詞典,那麼該詞典會幫助我們構建所謂的“特徵向量”。之後,我們以特徵向量爲基礎,對比不同的內容條目,搭建推薦系統。到了這一步,一個基於內容的推薦系統已初步完成,從我的研究經驗來看,該系統的推薦效果相當好。我們現在做的所有工作都是在向用戶推薦類似於歷史商品的商品。“類似”一詞這裏指,推薦的商品與歷史商品相比,有類似的標籤和特徵。

如果我們想搭建精度更高的推薦系統,要做的第一件事便是迭代上述初級推薦系統,並在此基礎上不斷優化。接下來我將介紹其他方法。

優化基於內容的推薦系統
上述步驟利用了包含現有標籤和其他特徵的單一詞典。提高推薦精度的下一步是構建兩個及兩個以上的詞典——對應元數據的不同類別,我們可以基於多個詞典,在推薦系統中採用TF-IDF統計方法,計算每一內容條目得分的加權組合。我們可以根據主觀評估的結果優化參數(如每一項得分的權重)。這取決於哪一項參數權重能帶來最好的推薦效果。

如果某一類元數據不能用TF-IDF進行加權統計,如這組數據不相關,那我推薦大家把這組數據細分成不同的種類。做了這樣的細分處理後,我們會獲得另一組標籤(細分後的每一類數據都有各自對應的標籤)。假設這個過程中未大量出現其他特徵,那並不會加大整個工作的難度。

接下來可以在系統中引入過濾技術,如加某個特定標籤,進一步優化推薦系統。它不是核心算法的一部分,但如果我們想在推薦系統中嵌入某種算法,從而實現用戶自定義推薦準則的操作,那麼過濾技術便是該算法的附加支撐結構。

搭建採用用戶代理的推薦系統
提高系統推薦精度的下一步是觀察能作爲用戶代理的那些數據特徵。雖然我們沒有用戶賬號,但可能有IP地址、瀏覽器信息、用戶會話等其他信息。

至此,我們可以構建抽象的用戶。這種用戶賬號無法驗證,但卻有了指紋技術的雛形。一旦我們能爲“抽象”的用戶命名,那麼便能爲該用戶生成個性化推薦,具體來說,就是利用多種協同過濾技術。在我看來這也不復雜——我們能找到很多開源項目(如高階Python包)。關鍵是我們可以藉助已有的代理信息來構建用戶賬號。

此外,我們還需要用戶的點擊交互數據。我們需要知道哪些商品已經被用戶點擊過,否則便沒有辦法順着用戶偏好做進一步優化。一旦有了用戶的點擊交互數據和抽象的用戶賬號,便能搭建由IP地址和瀏覽器信息組合而成的個性化推薦系統。這不是真正的個性化推薦,但離真正的個性化也不遠了。

搭建基於會話的推薦系統
最後的方法概述起來就是搭建基於會話的推薦系統。這與前邊提到的方法類似,但這次我們關注的是某個特定會話內的數據。即使我們無法獲取用戶信息,也有可能拿到用戶會話數據。有了用戶會話賬號,便能和高度本地化的“用戶賬號”對等起來。

基於會話的推薦系統衆多,其中一些基於循環神經網絡(RNN)搭建的推薦系統精度極高,如Hidasi 和Karatzoglou二人所做的研究。這些系統的推薦效果都令人相當滿意。

基於會話的推薦系統假定用戶準備在該系統上停留一段時間。 如果用戶確實這樣做了,並且點擊次數足夠多的話,那麼系統的推薦效果會更好,推薦的內容對用戶更有吸引力。

原文標題:What Are the Three Ways to Build a Recommender System When You Don’t Have AudienceData?

以上內容源自Quora, 由第四範式先薦編譯發佈。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章