推薦系統:基於內容的過濾及其利弊

在上一篇文章中,我們介紹了推薦系統的主要工作流程。在接下來的文章中,我們會詳細分析推薦系統中的過濾技術。

推薦系統中不同的過濾技術

推薦系統要想爲用戶提供切實有用的推薦服務,高效、準確的推薦技術至關重要,也就是說,理解不同推薦過濾技術的特徵和潛力至關重要。

下圖顯示了推薦系統中不同的過濾技術:


基於內容的過濾技術(Content-based filtering)

基於內容的過濾技術(CBF)是一種依賴於域的算法,在生成預測時,它更多地強調對項目屬性的分析。當被推薦的對象是網頁、出版物和新聞等文本型項目時,這種過濾技術是最成功的。

基於內容的過濾技術推薦時要依賴用戶畫像,而用戶畫像是從用戶評估過的項目中獲取,與用戶的積極評價最相關的項目會被推薦給用戶。

爲了生成有意義的推薦結果,CBF會使用不同的模型來查找文本項目之間的相似性。它可以使用向量空間模型( Vector Space Model),如關鍵詞權重計算法(TF / IDF,Term Frequency Inverse Document Frequency),或概率模型,如樸素貝葉斯分類器、決策樹、或神經網絡,在語料庫中模擬不同文本項目之間的關係。之後,通過統計分析或機器學習技術來學習基礎模型,從而生成推薦結果。

基於內容的過濾技術不需要參照其他用戶畫像,因爲其他用戶畫像不會影響推薦的最終結果。而且,如果用戶畫像發生變化,CBF技術仍有可能在很短的時間內調整推薦結果。該技術的主要不足是需要系統對項目內容的特徵有足夠深入的瞭解。

基於內容的過濾技術的利弊

基於內容的過濾克服了協同過濾遇到的問題——即使沒有用戶提供評級,基於內容的過濾也可以向用戶推薦新商品。因此,即使數據庫中不包含用戶興趣愛好,也不會影響推薦結果的準確性。

而且,如果用戶興趣愛好發生變化,基於內容的過濾可以在短時間內調整其推薦結果。用戶可以在不共享其個人信息的情況下獲得推薦結果,這一點大大確保了個人隱私的安全性。

此外, CBF技術還可以提供關於如何向用戶生成推薦的解釋。

然而,基於內容的過濾技術取決於項目的元數據。也就是說,在向用戶推薦之前,系統需要豐富的項目內容描述和完整的用戶畫像,即“有限內容分析”。因此,CBF的有效性取決於描述性數據的可用性。

而內容過度專業是CBF技術面臨的另一個嚴重問題。用戶只能獲得與其自身畫像中的項目類似的推薦結果。

以上就是我們對基於內容的過濾技術的介紹,下一篇文章我們將關注協同過濾技術,歡迎閱讀!

閱讀更多:

推薦系統的工作流程

白話推薦系統

推薦系統相關術語知多少

入門推薦系統,你不應該錯過的知識清單

推薦系統簡論

薦是一款賦能媒體的AI產品,是集內容上傳、內容管理、內容分發、推薦干預、前端渲染於一體的一站式推薦服務可視化平臺,支持PC、WAP、APP全平臺接入,幫助媒體從0到1搭建推薦系統,顯著提升用戶活躍、留存、觀看時長等重要業務指標,在減少技術成本投入的同時,大幅提高媒體運營效率,從而實現業務智能化轉型。目前已服務人民日報、環球網、花瓣網、果殼網、段友、36氪、簡書等三百餘家內容平臺,其中在環球網web端的興趣推薦項目上,實現了點擊率58%的提升,同時訪問量和營收分別增長了69%、20%。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章