第1章 好的推薦系統
1.1 什麼是推薦系統
推薦系統,幫助信息消費者從大量信息中找到自己感興趣的信息,幫助消息生產者讓信息展現在對它感興趣的用戶面前
信息過載的解決方案:分類目錄、搜索引擎
分類目錄只能覆蓋少量的熱門網站
搜索引擎需要用戶主動提供準確的關鍵詞
推薦系統,幫助用戶快速發現有用信息,不需要用戶提供明確的需求,通過分析用戶的歷史行爲給用戶的興趣建模
搜索引擎滿足了用戶有明確目的時的主動查找需求,而推薦系統滿足了用戶沒有明確目的的時候發現感興趣的新內容
社會化推薦、基於內容的推薦、基於協同過濾的推薦
推薦算法的本質是通過一定的方式將用戶和物品聯繫起來,而不同的推薦系統利用了不同的方式
推薦系統就是自動聯繫用戶和物品的工具,可以在信息過載的環境中幫助用戶發現令他們感興趣的信息
1.2 個性化推薦系統的應用
個性化推薦系統,主要作用是通過分析大量用戶行爲日誌,給不同用戶提供不同的個性化頁面展示,來提高網站的點擊率和轉化率
電子商務、電影和視頻、音樂、社交網絡、閱讀、基於位置的服務、個性化郵件和廣告
推薦系統:前臺的展示頁面、後臺的日誌系統、推薦算法系統
1.2.1 電子商務
個性化推薦
基於物品的推薦算法,給用戶推薦那些和他們之前喜歡的物品相似的物品
基於好友的個性化推薦,給用戶推薦他們的好友喜歡的物品
相關推薦
a> 包含購買這個商品的用戶也經常購買的其他商品
b> 包含瀏覽過這個商品的用戶經常購買的其他商品
a和b兩種相關推薦列表的區別就是使用了不同用戶行爲計算物品的相關性
相關推薦的應用:打包銷售
1.2.8 個性化廣告
廣告定向投放
個性化廣告投放和狹義個性化推薦的區別是,個性化推薦着重於幫助用戶找到可能令他們感興趣的物品,而廣告推薦着重於幫助廣告找到可能對它們感興趣的用戶,即一個是以用戶爲核心,而另一個是以廣告爲核心
目前的個性化廣告投放技術主要分爲3種
(1)上下文廣告:通過分析用戶正在瀏覽的網頁內容,投放和網頁內容相關的廣告,代表系統是谷歌的Adsense
(2)搜索廣告:通過分析用戶在當前會話中的搜索記錄,判斷用戶的搜索目的,投放和用戶目的相關的廣告
(3)個性化展示廣告:網站的展示廣告(大的橫幅圖片),它們是根據用戶的興趣,對不同用戶投放不同的展示廣告
廣告商選擇特定標籤下的用戶羣,進行投放,如地區(山東省)、年齡(20-30歲)、性別(男性)、消費檔次(中檔、高檔)、投放類型(電子設備-Ipad)
1.3 推薦系統評測
完整的推薦系統一般存在3個參與方:用戶、物品提供者、提供推薦系統的網站
(1)用戶:推薦給用戶那些令他們感興趣的物品
(2)物品提供者:物品被推薦給對其感興趣的用戶
(3)提供推薦系統的網站:收集到高質量的用戶反饋,不斷完善推薦的質量,增加用戶和網站的交互,提高網站的收入
好的推薦系統不僅僅能夠準確預測用戶的行爲,而且能夠擴展用戶的視野,幫助用戶發現那些他們可能感興趣,但卻不那麼容易發現的物品,同時,推薦系統還可以幫助商家將那些埋沒的好商品介紹給可能會對它們感興趣的用戶
準確度、覆蓋度、新穎度、驚喜度、信任度、透明度
1.3.1 推薦系統實驗方法
1 離線實驗
2 用戶調查
3 在線實驗
1.3.2 評測指標
1 用戶滿意度
2 預測準確度
3 覆蓋率
4 多樣性
5 新穎性
6 驚喜度
7 信任度
8 實時性
9 健壯性
10 商業目標
1.3.3 評測維度
評測系統不僅需要考慮評測指標,還需要考慮評測維度,比如一個推薦算法,雖然整體性能不佳,但可能在某種情況下性能比較好,而增加評測維度的目的就是知道一個算法在什麼情況下性能最好
1 用戶維度:主要包括用戶的人口統計學信息、活躍度以及是不是新用戶等
2 物品維度:包括物品的屬性信息、流行度、平均分以及是不是新加入的物品等
3 時間維度:包括季節、是工作日還是週末,是白天還是晚上等
如果能夠在推薦系統評測報告中包含不同維度下的系統評測指標,就可以幫助我們更好的瞭解推薦系統性能,發現不同算法的優缺點
書籍:推薦系統實踐 / 項亮編著
熱愛數據結構、算法、技術的同學,隨時可以加QQ:1659763514