推薦系統有效性——Digg

1. Digg的算法和Amazon不同,他不是給用戶推薦和他們的歷史行爲相關的物品,而是更加依賴於集體智能,給用戶推薦和他們興趣相似的用戶喜歡的文章。換句學術的話,Digg用的是UserCF算法,而不是ItemCF算法

2. Digg一開始是讓用戶提交他們喜歡的文章的鏈接,如果別的用戶喜歡這個文章,可以頂一下,不喜歡可以踩一下。而原先digg的首頁展示了被頂的最多的熱門文章。因此,在Digg的系統中,熱門度是文章很重要的屬性。UserCF的算法可以在提供個性化的同時保證熱門度,而很多基於Item的算法不能保證這一點,這也是Digg選擇UserCF的一個原因。

3. 系統在利用UserCF的同時,也考慮到了主題(Topic)的影響。Digg認爲,如果兩個人digg了很多同樣的體育文章,不代表他們的政治觀點也是一致的。因此,他們會計算不同topic中的用戶的興趣相似度。也就是說用戶在體育領域興趣相似,不會擴展到政治領域。當然,digg的topic都是很大的topic,所以並不會太多的影響推薦結果的多樣性。

4. 我們知道,UserCF在計算用戶的興趣相似度時,兩個用戶有相似的興趣是因爲他們共同看過同一篇文章,但如果這樣的話,一個用戶看過一篇熱門的文章,就會和很多用戶產生相似度。Digg注意到了這個問題,並儘量去除了這種影響。

 

文章摘自:http://www.resyschina.com/2011/09/recsys_effect_digg.html

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章