自動推薦-協同過濾的開源實現mahout

          自動推薦技術現在已經越來越成熟了。國內有淘寶,豆辨;國外有Amazon。但是這些自動推薦的算法的代碼都無法得知;Apache Mahout 是 一個較新的開源項目,提供機器學習領域的一些經典算法的高效實現,裏面的taste包就實現了自動推薦技術。自動推薦技術有基於內容本身的和基於協同過濾兩大部分。這裏主要說明基於協同過濾的開源實現。協同過濾這裏有基於用戶相似度(user-base)和基於作品相似度的(item-base)兩種方法。基於用戶相似度的推薦實現了例如“豆瓣猜你可能感性趣的書”這種功能,原理其實就是找出與你最相似的用戶,把你沒有看過的書但是其他用戶看過的書推薦給你。基於作品相似度推薦實現了例如豆瓣的“喜歡xxx此本書的人也喜歡...."的功能,實現原理其實就是統計一下看過此本書用戶同時也可看了哪些書,把看到那些書的量進行排序。
 

    基於用戶相似度的推薦類在mahout裏面是GenericUserBasedRecommender,基於作品相似度實現的推薦類GenericItemBasedRecommender;我們只需要新建以上類,然後調用recommend的函數就可以實現這麼複雜的推薦功能。如果想深入裏面的原理,也可以看源代碼和文檔。在這裏,真的很感謝開源社區。下面貼出實踐的鏈接,和本人收集的文檔。

基於 Apache Mahout 構建社會化推薦引擎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章