推薦排序神經網絡輸入embedding的預訓練----Item2Vec(ItemCF,UserCF)

2016年的論文:Item2vec: Neural Item Embedding for Collaborative Filtering

這篇文章比較樸素,創新性不高,基本是參照了google的word2vec方法,應用到推薦場景的i2i相似度計算中,但實際效果看還有有提升的。主要做法是把item視爲word,用戶的行爲序列視爲一個集合,item間的共現爲正樣本,並按照item的頻率分佈進行負樣本採樣,缺點是相似度的計算還只是利用到了item共現信息,1).忽略了user行爲序列信息; 2).沒有建模用戶對不同item的喜歡程度高低。

Skipgram + Negative Sampling:

u_{i}是中心詞,v_{j}是上下文詞,v_{k}是負例樣本。極大化似然函數,後面轉成極小化負對數似然(和交叉熵損失函數一樣)

最後表示embedding可以有3種方式:1. 用u_{i};2.用u_{i}+v_{i};3.用concatenate: [u_{i},v_{i}]

 

同理,UserCF可以把item被訪問的用戶序列視爲一個集合,user間的共現爲正樣本;

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章