2016年的論文:Item2vec: Neural Item Embedding for Collaborative Filtering
這篇文章比較樸素,創新性不高,基本是參照了google的word2vec方法,應用到推薦場景的i2i相似度計算中,但實際效果看還有有提升的。主要做法是把item視爲word,用戶的行爲序列視爲一個集合,item間的共現爲正樣本,並按照item的頻率分佈進行負樣本採樣,缺點是相似度的計算還只是利用到了item共現信息,1).忽略了user行爲序列信息; 2).沒有建模用戶對不同item的喜歡程度高低。
Skipgram + Negative Sampling:
是中心詞,是上下文詞,是負例樣本。極大化似然函數,後面轉成極小化負對數似然(和交叉熵損失函數一樣)
最後表示embedding可以有3種方式:1. 用;2.用;3.用concatenate:
同理,UserCF可以把item被訪問的用戶序列視爲一個集合,user間的共現爲正樣本;