《User Diverse Preference Modeling by Multimodal Attentive Metric Learning》論文閱讀

前言

在該論文中,作者提出了MAML模型,是一種基於多模態信息的度量學習方法,通過該方法學習用戶對於不同物品所具有的不同的偏好特徵。


一、Related Work

首先,論文介紹了相關的工作,主要分爲三個部分:1. 用戶偏好建模;2. 度量學習;3. 多模態。

1. Diverse preference modeling

在第一部分中,作者將前人的相關工作劃分爲兩組:

  1. 第一組是利用評論信息來分析每個用戶對於目標物品的不同方面的注意力,並在獲得注意力權重向量後將其集成於基於矩陣分解的推薦方法中。相關的模型有:ALFM,AFM,ANCF。
  2. 第二組,對於一個目標商品,利用最具影響力的物品/用戶(基於目標商品選取)對當前物品/用戶的向量做出適應性調整。相關的模型有CMN,MARS,DIN。
2. Metric-based learning

在度量學習中,本文着重提到的模型爲CML模型,該模型是通過歐式距離進行度量,最小化用戶,物品之間的的距離(用戶與物品是正向交互的)來學習各個用戶、物品的向量。該模型取得很好的效果,在此基礎上,作者提出的MAML模型針對CML模型中的一個問題(因爲每個用戶都具有很多的交互商品,每個商品都和很多用戶具有交互,所以CML會傾向將所有向量映射到同一個點),提出了一個改進,在每一個用戶物品對中加入一個權重向量(用於表示用戶對於不同物品的偏好方向),進而也解決了CML中可能映射到同一個點的問題,因爲權重向量會把用戶向量,物品向量投影到另一個空間。

3. Multimodal user preference modeling

主要介紹的模型都是採用了多模態的數據,例如評論信息和物品的圖片信息。


二、Proposed Model

在這裏插入圖片描述
在MAML模型中,主要的思路與CML類似,也是距離來度量學習結果,通過最小化加權的用戶物品距離:如下圖: 在這裏插入圖片描述

其中a ui爲權重向量,p爲用戶向量,q爲物品向量
這個d(u,i)就是新的度量距離,基於新的距離標準,第一個損失函數爲:
在這裏插入圖片描述

w ui爲一個懲罰係數(後面會提到),m爲safety margin(人爲設置)
其中i爲u喜歡的物品,k爲u不喜歡的物品
之後作者解釋了權重向量的訓練,模型中採用了兩層的神經網絡進行學習,公式如下:
在這裏插入圖片描述

其中F tv,i是評論+圖像的融合向量,v是一個投影向量
得到的權重向量需要是用softmax進行歸一化,但如果直接歸一化後直接使用權重向量會得到很差的結果,是因爲權重向量的每一維度的值都很小,而且用戶向量和物品向量都做了正則化限制在一個單位球面中。這樣的情況下,兩個很小的值相乘會更小導致每一個維度的值偏差都不大,從而無法很好地學習用戶的不同偏好特徵。所以作者對權重向量的歸一化進行了修改:
在這裏插入圖片描述

a爲人爲設置的值,f爲權重向量的維數
通過a將權重向量的值進行了放大

再下一部分,作者介紹了物品特徵的計算。對於每一個物品都使用了評論信息和物品圖片信息。評論信息的特徵通過PV-DM模型進行提取,圖像特徵通過Caffe reference model進行提取。

在這裏插入圖片描述
Ft,i Fv,i分別爲文本特徵向量和圖像特徵向量
最後的ZL爲融合的向量
Ranking Loss Weight(這部分沒有看太明白,好像是根據採樣排序對學習的結果進行懲罰)

在這裏插入圖片描述
rankd代表物品i在用戶u的rank列表中的位置
在WARP模型中,可以看到rank_d(u,i)的計算過程。

接下來就是正則化:一共列出兩個正則化項,分別爲:
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

第一個正則化項的想法是,在提取物品的多模態特徵向量後,物品的表示應該和多模態向量表示相近(物品貼合自己的圖像特徵,評論特徵,這很真實)。

第二個正則化項是協方差正則化,防止在特徵空間中每一個維度具有冗餘信息。

最終得到的目標函數如下所示:
在這裏插入圖片描述


三、個人感悟

感覺MAML主要是針對CML的一個改進,通過添加權重參數表示用戶的不同偏好,加入多模態信息更好的表示物品特徵。最後的結果對比中,MAML的結果普遍優於CML,但感覺沒有預想的多,可能還可以進行一些改進。其中WARP模型部分還沒有搞清楚,還需要再看相關論文。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章