第四範式
樹模型對於高維離散特徵效果不好
逐域網絡 Field-wise network
跨域網絡 Across field
補充:FM
融合網絡
逐域網絡數量多(1000個域有1000個DNN),但比較輕量
拼起來丟進去算,連續的做一次,離散的做一次
聚類:tSNE
域內相似度更搞,域與域距離更大
LR 線性組合
FM 兩兩內積
Attention 有選擇性地學習
用什麼沒有定論,需要大量實驗
把好的operator放進來,用不用當做超參數,用數據驅動的方式選擇operator。
上面的數據是千萬級的
下面的數據是百萬級的
堆疊了這麼多層會不會使效果更差?是的
採用逐層監督的方式
對於label而言,中間層也有區分度
借鑑了谷歌的網絡
針對每層設置不同的權重,下面的權重低一點,上面的權重高
隨着訓練decay下面的weight
實際預測刪除Aux Loss
前3個是公開數據集,後3個是他們客戶的數據
NFM傾向於做推薦系統,而不是CTR
把模型拿到客戶現成試了下
不用關心與模型相關的超參數,只用關係與計算資源相關的超參數
SH問題:給資源該怎麼分配
HP:把給資源的方式枚舉一遍
過於agressive
重要性採樣
HP是在內部對於,跨band對比
數據越大降低的代價越多
騰訊雲
spark跑在k8s上
每個worker手動裝Python依賴
把依賴打到鏡像,算法部署很便利
從spark2.2嘗試開始用k8s的方式
官方正式更新後用官方代碼
借用AutoKeras
衡量距離時用到了編輯距離