CSDN-AutoML技術實踐與應用

第四範式

樹模型對於高維離散特徵效果不好

在這裏插入圖片描述在這裏插入圖片描述逐域網絡 Field-wise network
跨域網絡 Across field
補充:FM
融合網絡

在這裏插入圖片描述
逐域網絡數量多(1000個域有1000個DNN),但比較輕量

拼起來丟進去算,連續的做一次,離散的做一次

在這裏插入圖片描述聚類:tSNE
域內相似度更搞,域與域距離更大

在這裏插入圖片描述LR 線性組合
FM 兩兩內積
Attention 有選擇性地學習

用什麼沒有定論,需要大量實驗

把好的operator放進來,用不用當做超參數,用數據驅動的方式選擇operator。

在這裏插入圖片描述
上面的數據是千萬級的

下面的數據是百萬級的

在這裏插入圖片描述堆疊了這麼多層會不會使效果更差?是的

採用逐層監督的方式

對於label而言,中間層也有區分度

借鑑了谷歌的網絡

針對每層設置不同的權重,下面的權重低一點,上面的權重高

隨着訓練decay下面的weight

實際預測刪除Aux Loss

在這裏插入圖片描述

在這裏插入圖片描述

前3個是公開數據集,後3個是他們客戶的數據

在這裏插入圖片描述
NFM傾向於做推薦系統,而不是CTR

在這裏插入圖片描述
把模型拿到客戶現成試了下

在這裏插入圖片描述

不用關心與模型相關的超參數,只用關係與計算資源相關的超參數

在這裏插入圖片描述

SH問題:給資源該怎麼分配

HP:把給資源的方式枚舉一遍

過於agressive

重要性採樣

HP是在內部對於,跨band對比

在這裏插入圖片描述

數據越大降低的代價越多

在這裏插入圖片描述

騰訊雲

在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

spark跑在k8s上

每個worker手動裝Python依賴

把依賴打到鏡像,算法部署很便利

從spark2.2嘗試開始用k8s的方式

官方正式更新後用官方代碼

在這裏插入圖片描述

借用AutoKeras

衡量距離時用到了編輯距離

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章