CSDN-AutoML技術實踐與應用

原創

数学工具构造器

2020-07-06 19:49

文章目錄

第四範式

樹模型對於高維離散特徵效果不好

逐域網絡 Field-wise network
跨域網絡 Across field
補充：FM
融合網絡

逐域網絡數量多（1000個域有1000個DNN），但比較輕量

拼起來丟進去算，連續的做一次，離散的做一次

聚類：tSNE
域內相似度更搞，域與域距離更大

LR 線性組合
FM 兩兩內積
Attention 有選擇性地學習

用什麼沒有定論，需要大量實驗

把好的operator放進來，用不用當做超參數，用數據驅動的方式選擇operator。

上面的數據是千萬級的

下面的數據是百萬級的

堆疊了這麼多層會不會使效果更差？是的

採用逐層監督的方式

對於label而言，中間層也有區分度

借鑑了谷歌的網絡

針對每層設置不同的權重，下面的權重低一點，上面的權重高

隨着訓練decay下面的weight

實際預測刪除Aux Loss

前3個是公開數據集，後3個是他們客戶的數據

NFM傾向於做推薦系統，而不是CTR

把模型拿到客戶現成試了下

不用關心與模型相關的超參數，只用關係與計算資源相關的超參數

SH問題：給資源該怎麼分配

HP：把給資源的方式枚舉一遍

過於agressive

重要性採樣

HP是在內部對於，跨band對比

數據越大降低的代價越多

騰訊雲

spark跑在k8s上

每個worker手動裝Python依賴

把依賴打到鏡像，算法部署很便利

從spark2.2嘗試開始用k8s的方式

官方正式更新後用官方代碼

借用AutoKeras

衡量距離時用到了編輯距離

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

自研貝葉斯優化算法遇到的坑

自研貝葉斯優化算法，如何判斷算法能擬合？我目前是在一個tiny的數據集上跑一下，看算法能否收斂到正確的的局部最小值。這裏要有兩個關鍵詞：收斂。算法是需要收斂的。黑盒優化的本質就是增加在優勢樣本附近的採樣率。如果算法如同隨機搜索

数学工具构造器

2020-07-06 19:49:31

幾種測試用的黑盒函數

数学工具构造器

2020-06-29 17:48:10

RoBO源碼分析

GP-MCMC 專有采集函數的計算 robo.acquisition_functions.marginalization.MarginalizationGPMCMC#compute self.estimators Out[10]:

数学工具构造器

2020-06-29 17:48:10

DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks

DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks 論文鏈接：https://dl.acm.org/citation.c

2020-06-25 15:24:25

魔改smac記錄

dsmac/tae/execute_func.py:160 在這裏添加try catch，或者在evaluate中try catch dsmac/facade/smac_ac_facade.py:195 配置每個run的輸出文件

数学工具构造器

2020-06-25 09:27:33

dsmac中廢棄的mapreduce方案

import multiprocessing as mp from copy import deepcopy # import ray from frozendict import frozendict from joblib

数学工具构造器

2020-06-25 09:27:33

HpBandSter源碼分析

文章目錄BOHB與HyperBand算法HpBandSter的分佈式計算模型DispatcherWorkerMaster整體流程 BOHB與HyperBand算法 hpbandster.core.worker.Worker#com

数学工具构造器

2020-06-25 09:27:33

深入理解HpBandSter

文章目錄對HpBandSter現有代碼與數據結構的細緻分析ResultWarmStartIterationjson_result_logger 對HpBandSter現有代碼與數據結構的細緻分析 Result hpbandster

数学工具构造器

2020-06-25 09:27:33

整合HpBandSter:開發與覆盤

文章目錄開發進度面板異常邊界條件面板整合HpBandSter開發方案budget解釋與表達，覆盤HpBandSter對worker的job失敗的處理方式BOHB：bug與新feature，覆盤1. feature: 實現confi

数学工具构造器

2020-06-25 09:27:32

AutoML之NAS

前言 autoML最近非常火熱，在調參、特徵選擇等方面都有了不少的進展，與其同時，在深度網絡日益複雜化的今天，如何爲任務設計合適的網絡結構成了每位煉丹工程師的日常，而在缺乏先驗知識的情況下，調整網絡結構往往需要較長的時間和精力，如

2020-06-20 00:36:41

pmf-automl源碼分析

arxiv論文（有附錄，但是字小） Probabilistic Matrix Factorization for Automated Machine Learning NIPS2018論文（字大但是沒有附錄） Probabili

数学工具构造器

2020-06-12 17:29:10

ATM源碼分析

example/example.py from atm import ATM atm = ATM() results = atm.run(train_path="/home/tqc/PycharmProjects/automl

数学工具构造器

2020-06-08 01:52:34

PoSH-autosklearn源碼分析

数学工具构造器

2020-06-06 12:35:46

auto-sklearn實驗部分源碼閱讀

数学工具构造器

2020-06-06 12:35:46

sklearn DecisionTree 源碼分析

数学工具构造器

2020-06-06 12:35:46

24小時熱門文章

最新文章

最新評論文章