原创 ATM源碼分析

example/example.py from atm import ATM atm = ATM() results = atm.run(train_path="/home/tqc/PycharmProjects/automl

原创 根據requirements.txt生成Makefile

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : qichun tang # @Contact : [email protected] from pathl

原创 PoSH-autosklearn源碼分析

論文:(2018ICML) https://ml.informatik.uni-freiburg.de/papers/18-AUTOML-AutoChallenge.pdf 代碼: http://ml.informatik.uni

原创 用阿里雲服務器配置postgresql

關於連接PostgreSQL時提示 FATAL: password authentication failed for user “連接用戶名” 的解決辦法【自己試驗通過】… pgadmin3 新建服務器出現錯誤 Peer aut

原创 auto-sklearn實驗部分源碼閱讀

scripts/2015_nips_paper/run/run_auto_sklearn.py 元學習的LeaveOneOut留一驗證 if use_metalearning is True: # path

原创 sklearn DecisionTree 源碼分析

sklearn.tree._classes.BaseDecisionTree#fit y至少爲1維(意思是可以處理multilabels數據) y = np.atleast_1d(y) if is_classifier(self

原创 通過源碼分析GBDT是怎麼實現early stopping的

GBDT文檔:Early stopping of Gradient Boosting 文章目錄源碼分析不同參數效果比較`validation_fraction=0.2`, `n_iter_no_change=5``validati

原创 用多進程重寫HpBandSter的Example3

原來的Example要求用戶用3個shell分別運行程序,並且運行順序還有要求,即 運行nameserver和master 依次運行worker(數量要保持一致) 下面案例實現了單次運行就能跑 """ Example 3 -

原创 HpBandSter代碼理解

hpbandster.core.worker.Worker#compute 是計算部分 kde_models字典的添加: hpbandster.optimizers.config_generators.bohb.BOHB#new_

原创 scikit-optimizer 源碼分析

文章目錄訓練前對樣本空間進行TransformInteger, Real隨機森林是怎樣預測標準差的採集函數的計算方法EIPILCB 訓練前對樣本空間進行Transform skopt.utils.cook_estimator 這個

原创 Dan Ryan: Efficient and Flexible Hyperparameter Optimization | PyData Miami 2019

https://www.youtube.com/watch?v=IqQT8se9ofQ 作者強調最後一點其實有paper在做 robust:作者希望不要有"hyper hyper param",即優化算法應該對超參不敏感 作者提到

原创 automl頂會歸檔

2018 ICML 2019 ICML

原创 懷疑hash值不對是多進程環境下造成的

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : qichun tang # @Contact : [email protected] import has

原创 Python在pickle或copy時不傳遞過大的data數據

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : qichun tang # @Contact : [email protected] from copy

原创 Titanic數據集:僅用名字列就取得0.8的正確率

文章目錄前言表格機器學習的4類特徵text 特徵組數據處理載入數據數據清洗分詞刪除低頻詞建模sklearnTF-IDFNMFTruncatedSVDgensimLDALSIRPHDP 前言 表格機器學習的4類特徵 最近在思考表格機