Sklearn庫中Logistic Regression函數各個參數總結

 

Logistics Regression參數名稱

含義

 

函數調用形式

LogisticRegression(penalty='l2',dual=False,tol=1e-4,C=1.0,fit_intercept=True,intercept_scaling=1,class_weight=None,random_state=None,solver='liblinear',max_iter=100,multi_class='ovr',verbose=0,warm_start=False, n_jobs=1)

penalty

字符串型,’l1’ or ‘l2’,默認:’l2’;正則化類型。

dual

布爾型,默認:False。當樣本數>特徵數時,令dual=False;用於liblinear解決器中L2正則化。

tol

浮點型,默認:1e-4;迭代終止判斷的誤差範圍。

C

浮點型,默認:1.0;其值等於正則化強度的倒數,爲正的浮點數。數值越小表示正則化越強。

fit_intercept

布爾型,默認:True;指定是否應該向決策函數添加常量(即偏差或截距)。

intercept_scaling

浮點型,默認爲1;僅僅當solver是”liblinear”時有用。

class_weight

默認爲None;與“{class_label: weight}”形式中的類相關聯的權重。如果不給,則所有的類的權重都應該是1。

 

 

random_state

整型,默認None;當“solver”==“sag”或“liblinear”時使用。在變換數據時使用的僞隨機數生成器的種子。如果是整數, random_state爲隨機數生成器使用的種子;若爲RandomState實例,則random_state爲隨機數生成器;如果沒有,隨機數生成器就是' np.random '使用的RandomState實例。

 

 

 

solver

{'newton-cg', 'lbfgs', 'liblinear', 'sag', 'saga'},默認: 'liblinear';用於優化問題的算法。

對於小數據集來說,“liblinear”是個不錯的選擇,而“sag”和'saga'對於大型數據集會更快。

對於多類問題,只有'newton-cg', 'sag', 'saga'和'lbfgs'可以處理多項損失;“liblinear”僅限於“one-versus-rest”分類。

 

max_iter

最大迭代次數,整型,默認是100;

 

multi_class

字符串型,{ovr', 'multinomial'},默認:'ovr';如果選擇的選項是“ovr”,那麼一個二進制問題適合於每個標籤,否則損失最小化就是整個概率分佈的多項式損失。對liblinear solver無效。

verbose

整型,默認是0;對於liblinear和lbfgs solver,verbose可以設爲任意正數。

 

warm_start

布爾型,默認爲False;當設置爲True時,重用前一個調用的解決方案以適合初始化。否則,只擦除前一個解決方案。對liblinear解碼器無效。

 

n_jobs

整型,默認是1;如果multi_class='ovr' ,則爲在類上並行時使用的CPU核數。無論是否指定了multi_class,當將' solver ' '設置爲'liblinear'時,將忽略此參數。如果給定值爲-1,則使用所有核。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章