非監督學習——特徵縮放

特徵縮放:

1、一種重縮放此類特徵的方法。

2、公式:{x}' = \frac{x - x_{min}}{x_{max} - x_{min}}, {x}'\in [0,1]

3、要思考的問題:如果 x_max 和 x_min 相同怎麼辦?例如,假設輸入特徵的列表是 [10, 10, 10]——分母將爲零。我們的建議是通常爲每個新特徵指定 0.5(0.0 和 1.0 中間),但這實際上由你自己決定。要點是,這個公式可能會有問題。

4、使用 RBF 核函數的 SVM和K-均值聚類機器學習算法會受到特徵縮放的影響

5、https://scikit-learn.org/stable/modules/preprocessing.html

>>> from sklearn import preprocessing
>>> import numpy as np
>>> X_train = np.array([[ 1., -1.,  2.],
...                     [ 2.,  0.,  0.],
...                     [ 0.,  1., -1.]])
...
>>> min_max_scaler = preprocessing.MinMaxScaler()
>>> X_train_minmax = min_max_scaler.fit_transform(X_train)
>>> X_train_minmax
array([[0.5       , 0.        , 1.        ],
       [1.        , 0.5       , 0.33333333],
       [0.        , 1.        , 0.        ]])

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章