特徵工程的含義
數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已
不管通過哪種方式獲取數據,總會有那麼一些數據無法直接投入生產使用中,這些不可直接使用的數據必須經過數據處理。
特徵工程可以通俗的理解爲把獲取的數據處理爲機器能夠讀懂的數據
更爲精確的將特徵工程指的是把原始數據轉變爲模型的訓練數據的過程從而提高對未知數據的模型預測的準確性
特徵工程的意義
只有把原始數據盡力處理到極致,從而提高基於此數據構建的模型的準確性,使得模型的預測能力不斷提高。
數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已
不管通過哪種方式獲取數據,總會有那麼一些數據無法直接投入生產使用中,這些不可直接使用的數據必須經過數據處理。
特徵工程可以通俗的理解爲把獲取的數據處理爲機器能夠讀懂的數據
更爲精確的將特徵工程指的是把原始數據轉變爲模型的訓練數據的過程從而提高對未知數據的模型預測的準確性
只有把原始數據盡力處理到極致,從而提高基於此數據構建的模型的準確性,使得模型的預測能力不斷提高。
01 綜述 Opal 是愛奇藝大數據團隊研發的機器學習平臺,包含特徵生產、樣本構建、模型訓練、模型部署在內的多環節 Bigdata + AI 開發服務,內置多種訓練鏡像、