機器學習 -基於sklearn波士頓房價預測

from sklearn.datasets import load_boston  # 從skelan的數據集中導入數據

首先從標準庫中導入數據集

dataset = load_boston()  # 將數據集合中的數據賦值給dataset
x_data = dataset.data  # 導入所有特徵變量,賦值給x
y_data = dataset.target  # 導入目標值(房價),賦值給Y
name_data = dataset.feature_names  # 導入特徵名
print(x_data)
print(y_data)

該數據集的數據結構是列表,然後將該數據集分爲特徵數據和目標數據x,y  ,x數據的每一行表示一條數據的所有特徵

y數據集只有一行數據,每一個數據表示該數據的目標

from sklearn.model_selection import train_test_split  # 導入訓練模塊庫函數

導入庫函數,進行數據的分割,將數據分割爲訓練數據和測試數據,分割比爲0.2

from sklearn.model_selection import train_test_split  # 導入訓練模塊庫函數



# 隨機擦癢20%的數據構建測試樣本,剩餘作爲訓練樣本
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data, random_state=0,test_size=0.20)

從標準庫中導入訓練模型

from sklearn.linear_model import LinearRegression  # 導入線性訓練模型

根據該訓練模型對所有的訓練數據進行訓練

lr=LinearRegression()

#使用訓練數據進行參數估計
lr.fit(X_train,y_train)
#迴歸預測
lr_y_predict=lr.predict(X_test)  # 根據模型lr預測出的y的值

導入評估模型,對該模型的擬合程度進行評估

from sklearn.metrics import mean_squared_error
err = mean_squared_error(y_test, lr_y_predict)
print(err)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章