from sklearn.datasets import load_boston # 從skelan的數據集中導入數據
首先從標準庫中導入數據集
dataset = load_boston() # 將數據集合中的數據賦值給dataset
x_data = dataset.data # 導入所有特徵變量,賦值給x
y_data = dataset.target # 導入目標值(房價),賦值給Y
name_data = dataset.feature_names # 導入特徵名
print(x_data)
print(y_data)
該數據集的數據結構是列表,然後將該數據集分爲特徵數據和目標數據x,y ,x數據的每一行表示一條數據的所有特徵
y數據集只有一行數據,每一個數據表示該數據的目標
from sklearn.model_selection import train_test_split # 導入訓練模塊庫函數
導入庫函數,進行數據的分割,將數據分割爲訓練數據和測試數據,分割比爲0.2
from sklearn.model_selection import train_test_split # 導入訓練模塊庫函數
# 隨機擦癢20%的數據構建測試樣本,剩餘作爲訓練樣本
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data, random_state=0,test_size=0.20)
從標準庫中導入訓練模型
from sklearn.linear_model import LinearRegression # 導入線性訓練模型
根據該訓練模型對所有的訓練數據進行訓練
lr=LinearRegression()
#使用訓練數據進行參數估計
lr.fit(X_train,y_train)
#迴歸預測
lr_y_predict=lr.predict(X_test) # 根據模型lr預測出的y的值
導入評估模型,對該模型的擬合程度進行評估
from sklearn.metrics import mean_squared_error
err = mean_squared_error(y_test, lr_y_predict)
print(err)