一元線性迴歸模型——Python

演示建模過程:

import collections  # collections 是python內建的一個集合模塊
import pandas as pd
import matplotlib.pyplot as plt


# 1 創建數據集
JobDict = {
    '工作時間':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50],
    '業績':[10,22,13,43,20,22,33,50,62,48,55,75,62,73,81,76,64,82,90,93]
}

Job_orderDict = collections.OrderedDict(JobDict)  # ordereddict:有序字典
Job_Df = pd.DataFrame(Job_orderDict)
Job_Df.head()


# 2 準備數據
# 提取特徵和標籤
Job_X = Job_Df.loc[:,'工作時間']        # loc是根據index來索引
Job_Y = Job_Df.loc[:,'業績']


# 3 分析數據
# 繪製散點圖
plt.scatter(Job_X,Job_Y,color='b')
plt.xlabel('Hours')
plt.ylabel('Scores')


# 4 構建訓練模型

from sklearn.model_selection import train_test_split            # train_test_split(),隨機劃分訓練集和測試集的函數

# (1)建立訓練數據和測試數據
x_train,x_test,y_train,y_test = train_test_split(Job_X,Job_Y,train_size=.8)         
# 輸出數據的大小
print('原始數據特徵',Job_X.shape,
      ',訓練數據特徵',x_train.shape,
      ',測試數據特徵',y_train.shape) 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章