Logistic迴歸模型——Python

import collections
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt


# 1 創建數據集
Job_Dict = {
    '工作時間':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50],
    '是否升職':[0,0,0,0,0,0,1,0,1,0,1,0,1,0,1,1,1,1,1,1]
}
Job_OrderDict = collections.OrderedDict(Job_Dict)
Job_Df = pd.DataFrame(Job_OrderDict)
Job_Df.head()


# 2 準備數據

# 提取特徵和標籤
Job_X = Job_Df.loc[:,'工作時間']
Job_Y = Job_Df.loc[:,'是否升職']


# 3 分析數據

# 繪製散點圖
plt.scatter(Job_X,Job_Y,color='blue',label='job data')
# 添加圖標標籤
plt.xlabel('Hours')
plt.ylabel('Pass')


# 4 建立邏輯迴歸模型

from sklearn.model_selection import train_test_split    # train_test_split(),隨機劃分訓練集和測試集的函數

# (1)建立訓練數據和測試數據
x_train,x_test,y_train,y_test = train_test_split(Job_X,Job_Y,train_size=.8)
# 輸出數據的大小
print('原始數據特徵:',Job_X.shape,
      '訓練數據特徵:',x_train.shape,
      '測試數據特徵:',x_test.shape)
print('原始數據標籤:',Job_Y.shape,
      '訓練數據標籤:',x_train.shape,
      '測試數據標籤:
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章