python機器學習(2)訓練、交叉驗證、測試

本節給小夥伴們提供一個最簡單的例子,作爲入門使用

特別說明:本教程來源於何先生的教材,結合自己的思考以及Andrew的教程形成,其中數據使用已經得到許可,下面不再註明

第一步:把數據讀出來並且進行分組

import numpy as np
#將文本文件轉換爲numpy矩陣
with open(“prices.txt”,“r”) as file:
data = np.array([line.strip().split(",") for line in file],dtype=np.float32)
length =len(data)
#求出數據長度
n_train,n_cv = int(0.7length),int(0.15length)
#選出訓練集和交叉集
idx = np.random.permutation(length)
#隨機產生一個序列
train_idx,cv_idx = idx[:n_train],idx[n_train:n_train+n_cv]
test_idx = idx[n_train+n_cv:]
#把幾個集都給選好
train,test,cv = data[train_idx],data[test_idx],data[cv_idx]
#以上完成了把數據從txt文本讀出來並且完成分類的過程

  1. 說明,prices.txt文件應該和你創造的這個py文件在同一路徑下
  2. 有關numpy的知識會慢慢補充出來
  3. 這裏先寫下np.random.permutation的作用 [超鏈接準備]

第二步,開始進行預測

默認你已經裝好了scikit-learn 這個模塊

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章