本節給小夥伴們提供一個最簡單的例子,作爲入門使用
特別說明:本教程來源於何先生的教材,結合自己的思考以及Andrew的教程形成,其中數據使用已經得到許可,下面不再註明
第一步:把數據讀出來並且進行分組
import numpy as np
#將文本文件轉換爲numpy矩陣
with open(“prices.txt”,“r”) as file:
data = np.array([line.strip().split(",") for line in file],dtype=np.float32)
length =len(data)
#求出數據長度
n_train,n_cv = int(0.7length),int(0.15length)
#選出訓練集和交叉集
idx = np.random.permutation(length)
#隨機產生一個序列
train_idx,cv_idx = idx[:n_train],idx[n_train:n_train+n_cv]
test_idx = idx[n_train+n_cv:]
#把幾個集都給選好
train,test,cv = data[train_idx],data[test_idx],data[cv_idx]
#以上完成了把數據從txt文本讀出來並且完成分類的過程
- 說明,prices.txt文件應該和你創造的這個py文件在同一路徑下
- 有關numpy的知識會慢慢補充出來
- 這裏先寫下np.random.permutation的作用 [超鏈接準備]
第二步,開始進行預測
默認你已經裝好了scikit-learn 這個模塊