前言
最近做實驗需要用到weka
這個工具,不是機器學習出生,懵懵懂懂啊。這個帖子不是系統地整理,只是簡單地記錄我對這個工具熟悉的每一步,甚至還沒有邏輯🙃🙃。
記錄
目前只用到explorer
這個界面,裏面包含了分類器、聚類、特徵選擇等。
在Classifier
部分,選擇了算法之後,還要選擇Test Options
這部分。這部分的選項意思是:你要通過什麼樣的方式來測試你訓練出來的模型。
-
Using training set
,就是說使用你導入的所有的數據(導入是在preprocess
界面導入的)來測試模型。這裏說一下,訓練模型是通過導入的所有數據訓練的,這裏選擇測試數據集就只是選擇測試集而已。如下圖所示:
顯示說是使用了
full training set
訓練得到的模型,模型訓練總共花了48.58
秒。Supplied test set
是說額外導入一個測試集,在這個測試集上測試模型cross validation
,這個是我最疑惑的,網上查交叉驗證是什麼,都是直接說分成k
份,1份做測試,剩下做訓練。但我還是不明白這個東西用在這裏是幹嘛。後來查着查着才知道,這裏說的交叉驗證是說(假定是10折),進行10次測試,將10次測試的準確率作爲模型最終的準確率。對,就是這麼簡單。然後十折交叉驗證可以用來調參,和GridSearchCV
結合在一起(搜索關鍵詞十折交叉驗證調參)percentage split
是說將導入的數據集的一部分作爲測試集。
我好想讓它顯示出來最終的準確率啊,但是它就是不顯示??在More Option
的Evaluation Metrics
裏設置你想要輸出的評估指數(但是它還是沒有輸出correct
這些)
而且不明白爲什麼預測值會是?
,這個問號是什麼含義😂😂