weka使用記錄

前言

最近做實驗需要用到weka這個工具,不是機器學習出生,懵懵懂懂啊。這個帖子不是系統地整理,只是簡單地記錄我對這個工具熟悉的每一步,甚至還沒有邏輯🙃🙃。

記錄

目前只用到explorer這個界面,裏面包含了分類器、聚類、特徵選擇等。

Classifier部分,選擇了算法之後,還要選擇Test Options這部分。這部分的選項意思是:你要通過什麼樣的方式來測試你訓練出來的模型。

  1. Using training set ,就是說使用你導入的所有的數據(導入是在preprocess界面導入的)來測試模型。這裏說一下,訓練模型是通過導入的所有數據訓練的,這裏選擇測試數據集就只是選擇測試集而已。如下圖所示:
    在這裏插入圖片描述

    顯示說是使用了full training set訓練得到的模型,模型訓練總共花了48.58秒。

    1. Supplied test set是說額外導入一個測試集,在這個測試集上測試模型
    2. cross validation,這個是我最疑惑的,網上查交叉驗證是什麼,都是直接說分成k份,1份做測試,剩下做訓練。但我還是不明白這個東西用在這裏是幹嘛。後來查着查着才知道,這裏說的交叉驗證是說(假定是10折),進行10次測試,將10次測試的準確率作爲模型最終的準確率。對,就是這麼簡單。然後十折交叉驗證可以用來調參,和GridSearchCV結合在一起(搜索關鍵詞十折交叉驗證調參)
    3. percentage split是說將導入的數據集的一部分作爲測試集。

我好想讓它顯示出來最終的準確率啊,但是它就是不顯示??在More OptionEvaluation Metrics裏設置你想要輸出的評估指數(但是它還是沒有輸出correct這些)
而且不明白爲什麼預測值會是,這個問號是什麼含義😂😂
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章