weka使用記錄

原創

2019-06-20 17:36

前言

最近做實驗需要用到weka這個工具，不是機器學習出生，懵懵懂懂啊。這個帖子不是系統地整理，只是簡單地記錄我對這個工具熟悉的每一步，甚至還沒有邏輯🙃🙃。

記錄

目前只用到explorer這個界面，裏面包含了分類器、聚類、特徵選擇等。

在Classifier部分，選擇了算法之後，還要選擇Test Options這部分。這部分的選項意思是：你要通過什麼樣的方式來測試你訓練出來的模型。

Using training set ，就是說使用你導入的所有的數據（導入是在preprocess界面導入的）來測試模型。這裏說一下，訓練模型是通過導入的所有數據訓練的，這裏選擇測試數據集就只是選擇測試集而已。如下圖所示：

顯示說是使用了full training set訓練得到的模型，模型訓練總共花了48.58秒。
1. Supplied test set是說額外導入一個測試集，在這個測試集上測試模型
2. cross validation，這個是我最疑惑的，網上查交叉驗證是什麼，都是直接說分成k份，1份做測試，剩下做訓練。但我還是不明白這個東西用在這裏是幹嘛。後來查着查着才知道，這裏說的交叉驗證是說（假定是10折），進行10次測試，將10次測試的準確率作爲模型最終的準確率。對，就是這麼簡單。然後十折交叉驗證可以用來調參，和GridSearchCV結合在一起（搜索關鍵詞十折交叉驗證調參）
3. percentage split是說將導入的數據集的一部分作爲測試集。

我好想讓它顯示出來最終的準確率啊，但是它就是不顯示？？在More Option的Evaluation Metrics裏設置你想要輸出的評估指數（但是它還是沒有輸出correct這些）
而且不明白爲什麼預測值會是？，這個問號是什麼含義😂😂

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

關於Chrome擴展的作用時間、範圍

記錄我要實現的功能是獲取當前頁面的html內容。最開始設置的情況是： "content_scripts": [ { "matches": ["<all_urls>"],

2020-07-05 13:42:34

奇特的一生柳比歇夫堅持56年的“時間統計法” - 讀後感

柳比歇夫的遺產【得到】創始人羅振宇羅胖承諾舉辦20年的跨年演講《時間的朋友》，很大部分是受這本書的啓發。以時間爲朋友，一分耕耘，一分收穫。2015年第一期《時間的朋友》，到2020年已經舉辦了5屆，越辦越好。柳比歇夫（18

程序员易筋

2020-07-04 08:40:58

Oracle PL/SQL 程序設計基礎

最近項目在做版本升級，涉及到原有功能的表結構修改，需要將舊數據轉移到新庫中，項目上定的方案是在舊數據庫中通過存儲過程生成新數據庫的INSERT語句。故對此塊內容做了複習整理。通過一個簡單的例子分析PL/SQL程序塊結構聲

不务正业的野猴子

2020-06-20 14:38:45

【轉】dom4j

目錄 1、DOM4J簡介... 1 2、XML文檔操作1. 2 2.1、讀取XML文檔：... 2 2.2、獲取根節點... 3 2.3、. 新增一個節點以及其下的子節點與數據... 3

不务正业的野猴子

2020-06-15 03:57:54

大神級技術資源

Coding Horror ，這是傑夫·阿特伍德（Jeff Atwood）於 2004 年創辦的博客，記錄其在軟件開發經歷中的所思所想、點點滴滴。時至今日，該博客每天都有近 10 萬人次的訪問量，讀者紛紛參與評論，各種觀點與智慧在

程序员易筋

2020-06-08 15:49:40

《了不起的我》自我發展的心理學 -- 陳海賢讀後感

說明《了不起的我》比較全面剖析了常見的心理問題，以及解決方法。一共有五大板塊：開啓行爲的改變推動思維的進化發展關係中的自我走出人生的瓶頸繪製人生的地圖下面筆者就挑選了印象深刻的兩個故事。阿德勒諮詢室的三面柱

程序员易筋

2020-06-06 21:20:47

算法導論高頻算法題數據結構與算法之美

說明業務開發工程師，你真的願意做一輩子 CRUD Boy嗎？基礎架構研發工程師，寫出達到開源水平的框架纔是你的目標！對編程還有追求？不想被行業淘汰？那就不要只會寫湊合能用的代碼！之前花了1年時間學完《算法導論》，實際上

程序员易筋

2020-06-06 21:20:47

大前端技術選型 Native原生iOS, Android, React-Native, Flutter, 微信小程序, HTML5

程序员易筋

2020-05-19 17:48:16

85歲麻省理工學院教授，給2020本科生教授《線性代數入門》

程序员易筋

2020-05-19 17:48:06

【前端框架】vue~路由(基礎)

不务正业的野猴子

2020-04-22 02:12:42

【前端框架】vue~條件判斷與遍歷

不务正业的野猴子

2020-04-12 04:32:22

[前端框架]vue~數據與方法

不务正业的野猴子

2020-04-12 04:32:22

加快提升編碼技能的關鍵祕密

程序员易筋

2020-03-14 09:45:11

成功8要素Unveiling the Secrets of success in 8 words – Richard St. John’s 4 minute TED talk

程序员易筋

2020-03-03 01:29:22

重裝系統遇到 windows無法安裝到這個磁盤 GPT分區就轉化爲MBR

2020-02-21 15:24:09

24小時熱門文章

最新文章

最新評論文章