細數數據挖掘的五個超讚免費開源軟件

Orange     
Orange 是一個基於組件的數據挖掘和機器學習軟件套裝它的功能即友好又很強大快速而又多功能的可視化編程前端以便瀏覽數據分析和可視化基綁定了Python以進行腳本開發。它包含了完整的一系列的組件以進行數據預處理並提供了數據帳目過渡建模模式評估和勘探的功能。其由C++和 Python開發它的圖形庫是由跨平臺的Qt框架開發。    
RapidMiner
RapidMiner,以前叫 YALE (Yet Another Learning Environment)其是一個給機器學習和數據挖掘和分析的試驗環境同時用於研究了真實世界數據挖掘。它提供的實驗由大量的算子組成而這些算子由詳細的XML 文件記錄並被RapidMiner圖形化的用戶接口表現出來。RapidMiner爲主要的機器學習過程提供了超過500算子並且其結合了學習方案和Weka學習環境的屬性評估器。它是一個獨立的工具可以用來做數據分析同樣也是一個數據挖掘引擎可以用來集成到你的產品中。   
Weka    
由Java開發的 Weka (Waikato Environment for Knowledge Analysis)是一個知名機器學機軟件其支持幾種經典的數據挖掘任務顯著的數據預處理集羣分類迴歸虛擬化以及功能選擇。其技術基於假設數據是以一種單個文件或關聯的在那裏每個數據點都被許多屬性標註。 Weka 使用Java的數據庫鏈接能力可以訪問SQL數據庫並可以處理一個數據庫的查詢結果。它主要的用戶接品是Explorer也同樣支持相同功能的命令行或是一種基於組件的知識流接口。   
JHepWork      
爲科學家工程師和學生所設計的 jHepWork 是一個免費的開源數據分析框架其主要是用開源庫來創建一個數據分析環境並提供了豐富的用戶接口以此來和那些收費的的軟件競爭。它主要是爲了科學計算用的二維和三維的製圖幷包含了用Java實現的數學科學庫隨機數和其它的數據挖掘算法。 jHepWork 是基於一個高級的編程語言 Jython當然Java代碼同樣可以用來調用 jHepWork 的數學和圖形庫。    
KNIME
KNIME (Konstanz Information Miner)是一個用戶友好智能的並有豐演的開源的數據集成數據處理數據分析和數據勘探平臺。它給了用戶有能力以可視化的方式創建數據流或數據通道可選擇性地運行一些或全部的分析步驟並以後面研究結果模型以及可交互的視圖。 KNIME 由Java寫成其基於 Eclipse 並通過插件的方式來提供更多的功能。通過以插件的文件用戶可以爲文件圖片和時間序列加入處理模塊並可以集成到其它各種各樣的開源項目中比如R語言Weka Chemistry Development Kit,和 LibSVM.  
發佈了19 篇原創文章 · 獲贊 8 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章