KEEL數(shù)據(jù)挖掘工具
KEEL,Knowledge Extraction based on Evolutionary Learning的簡稱,是一款開源的數(shù)據(jù)挖掘軟件工具,也是與WEKA一樣出名的分析和實驗環(huán)境,它提供了簡潔的GUI,用于執(zhí)行包括回歸、分類、聚類、監(jiān)督學習等多種數(shù)據(jù)挖掘任務。KEEL由JAVA語言編寫,包含了多種進化算法以及預處理技術(shù)與進化學習的整合,這使得它能夠?qū)θ魏螌W習模型進行完整的分析。
KEEL是knowledge extraction based on evolutionary learning的簡稱,它是一款開源的JAVA軟件工具,遵循GNU的GPLv3許可,受西班牙項目(TIN-2005-08386-C05-(01, 02, 03, 04 and 05))的支持 [3] 。
KEEL能夠用于大量不同的知識發(fā)現(xiàn)任務,它提供了一個簡單的基于數(shù)據(jù)流的GUI,可以根據(jù)不同的數(shù)據(jù)集和計算智能算法(特別是進化算法)設(shè)計實驗、評估算法。它包含了各種各樣經(jīng)典的知識提取算法、預處理技術(shù)(如訓練集選擇、特征選擇、離散化、缺失值處理等)、計算智能的學習算法、混合模型、對比實驗的統(tǒng)計方法等等,它允許對各種算法進行完整的分析、比較。
主要特征
突出了進化算法在模型預測、預處理(特征選擇、訓練集選擇)、后期處理(模糊規(guī)則的進化調(diào)優(yōu))中的作用
實現(xiàn)了許多專業(yè)文獻中的數(shù)據(jù)挖掘算法,如離散化、噪聲濾波等
提供了一個統(tǒng)計庫來分析算法結(jié)果,庫中包含了一組統(tǒng)計測試,用于分析結(jié)果的正態(tài)性、異態(tài)性,比較含參和非參算法的結(jié)果
許多算法是基于JAVA類庫進行開發(fā)的
提供了一個用戶友好的界面,并且此界面是面向算法分析的
該工具的目標是設(shè)計包含多種數(shù)據(jù)集和多種算法的實驗,并且實驗會產(chǎn)生獨立的腳本,能夠在不同的機器上運行。
同時提供線下實驗和線下實驗,線上實驗的設(shè)計目的是幫助學習者學習算法的操作。
包含知識提取算法庫,其中整合了多種進化學習算法,也包含經(jīng)典的學習算法
