Sklearn-pandas通用型的機(jī)器學(xué)習(xí)工具包
Sklearn-pandas既可以視為一個通用型的機(jī)器學(xué)習(xí)工具包,也可是視為一些特定算法的實(shí)現(xiàn)。它在具體的機(jī)器學(xué)習(xí)任務(wù)中主要充當(dāng)支持者的角色。
這里所謂支持者的角色,按照其官網(wǎng)的解釋即是說:Sklearn-pandas在Scikit-Learn和pandas之間提供了一個互通的橋梁(這一點(diǎn)從項目的名稱也能看出)。Scikit-Learn上文已經(jīng)提過,這里pandas是指一個開源的基于Python實(shí)現(xiàn)的數(shù)據(jù)分析工具。
具體的說,Sklearn-pandas的橋梁作用主要體現(xiàn)在以下兩個方面:
-
提供將DataFrame列映射到transformations的方法,這些列此后還可以重新組合成特征(features);
-
以pandas DataFrame為輸入,為scikit-learn舊版本的管道交叉驗證(cross-validate a pipeline)提供兼容性支持。
Sklearn-pandas的版本更新活躍,也是一個非常值得關(guān)注的開源項目。
評論
圖片
表情
