【機器學習】兩行代碼即可應用 40 個機器學習模型
共 3013字,需瀏覽 7分鐘
·
2024-07-09 21:00
lazypredict 庫,我們可以用一行代碼在我們的數(shù)據集上實現(xiàn)許多 ML 模型,這樣我們就可以簡要了解哪些模型適合我們的數(shù)據集。
步驟1
使用以下方法安裝 lazypredict 庫:
pip install lazypredict
第2步
導入 pandas 來加載我們的數(shù)據集。
import pandas as pd
第3步
加載數(shù)據集。
df = pd.read_csv('Mal_Customers.csv')
第4步
打印數(shù)據集的前幾行
這里 Y 變量是支出分數(shù)列,而其余列是 X 變量。
現(xiàn)在,在確定了 X 和 Y 變量之后,我們將它們分成訓練和測試數(shù)據集。
# 導入 train_test_split,用于分割數(shù)據集
from sklearn.model_selection import train_test_split
# 定義 X 和 y 變量
X = df.loc[:, df.columns != 'Spending Score (1-100)']
y = df['Spending Score (1-100)'] # 對數(shù)據進行分區(qū)。
# 分割數(shù)據
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
第5步
我們導入之前安裝的lazypredict庫,lazypredict里面有兩個類,一個用于分類,一個用于回歸。
# 導入 lazypredict
導入 lazypredict
# 從 lazypredict 導入回歸類
from lazypredict.Supervised import LazyRegressor
# 從 lazypredict.Supervised 中導入分類類
from lazypredict.Supervised import LazyClassifier
導入后,我們將使用 LazyRegressor,因為我們正在處理回歸問題,如果你正在處理分類問題,則這兩種類型的問題都需要相同的步驟。
# 使用 LazyRegressor 定義模型
multiple_ML_model = lazyRegressor(verbose=0, ignore_warnings=True, predictions=True)
# 對模型進行擬合,同時預測每個模型的輸出結果
models, predictions = multiple_ML_model.fit(X_train, X_test, y_train, y_test)
這里,prediction = True 表示你想要獲得每個模型的準確性并想要每個模型的預測值。
模型的變量包含每個模型精度以及一些其他重要信息。
它在我的回歸問題上實現(xiàn)了42 個 ML 模型,因為本指南更側重于如何測試許多模型,而不是提高其準確性。所以我對每個模型的準確性不感興趣。
查看每個模型的預測。
你可以利用這些預測來創(chuàng)建一個混淆矩陣。
如果正在處理分類問題,這就是使用 lazypredict 庫的方法。
# 使用 LazyRegressor 定義模型
multiple_ML_model = lazyClassifier(verbose=0,
ignore_warnings=True,
predictions=True)
# 對模型進行擬合,并預測每個模型的輸出結果
models, predictions = multiple_ML_model.fit(
X_train, X_test, y_train, y_test)
要記住的要點:
-
這個庫僅用于測試目的,為提供有關哪種模型在您的數(shù)據集上表現(xiàn)良好的信息。 -
建議使用conda單獨建立一個虛擬環(huán)境,因為它提供了一個單獨的環(huán)境,避免與其他環(huán)境有版本沖突。
聲明:部分內容來源于網絡,僅供讀者學習、交流之目的。文章版權歸原作者所有。如有不妥,請聯(lián)系刪除。
評論
圖片
表情
