如何用上邏輯回歸讓數(shù)據(jù)分析顯得高大上?
今天我們將學習邏輯回歸(logistics regression),由于邏輯回歸是基于線性回歸的特殊變化,我將用最簡單通俗的語言來為大家介紹邏輯回歸模型及其應用。
邏輯回歸是解決二分類問題的監(jiān)督學習算法,用來估計某個類別的概率。其直接預測值是表示0-1區(qū)間概率的數(shù)據(jù),基于概率再劃定閾值進行分類,而求解概率的過程就是回歸的過程。
?
邏輯回歸應用于數(shù)據(jù)分析的場景主要有三種:
驅(qū)動力分析:某個事件發(fā)生與否受多個因素所影響,分析不同因素對事件發(fā)生驅(qū)動力的強弱(驅(qū)動力指相關性,不是因果性);
預測:預測事件發(fā)生的概率;
分類:適合做多種分類算法、因果分析等的基礎組件;
01
下圖是之前講到的線性回歸模型的數(shù)據(jù)分布,線性回歸是用一條線來擬合自變量和因變量之間的關系,我們可以看到其輸出結果y是連續(xù)的。例如我們想預測不同用戶特征對所使用產(chǎn)品的滿意分,可以采用線性回歸模型。但是如果我們想根據(jù)這些因素去判斷用戶的性別,或者是否推薦使用等,之前的線性回歸就不適用了,這時,我們就要用到邏輯回歸進行二分類了。但是分類模型輸出結果卻需要是離散的,如何把連續(xù)型的y轉(zhuǎn)化為取值范圍0-1的數(shù)值呢?


將自變量特征輸入 定義自變量的線性組合y,即針對自變量線性回歸 將線性回歸結果y映射到sigmoid函數(shù),生成一個0-1范圍取值的函數(shù)概率值 根據(jù)概率值,定義閾值(通常為0.5),判定分類結果的正負 
02





將邏輯回歸的cost函數(shù)簡化,即得出:

將邏輯回歸cost函數(shù)帶入目標函數(shù)通用形式,即可形成邏輯回歸最終的目標函數(shù):

03






? ??
評論
圖片
表情
