【數(shù)據(jù)競(jìng)賽】kaggle競(jìng)賽寶典-多分類(lèi)相關(guān)指標(biāo)優(yōu)化?
賽題理解,分析,規(guī)劃之多分類(lèi)相關(guān)指標(biāo)優(yōu)化
這是一個(gè)系列篇,后續(xù)我們會(huì)按照我們第一章中的框架進(jìn)行更新,因?yàn)榇蠹移綍r(shí)都較忙,不會(huì)定期更新,如有興趣歡迎長(zhǎng)期關(guān)注我們的公眾號(hào),如有任何建議可以在評(píng)論區(qū)留言。
1. kaggle競(jìng)賽寶典-競(jìng)賽框架篇!
2.1 賽題理解,分析,規(guī)劃之賽題理解與分析上半篇!
2.2 kaggle競(jìng)賽寶典-回歸相關(guān)指標(biāo)優(yōu)化!
2.3 kaggle競(jìng)賽寶典-二分類(lèi)相關(guān)指標(biāo)優(yōu)化
4.1 kaggle競(jìng)賽寶典-樣本篩選篇!
4.2 kaggle競(jìng)賽寶典-樣本組織篇!
1. categorization accuracy
1.1 定義
其中,為測(cè)試樣本的個(gè)數(shù),為第個(gè)樣本的標(biāo)簽,為預(yù)測(cè)的第個(gè)樣本的類(lèi)別。
1.2 案例
What's Cooking? Anomaly Detection Challenges 2015 - Challenge 2 Ghouls, Goblins, and Ghosts... Boo! Cdiscount’s Image Classification Challenge Sentiment Analysis on Movie Reviews
1.3 求解
使用multiclass第對(duì)應(yīng)的損失函數(shù),
表示第個(gè)樣本標(biāo)簽為的情況,如果標(biāo)簽為則是1,反之為0。則是模型預(yù)測(cè)樣本屬于第的概率。
2. MultiLogloss
2.1 定義
其中,為測(cè)試樣本的個(gè)數(shù),為類(lèi)標(biāo)簽的個(gè)數(shù)。
2.2 案例
San Francisco Crime Classification Telstra Network Disruptions TalkingData Mobile User Demographics Walmart Recruiting: Trip Type Classification Shelter Animal Outcomes The Nature Conservancy Fisheries Monitoring Two Sigma Connect: Rental Listing Inquiries Personalized Medicine: Redefining Cancer Treatment
2.3 求解
針對(duì)準(zhǔn)確率問(wèn)題,目前常采用的損失函數(shù)為multiclasslogloss ,其數(shù)學(xué)形式如下:
直接進(jìn)行優(yōu)化即可。
3. MAP(Mean Average Precision )
3.1 定義
其中為用戶(hù)的個(gè)數(shù),為在截止點(diǎn)處的精度(Precision),是預(yù)測(cè)物品的數(shù)量,是給定用戶(hù)購(gòu)買(mǎi)物品的數(shù)量。如果,則精度定義為0。
3.2 案例
Coupon Purchase Prediction Facebook V: Predicting Check Ins
3.3 求解
使用sigmoid_cross_entropy,注意與其它常用的多分類(lèi)損失函數(shù)的區(qū)別。
4. Mean F1
4.1 定義
4.2 案例
Transfer Learning on Stack Exchange Tags
4.3 求解
Top5有一名開(kāi)源的選手選用的是Mean square Loss進(jìn)行的優(yōu)化.
5. Average Jaccard Index
5.1 定義
兩個(gè)區(qū)域和的Jaccard Index可以表示為:
其中TP表示True positive的面積,F(xiàn)P表示false positive的面積,F(xiàn)N表示false negative的面積。
5.2 案例
Dstl Satellite Imagery Feature Detection
5.3 求解
基于Sigmoid的損失函數(shù)。
參考文章
損失函數(shù)softmax_cross_entropy、binary_cross_entropy、sigmoid_cross_entropy之間的區(qū)別與聯(lián)系:https://blog.csdn.net/sjyttkl/article/details/103958639 https://github.com/nagadomi/kaggle-coupon-purchase-prediction https://github.com/viig99/stackexchange-transfer-learning https://deepsense.io/deep-learning-for-satellite-imagery-via-image-segmentation/ https://arxiv.org/pdf/1505.04597.pdf https://github.com/toshi-k/kaggle-satellite-imagery-feature-detection
往期精彩回顧
本站qq群704220115,加入微信群請(qǐng)掃碼:
