<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          魚佬出競(jìng)賽書了!

          共 3633字,需瀏覽 8分鐘

           ·

          2021-10-02 05:43

          ↑↑↑關(guān)注后"星標(biāo)"Datawhale
          每日干貨 & 每月組隊(duì)學(xué)習(xí),不錯(cuò)過
           Datawhale推薦 
          作者:魚佬,武漢大學(xué),Datawhale成員
          組織成員魚佬出書了。一本《機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)》應(yīng)運(yùn)而生,意在幫助機(jī)器學(xué)習(xí)初學(xué)者通過實(shí)戰(zhàn)的方法從雖然優(yōu)美但是略顯枯燥的各種公式和理論當(dāng)中脫離出來,感受機(jī)器學(xué)習(xí)在實(shí)際應(yīng)用中的奧秘,而競(jìng)賽則是一種最特殊的實(shí)戰(zhàn)。


          算法競(jìng)賽時(shí)代


          2010 年,全球著名算法競(jìng)賽平臺(tái) Kaggle 舉辦了第一場(chǎng)競(jìng)賽 Forecast Eurovision Voting,獎(jiǎng)金為 1000 美元。
          2015 年,國(guó)內(nèi)第一場(chǎng)算法競(jìng)賽在天池舉辦,比賽題目是阿里移動(dòng)推薦算法,獎(jiǎng)金為 30 萬元人民幣,吸引了 7000 多人參加。雖然國(guó)內(nèi)的算法競(jìng)賽起步時(shí)間晚于國(guó)外,但從 2015 年開始,在全球舉辦的一共 1000 多場(chǎng)賽事中,中國(guó)就舉辦了 400 多場(chǎng),并且場(chǎng)次的年均增長(zhǎng)率高達(dá) 108.8%,累計(jì)有超過 120 萬人參加,獎(jiǎng)金累計(jì)達(dá)到 2.8 億元人民幣。在算法競(jìng)賽的舉辦場(chǎng)次擁有如此高增長(zhǎng)率的情況下,其技術(shù)價(jià)值、業(yè)務(wù)價(jià)值和創(chuàng)新價(jià)值自然不容小覷。
          對(duì)于有志于進(jìn)軍機(jī)器學(xué)習(xí)相關(guān)領(lǐng)域從事研究或者相關(guān)工作的初學(xué)者來說,競(jìng)賽是性價(jià)比極高的一個(gè)實(shí)戰(zhàn)選擇,可以說是零門檻,任何人都能參加。


          易于學(xué)習(xí)的競(jìng)賽寶典


          對(duì)于想?yún)⒓訖C(jī)器學(xué)習(xí)競(jìng)賽的初學(xué)者來說,一本內(nèi)容友好的圖書極其重要,可以少走很多彎路。這本《機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)》合理地規(guī)劃了章節(jié)架構(gòu),作者們除了仔細(xì)的討論外,還采納了國(guó)內(nèi)多名頂尖競(jìng)賽選手的建議,深入剖析算法的本質(zhì)內(nèi)容,還結(jié)合多個(gè)領(lǐng)域模塊進(jìn)行了實(shí)戰(zhàn)講解。全書分為五個(gè)部分,作者還給每部分都取了一個(gè)名字。

          PART.
          01


          磨刀事半,砍柴功倍
          第一部分以算法競(jìng)賽的通用化流程為主,介紹競(jìng)賽中各個(gè)部分的核心內(nèi)容和具體工作,且每章都配有具體的實(shí)戰(zhàn)部分,以便加深理解。

          PART.
          02


          物以類聚,人以群分
          第二部分主要介紹用戶畫像相關(guān)的問題,構(gòu)建完善的標(biāo)簽體系是用戶畫像的核心,也是解決用戶畫像類賽題的關(guān)鍵,比如個(gè)性化推薦和金融風(fēng)控等問題都需要以用戶畫像作為支撐。為了幫助讀者加快對(duì)此類競(jìng)賽問題的學(xué)習(xí)、理解,會(huì)講解具體的競(jìng)賽案例,即 Kaggle 平臺(tái)的 Elo Merchant Category Recommendation。


          (題目背景:想象一下,當(dāng)你在一個(gè)不熟悉的地方餓著肚子想要找好吃的東西時(shí),你是不是會(huì)得到基于你的個(gè)人喜好而被專屬推薦的餐館,且該推薦還附帶著你的信用卡提供商為你提供的附近餐館的折扣信息。
          目前,巴西最大的支付品牌之一 Elo 已經(jīng)與商家建立了合作關(guān)系,以便向顧客提供促銷或折扣活動(dòng)。但這些促銷活動(dòng)對(duì)顧客和商家都有益嗎?顧客喜歡他們的活動(dòng)體驗(yàn)嗎?商家能夠看到重復(fù)交易嗎?要回答這些問題,個(gè)性化是關(guān)鍵。
          Elo 建立了機(jī)器學(xué)習(xí)模型,以了解顧客生命周期中從食品到購(gòu)物等最重要方面的偏好。但到目前為止,那些學(xué)習(xí)模型都不是專門為個(gè)人或個(gè)人資料量身定做的,這也就是這場(chǎng)競(jìng)賽舉辦的原因。
          在這場(chǎng)競(jìng)賽中,需要參賽者開發(fā)算法,通過發(fā)現(xiàn)顧客忠誠(chéng)度的信號(hào),識(shí)別并為個(gè)人提供最相關(guān)的機(jī)會(huì)。你的意見將改善顧客的生活,幫助 Elo 減少不必要的活動(dòng),為顧客創(chuàng)造精準(zhǔn)正確的體驗(yàn)。)


          PART.
          03


          以史為鑒,未來可期
          第三部分以時(shí)間序列預(yù)測(cè)問題為主,先講述這類問題的常見解題思路和技巧,然后分析兩個(gè)具體的實(shí)戰(zhàn)案例,分別是天池平臺(tái)的全球城市計(jì)算 AI 挑戰(zhàn)賽和Kaggle 平臺(tái)的Corporación Favorita Grocery Sales Forecasting。


          (題目背景:在實(shí)體雜貨店里,銷量預(yù)測(cè)和顧客采購(gòu)量之間的關(guān)系總是很微妙。如果銷量預(yù)測(cè)得多,而顧客采購(gòu)得少,那么雜貨店的商品就會(huì)積壓過多,尤其對(duì)易腐商品的影響較大;如果銷量預(yù)測(cè)較少,而顧客采購(gòu)量較大,那么商品很快就會(huì)賣光,短時(shí)間內(nèi)顧客的體驗(yàn)會(huì)變差。 

          隨著零售商不斷增加新地點(diǎn)、新產(chǎn)品,以及季節(jié)性口味的變化多樣和產(chǎn)品營(yíng)銷的不可預(yù)測(cè), 問題變得更加復(fù)雜。位于厄瓜多爾的大型雜貨零售商 Corporación Favorita 也非常清楚這點(diǎn),其經(jīng)營(yíng)著數(shù)百家超市,售賣的商品超過 20 萬種。


          于是 Corporación Favorita 向 Kaggle 社區(qū)提出了挑戰(zhàn),要求其建立一個(gè)可以準(zhǔn)確預(yù)測(cè)商品銷量的模型。Corporación Favorita 目前依靠主觀預(yù)測(cè)來備份數(shù)據(jù),很少通過自動(dòng)化工具執(zhí)行計(jì)劃, 他們非常期待通過機(jī)器學(xué)習(xí)實(shí)現(xiàn)在正確的時(shí)間提供足夠正確的商品,來更好地讓顧客滿意。)

          PART.
          04


          精準(zhǔn)投放,優(yōu)化體驗(yàn)
          計(jì)算廣告相關(guān)的業(yè)務(wù)大多是很好的競(jìng)賽題目,第四部分主要介紹了計(jì)算廣告的核心技術(shù)和業(yè)務(wù),包括廣告召回、廣告排序和廣告競(jìng)價(jià)。實(shí)戰(zhàn)案例部分則包括兩道賽題,分別是 2018 騰訊廣告算法大賽——相似人群拓展,以及 Kaggle 平臺(tái)的 TalkingData AdTracking Fraud Detection Challenge。

          PART.
          05


          聽你所說,懂你所寫
          第五部分基于自然語言處理相關(guān)的內(nèi)容進(jìn)行講解,包括常見任務(wù)和常見技術(shù),實(shí)戰(zhàn)案例部分是 Kaggle 平臺(tái)上的經(jīng)典競(jìng)賽 Quora Question Pairs。
          這本書可以說是算法競(jìng)賽領(lǐng)域一本系統(tǒng)性介紹競(jìng)賽的書,不僅包含競(jìng)賽的基本理論知識(shí),還結(jié)合多個(gè)方向和案例詳細(xì)闡述了競(jìng)賽中的上分思路和技巧。
          本書還附贈(zèng)讀書思維導(dǎo)圖,輕松定位學(xué)習(xí)要點(diǎn)。

          本書特色


          1

          騰訊廣告算法大賽兩屆冠軍、Kaggle Grandmaster傾力打造

          2

          賽題案例來自 Kaggle、阿里天池、騰訊廣告算法大賽

          3

          按照問題建模、數(shù)據(jù)探索、特征工程、模型訓(xùn)練、模型融合的步驟講解競(jìng)賽流程


          適合誰讀

          • 對(duì)算法競(jìng)賽感興趣的人。興趣是最大的驅(qū)動(dòng)力,為了讓算法競(jìng)賽變得更加有趣和更加多樣性,本書增加了很多擴(kuò)展與探索性的內(nèi)容,從多個(gè)方向、多個(gè)領(lǐng)域進(jìn)行介紹和實(shí)戰(zhàn)。

          • 想要研究機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法實(shí)戰(zhàn)的人。實(shí)戰(zhàn)的最佳方式之一是參加一場(chǎng)算法競(jìng)賽,加深對(duì)理論知識(shí)的理解,這也是本書的核心思想。

          • 計(jì)算機(jī)相關(guān)專業(yè)的人。機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法作為目前計(jì)算機(jī)行業(yè)一個(gè)火熱的就業(yè)方向,值得去深入研究。本書提供了很好的實(shí)戰(zhàn)講解,幫助讀者知其然,并知其所以然。


          機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)
          王賀 劉鵬 錢乾 著
          本書是算法競(jìng)賽領(lǐng)域一本系統(tǒng)介紹競(jìng)賽的圖書,書中不僅包含競(jìng)賽的基本理論知識(shí),還結(jié)合多個(gè)方向和案例詳細(xì)闡述了競(jìng)賽中的上分思路和技巧。
          全書分為五部分:第一部分以算法競(jìng)賽的通用流程為主,介紹競(jìng)賽中各個(gè)部分的核心內(nèi)容和具體工作;第二部分介紹了用戶畫像相關(guān)的問題;第三部分以時(shí)間序列預(yù)測(cè)問題為主,先講述這類問題的常見解題思路和技巧,然后分析天池平臺(tái)的全球城市計(jì)算 AI 挑戰(zhàn)賽和 Kaggle 平臺(tái)的Corporación Favorita Grocery Sales Forecasting;第四部分主要介紹計(jì)算廣告的核心技術(shù)和業(yè)務(wù),包括廣告召回、廣告排序和廣告競(jìng)價(jià),其中兩個(gè)實(shí)戰(zhàn)案例是 2018 騰訊廣告算法大賽——相似人群拓展和Kaggle 平臺(tái)的TalkingData AdTracking Fraud Detection Challenge;第五部分基于自然語言處理相關(guān)的內(nèi)容進(jìn)行講解,其中實(shí)戰(zhàn)案例是 Kaggle 平臺(tái)上的經(jīng)典競(jìng)賽 Quora Question Pairs。


          作者簡(jiǎn)介


          王賀(魚遇雨欲語與余),現(xiàn)任職于小米商業(yè)算法部,從事應(yīng)用商店廣告推薦的研究和開發(fā)。從 2018 年至 2020 年多次參加國(guó)內(nèi)外算法競(jìng)賽,共獲得 5 次冠軍和 5 次亞軍,是 2019 年和 2020 年騰訊廣告算法大賽的冠軍。畢業(yè)于武漢大學(xué)計(jì)算機(jī)學(xué)院,碩士學(xué)位,研究方向?yàn)閳D數(shù)據(jù)挖掘。
          劉鵬,華為技術(shù)有限公司算法工程師,從事電信運(yùn)營(yíng)商和智能運(yùn)維領(lǐng)域的算法研究和開發(fā)工作。2016 年本科畢業(yè)于武漢大學(xué)數(shù)學(xué)基地班,保研至中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系,碩士期間研究方向?yàn)閺?fù)雜網(wǎng)絡(luò)與機(jī)器學(xué)習(xí),2018 年起多次獲得機(jī)器學(xué)習(xí)相關(guān)競(jìng)賽獎(jiǎng)項(xiàng)。


          錢乾,數(shù)程科技大數(shù)據(jù)技術(shù)負(fù)責(zé)人,工作方向?yàn)槲锪黝I(lǐng)域的智能算法應(yīng)用。本科就讀于美國(guó)佐治亞理工大學(xué),研究方向包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理等。


          目錄搶先看


          (向右劃動(dòng)查看)


          文末福利

          小伙伴們本期一起來聊聊算法競(jìng)賽吧!參加過算法競(jìng)賽的伙伴們來分享一下自己參賽的收獲。也可以分享Datawhale在你參賽路上的幫助。我們會(huì)在精選留言中選出 5 位送出紀(jì)念版書籍。留言截至:2021.10.7

          ?? 京東購(gòu)買

          瀏覽 26
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人香蕉视频 | 国产精品~色哟哟 | 免费无码操逼 | 91精品国自产欧美在线观看 | 国产精品V无码A片在线看吃奶 |