特征工程入門與實(shí)踐
特征工程是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)流水線上的重要一環(huán),包括識(shí)別、清洗、構(gòu)建和發(fā)掘數(shù)據(jù)的特征,為進(jìn)一步解釋數(shù)據(jù)并進(jìn)行預(yù)測(cè)性分析做準(zhǔn)備。
本書囊括了特征工程的全流程,從數(shù)據(jù)檢查到可視化,再到轉(zhuǎn)換和進(jìn)一步處理等,并給出了大量數(shù)學(xué)工具,幫助讀者掌握如何將數(shù)據(jù)處理、轉(zhuǎn)換成適當(dāng)?shù)男问剑员闼腿胗?jì)算機(jī)和機(jī)器學(xué)習(xí)流水線中進(jìn)行處理。后半部分的特征工程實(shí)踐用Python作為示例語言,循序漸進(jìn),通俗易懂。
? 識(shí)別和利用不同類型的特征
? 清洗數(shù)據(jù)中的特征,提升預(yù)測(cè)能力
? 為何、如何進(jìn)行特征選擇和模型誤差分析
? 利用領(lǐng)域知識(shí)構(gòu)建新特征
? 基于數(shù)學(xué)知識(shí)交付特征
? 使用機(jī)器學(xué)習(xí)算法構(gòu)建特征
? 掌握特征工程與特征優(yōu)化
? 在現(xiàn)實(shí)應(yīng)用中利用特征工程
Sinan Ozdemir,數(shù)據(jù)科學(xué)家、數(shù)學(xué)家、約翰·霍普金斯大學(xué)講師,Kylie.ai 公司聯(lián)合創(chuàng)始人、CTO,在應(yīng)用數(shù)據(jù)挖掘、功能分析和算法開發(fā)做出基于數(shù)據(jù)和知識(shí)的決策方面擁有豐富的經(jīng)驗(yàn)。
Divya Susarla,在利用數(shù)據(jù)方面經(jīng)驗(yàn)豐富,在包括投資管理、社會(huì)企業(yè)咨詢和紅酒營銷的各個(gè)產(chǎn)業(yè)和領(lǐng)域里實(shí)現(xiàn)并應(yīng)用過相應(yīng)的策略。Kylie.ai 公司產(chǎn)品經(jīng)理,目前專注于自然語言處理和生成技術(shù)。
