測(cè)評(píng):《數(shù)據(jù)科學(xué)工程實(shí)踐》
↑↑↑點(diǎn)擊上方藍(lán)字,回復(fù)資料,10個(gè)G的驚喜
前篇:
測(cè)評(píng):《圖解機(jī)器學(xué)習(xí)算法》
測(cè)評(píng):《機(jī)器學(xué)習(xí)中的數(shù)學(xué)》
測(cè)評(píng):《Effective Python》
大家好,我是老胡
周末趁看奧運(yùn)會(huì)的功夫翻了一遍《數(shù)據(jù)科學(xué)工程實(shí)踐——用戶行為分析與建模、A/B實(shí)驗(yàn)、SQLFlow》這本書,測(cè)評(píng)如下:
1、這是一本數(shù)據(jù)分析方面的書,主要介紹初學(xué)者不太重視的內(nèi)容——以商業(yè)場(chǎng)景為導(dǎo)向的量化方法論。說起數(shù)據(jù)分析,很多同學(xué)的入門首選是《用Python進(jìn)行數(shù)據(jù)分析》,它專注于Python編程、類庫(kù)、工具的使用,十分經(jīng)典。但是商業(yè)理解和方法論方面涉及很多經(jīng)驗(yàn)性的東西,不如數(shù)據(jù)技術(shù)那么通用,相關(guān)的書都很難寫。這本書最大亮點(diǎn)是提供了實(shí)戰(zhàn)場(chǎng)景和整套的分析思路,案例不像其他書那么空洞。我個(gè)人重點(diǎn)看了第二部分關(guān)于實(shí)驗(yàn)設(shè)計(jì)和分析技術(shù)的內(nèi)容,重溫了很多知識(shí)。
2、這本書作者居然有十幾個(gè),都是來自騰訊、滴滴、快手等一線互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師和算法工程師。作者人數(shù)比章節(jié)數(shù)還多,很好奇他們是怎么配合的,反正感覺章節(jié)之間特獨(dú)立,有點(diǎn)跳躍。
3、第三部分(10-12章)主要介紹了SQLFlow和機(jī)器學(xué)習(xí)方面的內(nèi)容,沒有仔細(xì)看。
“SQLFlow是由滴滴數(shù)據(jù)科學(xué)團(tuán)隊(duì)和螞蟻金服合作開源的一款鏈接數(shù)據(jù)和機(jī)器學(xué)習(xí)能力的分析工具, 旨在能夠抽象出從數(shù)據(jù)到模型的研發(fā)過程, 同時(shí)配合底層的引擎適配及自動(dòng)優(yōu)化技術(shù), 使得具備基礎(chǔ)SQL知識(shí)的技術(shù)人員也可以完成大部分的機(jī)器學(xué)習(xí)模型訓(xùn)練,預(yù)測(cè)及應(yīng)用任務(wù)。
”
SQLFlow在“AI平民化”理念之上的探索性實(shí)踐,感覺不太完善(就是用SQL跑機(jī)器學(xué)習(xí)模型),遠(yuǎn)沒有達(dá)到他們的愿景。SQLFlow肯定是有應(yīng)用場(chǎng)景的,只是我沒用過,也沒仔細(xì)研究。單從學(xué)習(xí)角度,沒發(fā)現(xiàn)降低了學(xué)習(xí)門檻,大家了解一下就行了,沒必要放太多精力。copy了一段代碼和其工作原理,大家感受一下。

SELECT * FROM iris.train
TO TRAIN DNNClassifer
WITH hidden_units = [10, 10], n_classes = 3, EPOCHS = 10
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models.my_dnn_model;
總結(jié):數(shù)據(jù)分析入門和從業(yè)者,值得一讀。
推薦閱讀
(點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)
統(tǒng) 計(jì) 學(xué) 無 用 了 ???
老鐵,三連支持一下,好嗎?↓↓↓


