<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Spark快速大數(shù)據(jù)分析(第2版)

          聯(lián)合創(chuàng)作 · 2023-09-25 21:57

          毋庸置疑,數(shù)據(jù)已經(jīng)成為現(xiàn)代化企業(yè)的重要資產(chǎn),大數(shù)據(jù)分析技術(shù)則是企業(yè)挖掘數(shù)據(jù)價(jià)值的核心利器。一直以來,Spark就是大數(shù)據(jù)分析領(lǐng)域的佼佼者,也已經(jīng)成為一站式大數(shù)據(jù)分析引擎的事實(shí)標(biāo)準(zhǔn)。

          ◎ 編輯推薦

          ☆ Databricks工程師誠(chéng)意之作,比官方文檔更實(shí)用的Spark入門教程

          ☆ 前一版印刷32次,銷量超6萬冊(cè)

          ☆ 新版全面更新,覆蓋Spark 3.0新特性

          本書作者均來自Spark的母公司Databricks。他們將帶你開始使用Spark,并了解如何利用它適應(yīng)這個(gè)屬于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的新時(shí)代。第2版在第1版的基礎(chǔ)上做了大量更新,涵蓋Spark 3.0的新特性,并著重展示如何利用機(jī)器學(xué)習(xí)算法執(zhí)行大數(shù)據(jù)分析。

          ○ 學(xué)習(xí)使用Python、Java、Scala的結(jié)構(gòu)化數(shù)據(jù)API

          ○ 理解Spark SQL引擎的原理

          ○ 掌握Spark應(yīng)用的優(yōu)化技巧

          ○ 了解如...

          毋庸置疑,數(shù)據(jù)已經(jīng)成為現(xiàn)代化企業(yè)的重要資產(chǎn),大數(shù)據(jù)分析技術(shù)則是企業(yè)挖掘數(shù)據(jù)價(jià)值的核心利器。一直以來,Spark就是大數(shù)據(jù)分析領(lǐng)域的佼佼者,也已經(jīng)成為一站式大數(shù)據(jù)分析引擎的事實(shí)標(biāo)準(zhǔn)。

          ◎ 編輯推薦

          ☆ Databricks工程師誠(chéng)意之作,比官方文檔更實(shí)用的Spark入門教程

          ☆ 前一版印刷32次,銷量超6萬冊(cè)

          ☆ 新版全面更新,覆蓋Spark 3.0新特性

          本書作者均來自Spark的母公司Databricks。他們將帶你開始使用Spark,并了解如何利用它適應(yīng)這個(gè)屬于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的新時(shí)代。第2版在第1版的基礎(chǔ)上做了大量更新,涵蓋Spark 3.0的新特性,并著重展示如何利用機(jī)器學(xué)習(xí)算法執(zhí)行大數(shù)據(jù)分析。

          ○ 學(xué)習(xí)使用Python、Java、Scala的結(jié)構(gòu)化數(shù)據(jù)API

          ○ 理解Spark SQL引擎的原理

          ○ 掌握Spark應(yīng)用的優(yōu)化技巧

          ○ 了解如何讀寫數(shù)據(jù)源:JSON、Parquet、CSV、Avro、ORC等

          ○ 使用Structured Streaming分析批式數(shù)據(jù)和流式數(shù)據(jù)

          ○ 使用Spark和Delta Lake構(gòu)建湖倉一體的系統(tǒng)

          ○ 使用MLlib開發(fā)機(jī)器學(xué)習(xí)流水線

          ◎ 內(nèi)容簡(jiǎn)介

          本書的主角是在大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生的數(shù)據(jù)處理與分析利器——Spark。你將通過豐富的示例學(xué)習(xí)如何使用Spark的結(jié)構(gòu)化數(shù)據(jù)API,利用Spark SQL進(jìn)行交互式查詢,掌握Spark應(yīng)用的優(yōu)化之道,用Spark和Delta Lake等開源工具構(gòu)建可靠的數(shù)據(jù)湖,并用MLlib庫實(shí)現(xiàn)機(jī)器學(xué)習(xí)流水線。

          隨著Spark從2.x版本升級(jí)到3.0版本,本書第2版做了全面的更新,以體現(xiàn)Spark生態(tài)系統(tǒng)在機(jī)器學(xué)習(xí)、流處理技術(shù)等方面的發(fā)展,另新增一章詳解Spark 3.0引入的新特性。

          ◎ 業(yè)內(nèi)佳評(píng)

          “這本書提供了一種系統(tǒng)學(xué)習(xí)Spark的方法,并介紹了該項(xiàng)目的發(fā)展近況,是Spark開發(fā)人員上手大數(shù)據(jù)的好途徑。”

          ——Reynold Xin,Databricks聯(lián)合創(chuàng)始人、Apache Spark PMC成員

          “對(duì)于希望學(xué)習(xí)Spark并想構(gòu)建可伸縮的可靠大數(shù)據(jù)應(yīng)用的數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師來說,這本書應(yīng)成為常備指南。”

          ——Ben Lorica,Databricks數(shù)據(jù)科學(xué)家、Spark + AI峰會(huì)項(xiàng)目主席

          “在信息化時(shí)代,數(shù)據(jù)已經(jīng)成為現(xiàn)代化企業(yè)的重要資產(chǎn),大數(shù)據(jù)分析技術(shù)也已經(jīng)成為企業(yè)挖掘數(shù)據(jù)價(jià)值的核心利器。近10年來,隨著開源技術(shù)理念的蓬勃發(fā)展,開源大數(shù)據(jù)技術(shù)體系已經(jīng)成為行業(yè)的主流選擇,Apache Spark就是其中的優(yōu)秀代表。憑借優(yōu)秀的架構(gòu)設(shè)計(jì),Spark 可以在數(shù)據(jù)倉庫、數(shù)據(jù)湖和機(jī)器學(xué)習(xí)領(lǐng)域快速處理海量數(shù)據(jù),加速各行各業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。”

          ——王峰,花名“莫問”,阿里云開源大數(shù)據(jù)平臺(tái)負(fù)責(zé)人

          “轉(zhuǎn)眼間Apache Spark已經(jīng)走過了近12個(gè)年頭。作為一個(gè)12年的項(xiàng)目,Spark并未逐漸凋零,而是在云原生、湖倉一體、AI等方面爆發(fā)出更強(qiáng)的生命力。這本書的第2版在為大家介紹Spark基本原理的同時(shí),也花了不少篇幅介紹它在這些新興領(lǐng)域中的應(yīng)用。希望你通過此書對(duì)Spark的基本原理及未來發(fā)展有一個(gè)系統(tǒng)的了解,也希望Spark在未來的10年能持續(xù)進(jìn)化,在大數(shù)據(jù)領(lǐng)域擦出更多的‘火花’。”

          ——邵賽賽,騰訊專家工程師,數(shù)據(jù)湖團(tuán)隊(duì)負(fù)責(zé)人

          “這是一個(gè)數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的時(shí)代,一個(gè)數(shù)據(jù)改變世界的時(shí)代,一個(gè)數(shù)據(jù)成為生產(chǎn)資源和執(zhí)政資源的時(shí)代。Apache Spark是數(shù)據(jù)分析的事實(shí)標(biāo)準(zhǔn)。這本書既是學(xué)習(xí)Spark的入門指南,也是大數(shù)據(jù)行業(yè)的敲門磚。”

          ——李瀟,Databricks Spark研發(fā)部主管,Apache Spark PMC成員

          ◎ 著者簡(jiǎn)介

          ☆ 朱爾斯·S. 達(dá)米吉(Jules S. Damji),Databricks的高級(jí)開發(fā)人員,也是MLflow的貢獻(xiàn)者。

          ☆ 布魯克·韋尼希(Brooke Wenig),Databricks的機(jī)器學(xué)習(xí)專家。

          ☆ 泰瑟加塔·達(dá)斯(Tathagata Das),Databricks的軟件工程師,也是Apache Spark PMC成員。

          ☆ 丹尼·李(Denny Lee)是Databricks的軟件工程師。

          ◎ 譯者簡(jiǎn)介

          王道遠(yuǎn),目前就職于阿里云開源大數(shù)據(jù)平臺(tái)數(shù)據(jù)湖存儲(chǔ)團(tuán)隊(duì),花名“健身”,主要負(fù)責(zé)數(shù)據(jù)湖架構(gòu)下的緩存優(yōu)化工作。有多年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),熟悉Spark源碼,從2014年開始參與Spark項(xiàng)目,曾為Spark貢獻(xiàn)大量修復(fù)和新特性,也曾作為主要貢獻(xiàn)者參與了OAP和SparkCube等Spark生態(tài)開源項(xiàng)目的開發(fā)。

          瀏覽 2
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  人妻操| 久久精品在 | 久久无码专区 | 久在草视频 | 懂色一区二区三区四区在线看 |