Power BI 重磅推出:自助數(shù)據(jù)倉庫。掌控數(shù)據(jù)就是掌控力量。
數(shù)字化未來已至,掌控數(shù)據(jù)就是掌控力量。
發(fā)生了什么
業(yè)務(wù)用戶嚴(yán)重依賴由信息技術(shù)團(tuán)隊 (IT) 構(gòu)建的集中管理的數(shù)據(jù)源,但 IT 部門可能需要數(shù)月時間才能對給定數(shù)據(jù)源進(jìn)行更改。作為回懟,用戶經(jīng)常假裝求助于使用 Access 數(shù)據(jù)庫、本地文件、SharePoint 網(wǎng)站和電子表格構(gòu)建自己的數(shù)據(jù)集市,從而導(dǎo)致缺乏治理和適當(dāng)?shù)谋O(jiān)督,以確保此類數(shù)據(jù)源得到支持并具有合理的性能。
數(shù)據(jù)集市有助于彌合業(yè)務(wù)用戶和 IT 之間的差距。Datamarts 是自助式分析解決方案,使用戶能夠存儲和探索加載在完全托管數(shù)據(jù)庫中的數(shù)據(jù)。數(shù)據(jù)集市提供了一種簡單且可選的無代碼體驗,可以從不同數(shù)據(jù)源提取數(shù)據(jù),使用 Power Query 提取轉(zhuǎn)換和加載 (ETL) 數(shù)據(jù),然后將其加載到完全托管且無需調(diào)整或優(yōu)化的 Azure SQL 數(shù)據(jù)庫中。
將數(shù)據(jù)加載到數(shù)據(jù)集市后,您還可以為商業(yè)智能和分析定義關(guān)系和策略。數(shù)據(jù)集市自動生成數(shù)據(jù)集或語義模型,可用于創(chuàng)建 Power BI 報表和儀表板。您還可以使用 T-SQL 連接或使用 SQL 查詢數(shù)據(jù)集市。
如圖所示:

很多小伙伴會問:什么是數(shù)據(jù)集市?和數(shù)據(jù)倉庫有什么區(qū)別?
其實是這樣的:數(shù)據(jù)倉庫,是把企業(yè)所有數(shù)據(jù)都搞到一起存好,一般只能由 IT 搞的。而數(shù)據(jù)集市,是一個低調(diào)的稱呼。這樣比較給面子,數(shù)據(jù)集市大到一定程度,和數(shù)據(jù)倉庫本質(zhì)一樣。只不過你這么說的話,IT 肯定不喜歡的。所以,要低調(diào)的,這樣就是在數(shù)據(jù)倉庫的基礎(chǔ)上,架設(shè)一個由業(yè)務(wù)人可以控制的數(shù)據(jù)集市。
那數(shù)據(jù)集市可以放多少數(shù)據(jù)呢?可以放多達(dá) TB 級別。
那數(shù)據(jù)集市有什么好處呢?
業(yè)務(wù)人員無需求助 IT 管理員即可自主輕松構(gòu)建可支持多達(dá) TB 級別的數(shù)據(jù)庫并進(jìn)行分析。
整合海量數(shù)據(jù)不需要寫代碼,使用圖形化界面利用 Power Query 拖拽生成即可。
支持直接構(gòu)建統(tǒng)一的業(yè)務(wù)邏輯層,為所有人在其上工作提供了 “數(shù)據(jù)加邏輯”。
也就是說:
無需 IT 幫助即可零代碼(或 PQ+DAX)構(gòu)建自帶業(yè)務(wù)邏輯的可支撐到 TB 級的數(shù)據(jù)中心。
雖然,這個描述比較夸張,但只有夸張才能強調(diào)本質(zhì)。
你們知道嗎:當(dāng)年 Power BI 推出了 Power BI Premium Per User 且業(yè)務(wù)部門可以自行購買,微軟立馬收到了大量 IT 投訴,因為業(yè)務(wù)可以繞過 IT,自己購買和開通 Power BI,也就是開通數(shù)字化超級能力。微軟妥協(xié)了,在這個功能上加了一個開關(guān),IT 可以關(guān)閉這個開關(guān),讓業(yè)務(wù)需要購買 Power BI 的時候必須經(jīng)過 IT。IT 的理由是:這樣才能統(tǒng)一管理。這個理由當(dāng)然合理。當(dāng)我們只是指出這個背后在職場中的另一種可能而已。
當(dāng)然,本處的數(shù)據(jù)集市只是提供了這種能力:無需 IT 幫助即可零代碼構(gòu)建自帶業(yè)務(wù)邏輯的大數(shù)據(jù)中心。
在實操中,你會收到各種理由,告訴你做不了的。
所以,和 IT 搞好關(guān)系是王道。
當(dāng)然,在擁有智慧的組織里,實際情況正好是相反的:
IT 嫌業(yè)務(wù)太麻煩了,最好業(yè)務(wù)人員可以自己搞定,IT 特別希望業(yè)務(wù)可以自己搞這些,那么,IT 就可以騰出來精力去做更技術(shù)的事情了。這對 IT 來說,是重大利好,IT 控制數(shù)據(jù)源頭,而如何使用數(shù)據(jù)就交給業(yè)務(wù)用戶即可。
業(yè)務(wù)嫌 IT 太慢了,最好可以接通數(shù)據(jù),自己部門的 Power BI 高手可以搞定一切了。
沒有錯,在不良的合作關(guān)系中,這個技術(shù)發(fā)揮不出來;但在良好的合作關(guān)系中,不管是 IT 還是業(yè)務(wù)都將得到嶄新的競爭力。至于你的實際環(huán)境是哪種,可以自己對照。
數(shù)據(jù)集市的特性
Power BI 推出的數(shù)據(jù)集市具有以下重大特性:
純云端操作,無需任何軟件。
零代碼體驗,現(xiàn)在無需以后也無需學(xué)習(xí) SQL 就可以搞定一切。
性能自動優(yōu)化。無需數(shù)據(jù)庫專家,性能自定優(yōu)化。
內(nèi)置圖形化編輯器,支持 SQL 查詢以及混合分析。
支持程序員用 SQL 客戶端去連它。
與 Power BI 和 Office 原生集成。
誰可以使用
如果你的企業(yè)已經(jīng)是 Power BI Premium 租戶或者你是 Power BI Premium Per User 客戶,那以上一切已經(jīng)為你準(zhǔn)備好了。
順便提下:
第一,企業(yè) Power BI Premium 是個人不需要了解的。
第二,如果企業(yè)沒有,那么個人購買 Power BI Premium Per User 費用大概:1500 RMB / 人年。
如果你在大型企業(yè)或外企,可能你已經(jīng)是滿足一了。如果你是個人或者在中小企業(yè),那你就知道第二條將告訴你這是怎樣的性價比。
什么場景用
那么什么時候來用數(shù)據(jù)集市呢?
數(shù)據(jù)集市,用于解決沒有 IT 幫助你的情況下,自己要搞定一切時又不會寫代碼時的工作壓力。
例如,如果您從事會計或金融工作,您可以構(gòu)建自己的數(shù)據(jù)模型和集合,然后您可以使用它們通過 T-SQL 和可視化查詢體驗自助服務(wù)業(yè)務(wù)問題和答案。此外,您仍然可以將這些數(shù)據(jù)集合用于更傳統(tǒng)的 Power BI 報告體驗。數(shù)據(jù)集市推薦給需要面向領(lǐng)域、去中心化數(shù)據(jù)所有權(quán)和架構(gòu)的客戶,例如需要將數(shù)據(jù)作為產(chǎn)品或自助數(shù)據(jù)平臺的用戶。
進(jìn)一步來說,數(shù)據(jù)集市可以用來支撐以下場景:
部門級數(shù)據(jù)中心。低調(diào)了。將小到中等的數(shù)據(jù)量(大約 100 GB)集中在一個自助式完全托管的 SQL 數(shù)據(jù)庫中。數(shù)據(jù)集市使您能夠為自助服務(wù)部門下游報告需求(例如 Excel、Power BI 報告等)指定單個商店,從而減少自助服務(wù)解決方案中的基礎(chǔ)架構(gòu)。
一個大型 Power BI 分析。內(nèi)置構(gòu)建數(shù)據(jù)模型,支持編寫 DAX 度量值等構(gòu)建一個大型的 Power BI 方案。
完全自助控制的業(yè)務(wù)模型。讓 Power BI 用戶可以在不依賴 IT 或其他工具的前提下,構(gòu)建業(yè)務(wù)邏輯,使用可視化的界面,而一切都存儲在云端數(shù)據(jù)庫,比放在自己公司還安全。丟了壞了,微軟陪。
與其他類似東西的區(qū)別
本質(zhì)上來說,考慮到你的智慧,數(shù)據(jù)集市,是一個戰(zhàn)略數(shù)據(jù)庫。
與其他類似東西的區(qū)別,包括:DataFlow,DataSet,數(shù)據(jù)庫,數(shù)據(jù)倉庫,Power BI 有啥區(qū)別呢?
DataFlow 是一個管子,定義了數(shù)據(jù)應(yīng)該怎么走,管子可以套管子。
DataSet 是家里小院里的池塘。歸從屬的 Power BI 用戶所有,一人一文件一個。
數(shù)據(jù)庫是一種技術(shù)稱呼,任何一片水都是數(shù)據(jù)庫,從小池塘到胡泊到海洋都是數(shù)據(jù)庫。
數(shù)據(jù)倉庫是企業(yè)建立的統(tǒng)一的水庫。
數(shù)據(jù)集市,是從數(shù)據(jù)倉庫或數(shù)據(jù)庫或任何小水塘子把水聚集到一個大池子里,是小區(qū)的公共游泳池。歸小區(qū)物業(yè)管。以后誰要來里面游泳或接水,可以交物業(yè)費或免費,隨你說了算。
那么小區(qū)的游泳池可以不做游泳池,做一個釣魚池嗎?可以的。業(yè)務(wù)不同,定義不同的業(yè)務(wù)邏輯即可。有了小區(qū)的游泳池,不影響家里后院的小池塘還是那個小池塘。
說明了什么?
水庫,不歸你管。家庭后院的水塘子,也不歸你管,歸用戶。而誰能成為小區(qū)物業(yè),誰就真正可以以各種名義去做各種事情了。例如:檢測一次,收多少錢,每天要檢測,要持 72 小時報告才能開會等等。都可以定規(guī)則了。那么,是不是在小區(qū),游泳池子或釣魚池子歸誰,誰就很厲害???
什么樣子的
如果你熟悉 Power BI,那很容易。

主要的痛點就是:你不用等數(shù)據(jù)工程師了。

建立數(shù)據(jù)管道完全是圖形化的,如下:

要注意,這里存儲所有數(shù)據(jù),是所有。如下:

如上圖,所有數(shù)據(jù)都流入了池子,你可以根據(jù)你的欲望來處理這個池子。
一切處理都是圖形化的:

對于數(shù)據(jù)量級,不用擔(dān)心:

如果能處理 TB 級,這個規(guī)模完全夠了。
一樣可以做出 Power BI 級別的可視化報告:

建立數(shù)據(jù)處理的邏輯完全不需要寫代碼,如下:

什么時候可以用
那么,什么時候可以用呢?現(xiàn)在。

獲取數(shù)據(jù)后,還可以設(shè)置增量刷新:

可以建立連接:

可以構(gòu)建關(guān)系模型:

還可以寫度量值:

這個體驗和本地的 Power BI Desktop 里是一致的。
然后直接構(gòu)建可視化:

整個過程,無需軟件,666。
總結(jié)
很多人說 Power BI 是一個數(shù)據(jù)可視化工具。沒有錯,盲人永遠(yuǎn)只是摸到大象的屁股而已。況且,還是一只在不斷長大的大象。你可以騎上它,也可以被騎上它的人踩死,而你卻不知道。
沒有錯,以上一切,不是構(gòu)想,已經(jīng)在那里了。打開,點擊,實現(xiàn)。
想騎上這只大象卻不知道怎么入手?

Power BI 終極系列課程《BI真經(jīng)》

BI真經(jīng) - 讓數(shù)據(jù)真正成為你的力量
掃碼與精英一起討論 Power BI,驗證碼:data2022
點擊“閱讀原文”進(jìn)入學(xué)習(xí)中心
↙
