4000字讀懂實(shí)時(shí)數(shù)倉(cāng)的過(guò)去現(xiàn)在和未來(lái)(建議收藏)
點(diǎn)擊上方 "大數(shù)據(jù)肌肉猿"關(guān)注, 星標(biāo)一起成長(zhǎng)
點(diǎn)擊下方鏈接,進(jìn)入高質(zhì)量學(xué)習(xí)交流群
今日更新| 1052個(gè)轉(zhuǎn)型案例分享-大數(shù)據(jù)交流群

企業(yè)為什么需要實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)處理流程
ODS:Operation Data Store,也稱(chēng)為貼源層。數(shù)據(jù)倉(cāng)庫(kù)源頭系統(tǒng)的數(shù)據(jù)表通常會(huì)原封不動(dòng)的存儲(chǔ)一份,這稱(chēng)為ODS層,是后續(xù)數(shù)據(jù)倉(cāng)庫(kù)加工數(shù)據(jù)的來(lái)源。 DW數(shù)據(jù)分層,由下到上一般分為DWD,DWB,DWS。 DWD:Data Warehouse Details 細(xì)節(jié)數(shù)據(jù)層,是業(yè)務(wù)層與數(shù)據(jù)倉(cāng)庫(kù)的隔離層。主要對(duì)ODS數(shù)據(jù)層做一些數(shù)據(jù)清洗(去除空值、臟數(shù)據(jù)、超過(guò)極限范)和規(guī)范化的操作。 DWB:Data Warehouse Base 數(shù)據(jù)基礎(chǔ)層,存儲(chǔ)的是客觀數(shù)據(jù),一般用作中間層,可以認(rèn)為是大量指標(biāo)的數(shù)據(jù)層。 DWS:Data Warehouse Service 數(shù)據(jù)服務(wù)層,基于DWB上的基礎(chǔ)數(shù)據(jù),主要是對(duì)用戶(hù)行為進(jìn)行輕度聚合,整合匯總成分析某一個(gè)主題域的服務(wù)數(shù)據(jù)層,一般是寬表。用于提供后續(xù)的業(yè)務(wù)查詢(xún),OLAP分析,數(shù)據(jù)分發(fā)等。 數(shù)據(jù)服務(wù)層/應(yīng)用層(APP/DWA):該層主要是提供數(shù)據(jù)產(chǎn)品和數(shù)據(jù)分析使用的數(shù)據(jù),我們通過(guò)說(shuō)的報(bào)表數(shù)據(jù),或者說(shuō)那種大寬表,一般就放在這里。
實(shí)時(shí)數(shù)倉(cāng)的常見(jiàn)方案
LAMBDA & KAPPA 實(shí)時(shí)架構(gòu)

湖倉(cāng)一體能否解決實(shí)時(shí)問(wèn)題?
實(shí)時(shí)性成為了提升企業(yè)競(jìng)爭(zhēng)力的核心手段。目前的湖、倉(cāng)、或者湖倉(cāng)分體都是基于 T+1 設(shè)計(jì)的,面對(duì) T+0 的實(shí)時(shí)按需分析,用戶(hù)的需求無(wú)法滿(mǎn)足。 所有用戶(hù)(BI 用戶(hù)、數(shù)據(jù)科學(xué)家等)可以共享同一份數(shù)據(jù),避免數(shù)據(jù)孤島。 超高并發(fā)能力,支持?jǐn)?shù)十萬(wàn)用戶(hù)使用復(fù)雜分析查詢(xún)并發(fā)訪問(wèn)同一份數(shù)據(jù)。 傳統(tǒng) Hadoop 在事務(wù)支持等方面的不足被大家詬病,在高速發(fā)展之后未能延續(xù)熱度,持續(xù)引領(lǐng)數(shù)據(jù)管理,因此事務(wù)支持在湖倉(cāng)一體架構(gòu)中應(yīng)得到改善和提升。 云原生數(shù)據(jù)庫(kù)已經(jīng)逐漸成熟,基于存算分離技術(shù),可以給用戶(hù)帶來(lái)多種價(jià)值:降低技術(shù)門(mén)檻、減少維護(hù)成本、提升用戶(hù)體驗(yàn)、節(jié)省資源費(fèi)用,已成為了湖倉(cāng)一體落地的重要法門(mén)。 為釋放數(shù)據(jù)價(jià)值提升企業(yè)智能化水平,數(shù)據(jù)科學(xué)家等用戶(hù)角色必須通過(guò)多種類(lèi)型數(shù)據(jù)進(jìn)行全域數(shù)據(jù)挖掘,包括但不限于歷史的、實(shí)時(shí)的、在線的、離線的、內(nèi)部的、外部的、結(jié)構(gòu)化的、非結(jié)構(gòu)化數(shù)據(jù)。
云原生數(shù)據(jù)倉(cāng)庫(kù) + Omega實(shí)時(shí)架構(gòu) 實(shí)現(xiàn)實(shí)時(shí)湖倉(cāng)
云原生數(shù)據(jù)庫(kù)實(shí)現(xiàn)完全的存算分離
基于Omega實(shí)時(shí)框架的湖倉(cāng)方案
Omega 架構(gòu)邏輯圖

結(jié)語(yǔ):
架構(gòu)層面要保持靈活開(kāi)放,支持多種技術(shù)兼容性并存。目前,企業(yè)已經(jīng)部署了多個(gè)系統(tǒng),有自己的一套架構(gòu)體系,技術(shù)融合落地時(shí)需要最大化利用企業(yè)原有IT資產(chǎn),保護(hù)客戶(hù)投資。 有效利用資源,降本增效。原來(lái)傳統(tǒng)的技術(shù)棧,所有資源參與計(jì)算,造成IT資源浪費(fèi)。比如,云原生資源池化,可以實(shí)現(xiàn)資源隔離與動(dòng)態(tài)管理,便于最大化利用資源。 滿(mǎn)足更高的用戶(hù)體驗(yàn)。從用戶(hù)角度來(lái)看,在技術(shù)條件具備的前提下,比如高性能、高并發(fā)、實(shí)時(shí)性更強(qiáng),便具備了更強(qiáng)的信息加工能力,能夠在很短的時(shí)間內(nèi)滿(mǎn)足用戶(hù)各種各樣的數(shù)據(jù)服務(wù)需求,提升用戶(hù)體驗(yàn)。
--end--
掃描下方二維碼 添加好友,備注【交流】 可圍觀朋友圈,也可私信交流
評(píng)論
圖片
表情
