HBase技術(shù)社區(qū)
0獲贊0關(guān)注2粉絲
Hudi 實踐 | Notion 數(shù)據(jù)湖構(gòu)建和擴展之路
在過去三年中,由于用戶和內(nèi)容的增長,Notion 的數(shù)據(jù)增長了 10 倍,以 6-12 個月的速度翻了一番。要管理這種快速增長,同時滿足關(guān)鍵產(chǎn)品和分析用例不斷增長的數(shù)據(jù)需求,尤其是我們最近的 Notion AI 功能,意味著構(gòu)建和擴展 Notion 的數(shù)據(jù)湖。以下來介紹我們是如何做到的。Notion
HBase技術(shù)社區(qū)
0
Hudi 源碼 | Hudi 索引:Parquet 布隆過濾器寫入過程
前言上篇文章提到 :索引的邏輯主要是根據(jù) parquet 文件中保存的索引信息,判斷記錄是否存在,如果不存在,代表是新增數(shù)據(jù),如果記錄存在則代表是更新數(shù)據(jù),需要找到并設置 currentLocation。對于布隆索引來說,這里的索引信息其實是布隆過濾器,本篇文章主要是先總結(jié)布隆過濾器是如何保存到 p
HBase技術(shù)社區(qū)
0
Hudi 源碼 | Hudi 索引:Tag 和 TagLocation
前言接上篇文章和之前的總結(jié)的源碼文章,本文總結(jié)源碼 tag/tagLocation ,對應功能:根據(jù)索引信息判斷記錄是否存在,如果不存在,代表是新增數(shù)據(jù),如果記錄存在則代表是更新數(shù)據(jù),需要找到并設置 currentLocation。tagAbstractWriteHelper.tag &n
HBase技術(shù)社區(qū)
0
數(shù)據(jù)湖核心能力解析
導讀 本文將分享數(shù)據(jù)湖的發(fā)展近況。主要內(nèi)容包括:1. 數(shù)據(jù)湖發(fā)展趨勢分析2. 數(shù)據(jù)湖整體架構(gòu)3. 數(shù)據(jù)集成4. Lakehouse 核心能力5. Lakehouse 開放性設計6. 流批一體7. 實時 OLAP8.&nb
HBase技術(shù)社區(qū)
0
大模型時代下,湖倉一體化架構(gòu)選型與挑戰(zhàn)
Lakehouse作為一種創(chuàng)新的開放架構(gòu),巧妙融合了數(shù)據(jù)湖與數(shù)據(jù)倉庫的精華特質(zhì)。通過整合數(shù)據(jù)湖的非結(jié)構(gòu)化數(shù)據(jù)存儲能力和數(shù)據(jù)倉庫的數(shù)據(jù)處理和管理功能,實現(xiàn)了數(shù)據(jù)湖和數(shù)據(jù)倉庫的無縫連接,使得數(shù)據(jù)和計算在湖和倉之間自由流動,從而更好地發(fā)揮出數(shù)據(jù)湖的靈活性和數(shù)據(jù)倉庫的成長性。 &n
HBase技術(shù)社區(qū)
0
Hudi 實踐 | Leboncoin 基于 Apache Hudi 構(gòu)建 Lakehouse 實踐
每天約有 800 萬獨立訪問者訪問 Leboncoin,到 2022 年,該網(wǎng)站每月有超過 1000 億次 HTTP 調(diào)用并且啟動和運行 700 個應用程序,使其成為訪問量最大的法國網(wǎng)站之一。 數(shù)據(jù)平臺團隊負責構(gòu)建和維護平臺基礎設施以及開...
HBase技術(shù)社區(qū)
0
Hudi 演變 | LakeHouse 還是 Warehouse?(2/2)
這篇博文包括 Onehouse 首席執(zhí)行官 Vinoth Chandar 于 2022 年 3 月在奧斯汀數(shù)據(jù)委員會發(fā)表的重要演講的后半部分。本文是第 2 部分,比較了架構(gòu)的功能和性價比特征。最后,它描述了一個面向未來的、湖倉一體的架構(gòu)。...
HBase技術(shù)社區(qū)
0
Paimon 實踐 | 幸福里基于 Flink & Paimon 的流式數(shù)倉實踐
摘要: 本文整理自字節(jié)跳動基礎架構(gòu)工程師李國君,在 Streaming Lakehouse Meet
HBase技術(shù)社區(qū)
0
Doris 實踐 | 貨拉拉大數(shù)據(jù) Doris 穩(wěn)定性保障實踐
導讀 ? 本文將介紹貨拉拉大數(shù)據(jù)在Doris穩(wěn)定性保障方面的實踐。 今天的介紹會圍繞下面五點展開:
HBase技術(shù)社區(qū)
0
Flink 實踐 | Flink 流批一體在 Shopee 的大規(guī)模實踐
摘要: 本文整理自?Shopee 研發(fā)專家李明昆,在 Flink Forward Asia 2022
HBase技術(shù)社區(qū)
0
