<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

Apache HudiUber 大數(shù)據(jù)存儲(chǔ)系統(tǒng)

聯(lián)合創(chuàng)作 · 2023-09-18 19:13

Hudi 是 Uber 在 2016 年以“Hoodie”為代號(hào)開(kāi)發(fā)，旨在解決 Uber 大數(shù)據(jù)生態(tài)系統(tǒng)中需要插入更新及增量消費(fèi)原語(yǔ)的攝取管道和 ETL 管道的低效問(wèn)題。2019 年 1 月，Uber 向 Apache 孵化器提交了 Hudi，從而進(jìn)一步推進(jìn)了 Uber 的開(kāi)源承諾，保證 Apache Hudi 可以在 Apache 軟件基金會(huì)的開(kāi)放治理和指導(dǎo)下長(zhǎng)期可持續(xù)性地增長(zhǎng)。

Hudi 是一個(gè)通用的大數(shù)據(jù)存儲(chǔ)系統(tǒng)，主要特性：

快速，可插入索引的Upsert支持
通過(guò)回滾支持以原子方式發(fā)布數(shù)據(jù)
作者與查詢之間的快照隔離
數(shù)據(jù)恢復(fù)保存點(diǎn)
使用統(tǒng)計(jì)信息管理文件大小，布局
行和列數(shù)據(jù)的異步壓縮
時(shí)間軸元數(shù)據(jù)以跟蹤 lineage

Hudi 目前管理著 4000 多個(gè)表，這些表在 Uber 上存儲(chǔ)了幾 PB 的數(shù)據(jù)，同時(shí)將 Apache Hadoop 倉(cāng)庫(kù)訪問(wèn)延遲從幾個(gè)小時(shí)降低到 30 分鐘以下，這證明了它的可伸縮性。Hudi 還為數(shù)百個(gè)增量數(shù)據(jù)管道提供了支撐，與該公司以前使用的解決方案相比，它的成本更低，效率更高。

瀏覽 28

點(diǎn)贊

收藏

分享

舉報(bào)

評(píng)論

圖片

表情

Apache HudiUber 大數(shù)據(jù)存儲(chǔ)系統(tǒng)

Hudi是Uber在2016年以“Hoodie”為代號(hào)開(kāi)發(fā)，旨在解決Uber大數(shù)據(jù)生態(tài)系統(tǒng)中需要插入更新及增量消費(fèi)原語(yǔ)的攝取管道和ETL管道的低效問(wèn)題。2019年1月，Uber向Apache孵化器提交

Apache BlurNoSQL 數(shù)據(jù)存儲(chǔ)系統(tǒng)

Blur是一個(gè)NoSQL數(shù)據(jù)存儲(chǔ)系統(tǒng)，基于lucene、hadoop、thrift和Zookeeper構(gòu)建的，包含一系列的分片的lucene索引，可跨越多個(gè)服務(wù)器存儲(chǔ)。這里有一篇介紹入門(mén)的文章。

Apache KuduHadoop 數(shù)據(jù)存儲(chǔ)系統(tǒng)

ApacheKudu簡(jiǎn)介為了應(yīng)對(duì)先前發(fā)現(xiàn)的這些趨勢(shì)，有兩種不同的方式：持續(xù)更新現(xiàn)有的Hadoop工具或者重新設(shè)計(jì)開(kāi)發(fā)一個(gè)新的組件。其目標(biāo)是：???對(duì)數(shù)據(jù)掃描(scan)和隨機(jī)訪問(wèn)(randomacce

Apache BlurNoSQL 數(shù)據(jù)存儲(chǔ)系統(tǒng)

Blur 是一個(gè) NoSQL 數(shù)據(jù)存儲(chǔ)系統(tǒng)，基于 lucene、hadoop、thrift 和 Zo

Apache KuduHadoop 數(shù)據(jù)存儲(chǔ)系統(tǒng)

Apache Kudu 簡(jiǎn)介為了應(yīng)對(duì)先前發(fā)現(xiàn)的這些趨勢(shì)，有兩種不同的方式：持續(xù)更新現(xiàn)有的Hadoop

Apache OzoneHadoop 對(duì)象存儲(chǔ)系統(tǒng)

Ozone是Hadoop的對(duì)象存儲(chǔ)環(huán)境，能將HDFS從文件系統(tǒng)擴(kuò)展成更加復(fù)雜的企業(yè)級(jí)存儲(chǔ)層。Ozone使得HDFS塊存儲(chǔ)層能夠進(jìn)一步支持非文件性質(zhì)的系統(tǒng)數(shù)據(jù)，而HDFS的文件塊架構(gòu)也將能夠支持存儲(chǔ)鍵值

Apache OzoneHadoop 對(duì)象存儲(chǔ)系統(tǒng)

Ozone是Hadoop的對(duì)象存儲(chǔ)環(huán)境，能將HDFS從文件系統(tǒng)擴(kuò)展成更加復(fù)雜的企業(yè)級(jí)存儲(chǔ)層。Ozon

CockroachDB數(shù)據(jù)存儲(chǔ)系統(tǒng)

CockroachDB(蟑螂數(shù)據(jù)庫(kù)）是一個(gè)可伸縮的、支持地理位置處理、支持事務(wù)處理的數(shù)據(jù)存儲(chǔ)系統(tǒng)。CockroachDB提供兩種不同的的事務(wù)特性，包括快照隔離（snapshotisolation，簡(jiǎn)稱(chēng)

Druid-IOOLAP 數(shù)據(jù)存儲(chǔ)系統(tǒng)

Druid 是一個(gè)開(kāi)源的專(zhuān)為事件數(shù)據(jù)的 OLAP 查詢?cè)O(shè)計(jì)的數(shù)據(jù)存儲(chǔ)系統(tǒng)。Druid 用于大數(shù)據(jù)實(shí)時(shí)

CockroachDB數(shù)據(jù)存儲(chǔ)系統(tǒng)

CockroachDB (蟑螂數(shù)據(jù)庫(kù)）是一個(gè)可伸縮的、支持地理位置處理、支持事務(wù)處理的數(shù)據(jù)存儲(chǔ)系統(tǒng)。

點(diǎn)贊

收藏

分享

舉報(bào)

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

天天做天天爱天天高潮 | 91草草草草 | 黄色免费片| 黄色免费国产 | 亚洲文在线|