Doris 畢業(yè)成為 Apache 頂級項目,獨家專訪百度 PALO 團隊
采訪整理:SegmentFault 思否
采訪嘉賓:百度 PALO 團隊(楊政國、繆翎、李昊鵬、朱小力、龔政、張志強、仲毅、張東進等)
2022 年 6 月 16 日,Apache 軟件基金會發(fā)表博文,宣布 Doris 正式畢業(yè),正式成為 Apache 頂級項目(TLP)。
相關(guān)閱讀:
https://blogs.apache.org/foundation/entry/the-apache-software-foundation-announces81

從 2008 年誕生到今天,Doris 已經(jīng)走過了十四個年頭。這十四年間,Doris 經(jīng)歷了誕生、推廣、發(fā)展、開源、捐贈、繁榮,成長的旅程中也歷經(jīng)了諸多艱辛和波折。
SegmentFault 思否獨家專訪了百度 PALO 團隊,為你呈現(xiàn)這背后不為人知的故事與曲折。
以下內(nèi)容整理自訪談實錄。
為數(shù)據(jù)分析而生,Doris 的“前世今生”
SegmentFault:
回顧 Doris 14 年發(fā)展史,Doris 的都經(jīng)歷了哪幾個項目里程碑?
百度 PALO 團隊:
說起 Doris 的歷史,它最初誕生于百度,目的是解決當時百度內(nèi)部高并發(fā),高實時的在線報表需求,不覺間 Doris 已經(jīng)走過了十四年。
2008 年,Doris 在百度誕生,定位為高性能分析型數(shù)據(jù)庫,大幅提升了百度鳳巢業(yè)務(wù)的數(shù)據(jù)分析時效性。
2009 年,Doris 開始支持百度內(nèi)部其他報表系統(tǒng),并助力百度統(tǒng)計成為國內(nèi)領(lǐng)先的中文網(wǎng)站分析工具。
2012 年,Doris 成長為百度首個公司級 OLAP 分析平臺并正式改名 PALO(OLAP 的反寫)。
2013 年,PALO 升級新一代 MPP 分布式架構(gòu)及高性能數(shù)據(jù)模型,各項核心技術(shù)指標大幅提升。
2017 年,PALO 正式對外開源。
2018 年,百度將 PALO 的核心引擎捐贈給 Apache 軟件基金會,并命名為 Apache Doris,百度 PALO 團隊開始全力推進 Doris 社區(qū)發(fā)展。
2020 年,在百度 PALO 團隊與社區(qū)伙伴的共同努力下,Apache Doris 社區(qū)走上發(fā)展快車道。
2021 年,Doris 各項核心能力大幅增強,行業(yè)影響力進一步提升,成為中國信通院 2021 年“OSCAR 尖峰開源項目及社區(qū)”,獲得“首批可信開源社區(qū)共同體(TWOS)”正式成員認證。
2022 年,百度正式完成商標捐贈,推進 Apache Doris 完成畢業(yè),成為 Apache 軟件基金會頂級項目。
SegmentFault:
我們看到 Doris 曾經(jīng)改名為 PALO(OLAP 的反寫),這個背后有著什么特別的寓意嗎?
百度 PALO 團隊:
2008 年,誕生之初,在百度內(nèi)部被命名為 Doris,大約在 2012-2013 年,Doris 進行過一次大的架構(gòu)改版升級,契合當時定位“解決高并發(fā),高實時的 OLAP 場景”,于是團隊將“OLAP”進行反寫,“PALO” 就此誕生,最終 PALO 也成了百度基于 Apache Doris 構(gòu)建的商業(yè)化數(shù)倉產(chǎn)品名字。
2018 年百度 PALO 團隊和百度負責開源的同事一起攜手將 PALO 項目捐贈給 Apache 軟件基金會(ASF),鑒于品牌及商標等問題的考量,最終把開源項目定名為 Apache Doris ,并把 Doris 的品牌和商標一并捐給了 ASF,正式成為 ASF 孵化項目。
SegmentFault:
作為曾經(jīng)百度內(nèi)部的高性能分析型數(shù)據(jù)庫,為什么會考慮把產(chǎn)品開源?
百度 PALO 團隊:
Doris 在 13 年設(shè)計新版時,已經(jīng)在百度內(nèi)部得到了復(fù)雜場景和高并發(fā)、大壓力的驗證,我們希望未來能將它開源出去,讓更多的人用到并獲益,同時希望通過開源的方式加速其成長。所以,在新版設(shè)計的時候,我們?nèi)サ袅税俣葍?nèi)部閉源庫及內(nèi)部系統(tǒng)的依賴,讓整個系統(tǒng)能夠獨立、自由運作。百度 PALO 團隊堅信未來基礎(chǔ)設(shè)施軟件必然會走開源路線,只有開源才能保持產(chǎn)品活力和迭代速度。
開源之初,我們的目標就是將 Doris 建設(shè)成為全球最優(yōu)秀的開源數(shù)據(jù)倉庫之一,所以,我們選擇了在 Apache 軟件基金會進行開源。眾所周知,Apache 軟件基金會在大數(shù)據(jù)領(lǐng)域的項目都極具影響力,比如 Hadoop 和 Spark 等大家耳熟能詳?shù)捻椖俊?/span>
從開源到現(xiàn)在,Apache Doris 的 Star 和 Contributor 數(shù)量都有了數(shù)倍,甚至數(shù)十倍的增長,尤其是從 2020 年開始,社區(qū)核心指標增長速度明顯加快,這也從側(cè)面反應(yīng)出,外界對 Apache Doris 項目的關(guān)注度和認可度在不斷增加。
下圖是來自 Star History 的數(shù)據(jù),可以看到 Apache Doris 從最初的 240 個Star,一路走來,到目前 Star 數(shù)已經(jīng)達到 4500 個。從圖上也可以看到近兩年,增長趨勢明顯加快。

下圖是來自 api7 的數(shù)據(jù),可以看到 Apache Doris Contributor 的數(shù)量從最初的 10 個左右,增長到現(xiàn)在的 330+,增長趨勢也在逐步加快,月度活躍貢獻者的數(shù)量已經(jīng)達到 80 個。


SegmentFault:
近兩年中國開源資本熱,在你們看來什么樣的軟件適合開源,什么樣的軟件適合閉源發(fā)展?
百度 PALO 團隊:
“開源”這兩年的確受到了資本熱捧,加之國家十四五規(guī)劃對“開源”的加持,熱度一再飆升。尤其是 Doris 所在的賽道,更是被稱為“黃金賽道”,這兩年前前后后誕生了十幾家創(chuàng)業(yè)公司,真可謂“雨后春筍,俯拾皆是”。
“資本”對開源的追捧和青睞,絕對不是因為“情懷”更不是因為“喜好”,他們更關(guān)注的是“開源”背后的“商業(yè)化”前景。資本對開源的助力,是資源的加持,這個加持可以讓開源項目發(fā)展更快,產(chǎn)品成熟更早。而基于開源而生的商業(yè)化產(chǎn)品才是其真正價值所在,要想持續(xù)得到資本“青睞”,開源背后的商業(yè)化產(chǎn)品,一定要切中付費用戶的需求和痛點,做出跟開源產(chǎn)品的差異化特色和競爭力,且要保持和開源產(chǎn)品良好的共生關(guān)系。
“開源”講求的是共建共享,一群人可以走的更遠,所以,我們認為那些“投入大,轉(zhuǎn)化周期長”的產(chǎn)品是比較適合開源的。Apache Doris 就是在這樣的背景下采取了開源路線,也正是通過開源,Doris 項目獲得了遠超單個公司的投入力度,以及大量用戶的使用和打磨,最終,也使得 Doris 的產(chǎn)品力和影響力得到了長足的發(fā)展。
SegmentFault:
從內(nèi)部工具到極速簡用的 MPP 開源數(shù)據(jù)庫,在產(chǎn)品層面 Doris 經(jīng)歷了怎樣的變化?
百度 PALO 團隊:
Doris 的產(chǎn)品定位叫做“為數(shù)據(jù)分析而生”,Doris 在產(chǎn)品層面的變化是伴隨著數(shù)據(jù)分析的場景變化而一起演進的,經(jīng)歷了四個發(fā)展階段:
第一階段是商業(yè)智能分析,注重通過數(shù)據(jù)來對業(yè)務(wù)進行描述與分析,這也是 Doris 誕生的階段。2008 年,Doris 在百度鳳巢誕生,本身就是為了解決報表問題,到了 2012 年,Doris 已經(jīng)成為百度的首個公司級 OLAP 平臺,承接整個公司的報表需求;
第二階段是海量數(shù)據(jù)分析,也就是在企業(yè)信息化和數(shù)字化普及之后,數(shù)據(jù)量大幅增加,數(shù)據(jù)庫要能夠處理相比之前十倍百倍的數(shù)據(jù)。2013 年,Doris 完成了 MPP 引擎改造,利用分布式能力,大幅度提升數(shù)據(jù)處理能力與效率,所能處理的數(shù)據(jù)量級提升到 TB 至 PB 級別,查詢時效性也有了一定提升;
第三階段是實時數(shù)據(jù)分析,在這一階段中,企業(yè)更加注重實時性和預(yù)測性分析,期望在海量數(shù)據(jù)下加速傳統(tǒng) T+1 模式的分析效率,獲得分鐘級甚至秒級的分析能力,這也正是近些年來 Doris 所解決的用戶核心痛點。自 2017 年開源至今,Doris 通過對存儲引擎、查詢引擎、查詢優(yōu)化器等各個核心模塊的優(yōu)化,不斷增強性能表現(xiàn),尤其是近期的向量化引擎,更是把性能全面加速了 5-10 倍,真正實現(xiàn)海量數(shù)據(jù)下的毫秒級查詢體驗;
第四階段是全民數(shù)據(jù)分析,在這一階段中,數(shù)據(jù)分析不再是數(shù)倉維護人員和數(shù)據(jù)分析師的“專利”,企業(yè)中的許多角色都有著自主數(shù)據(jù)分析的需求和能力,所有人都期望能夠快速地分析、使用數(shù)據(jù),獲取價值,這也是當前 Doris 正在處理和應(yīng)對的需求:一方面在查詢性能方面,Doris 要能夠支持更高并發(fā)與吞吐,提供更加多樣化的查詢能力,以應(yīng)對企業(yè)“全民數(shù)據(jù)分析”的場景需求;另一方面,Doris 更要提供低成本、低門檻的查詢分析手段,比如進一步提升自運維能力,提供開箱即用的數(shù)據(jù)分析體驗,幫助用戶更加關(guān)注業(yè)務(wù)與數(shù)據(jù)本身,而無需耗費過多精力在系統(tǒng)底層的部署運維工作。這一點在百度的商業(yè)版本 Palo 中有著更多體現(xiàn),我們充分利用云的彈性能力和容器化能力,為用戶提供近乎于 0 運維成本的集群托管服務(wù),不論是存儲計算資源擴縮容,還是云原生化的監(jiān)控調(diào)優(yōu)能力,都在幫助用戶以極低地成本與門檻,向全民分析時代飛速躍進。
木桶效應(yīng),Doris 強在每一塊木板都很均衡
SegmentFault:
Doris 在性能,功能豐富度和易用性上表現(xiàn)都非常出色,那么在您看來 Doris 最強的競爭力是什么?
百度 PALO 團隊:
Apache Doris 最強的競爭力在于能夠適應(yīng)全場景的業(yè)務(wù)需求,無論是聚合、明細、Ad-Hoc、單表、多表等各種數(shù)據(jù)分析的場景,Doris 都能比較好的支持。其次 Doris 在性能,功能豐富度和易用性上表現(xiàn)都非常出色,在性能上 Doris 經(jīng)過多年打磨,在各類場景都有極佳的性能表現(xiàn),尤其是近期向量化版本上線之后,性能又有了數(shù)倍的提升。Doris 集群能夠非常方便地實現(xiàn)動態(tài)擴縮容,當節(jié)點出現(xiàn)故障時數(shù)據(jù)自動遷移,這些都不依賴外部系統(tǒng),也不會影響上層業(yè)務(wù)系統(tǒng),集群運維非常簡單。另外 Doris 支持非常豐富的標準 SQL 語法,能夠完成各類復(fù)雜查詢?nèi)蝿?wù)。除了傳統(tǒng)的 AP 場景外,Doris 也提供高性能流式寫入能力及在線高并發(fā)訪問能力,可構(gòu)建現(xiàn)代 HSAP 架構(gòu)的數(shù)據(jù)服務(wù)。因此 Doris 是一個非常全面、成熟和易用的系統(tǒng),就像一個木桶,Doris 的每個一塊木板都很均衡,裝的水自然比較多。
SegmentFault:
常常有人討論性能與易用性的孰輕孰重,Doris 是如何平衡性能與易用性的關(guān)系的?
百度 PALO 團隊:
性能是 Apache Doris 內(nèi)核最重要的指標之一,也是業(yè)界對數(shù)據(jù)庫類產(chǎn)品進行評價的重要標準。所以,Doris 對性能的追逐一直沒有停止過,我們正在持續(xù)研發(fā)的向量化執(zhí)行引擎和新的優(yōu)化器都是性能提升的重要手段。同時簡單、易用以及穩(wěn)定、可靠都是 Doris 持續(xù)關(guān)注的重點,Doris 通過極簡的運維和豐富的功能被大家熟知和認可。
極致的性能可以幫用戶應(yīng)對復(fù)雜而苛刻的業(yè)務(wù)場景;簡單、易用可以讓整個系統(tǒng)搭建成本更低,運維更高效。所以性能和易用性二者并不沖突,更不是相互對立,我們在內(nèi)核層面追求極致的性能,并不影響我們在通過精巧的設(shè)計,將簡單好用的功能提供給用戶,我們會在用戶能夠感知的地方做大量的工作,使每一個特性都能滿足不同層次用戶的需求。
SegmentFault:
目前 Doris 最核心解決了客戶的哪些問題?比較常見應(yīng)用場景是什么?有沒有成熟的商業(yè)用例?
百度 PALO 團隊:
Doris 最核心地解決了客戶對于海量數(shù)據(jù)的高時效性分析需求,Doris 通過自身產(chǎn)品能力的建設(shè),在數(shù)據(jù)分析環(huán)節(jié)做到了性能更加高效、功能更加全面、運維更加簡單、生態(tài)更加豐富。
結(jié)合以往的經(jīng)驗,我們總結(jié)了 Doris 的四大應(yīng)用場景:
傳統(tǒng)數(shù)倉加速:在原有的傳統(tǒng)的單機式數(shù)據(jù)庫或者離線數(shù)據(jù)倉庫基礎(chǔ)上,增加高性能分析型數(shù)據(jù)庫能力,加速傳統(tǒng)數(shù)倉的查詢能力。
實時數(shù)倉構(gòu)建:構(gòu)建以實時數(shù)據(jù)為主的數(shù)據(jù)倉庫,支持端到端的實時數(shù)據(jù)分析,包括高時效的實時數(shù)據(jù)寫入與高性能的實時數(shù)據(jù)分析。
多源聯(lián)邦查詢:提供跨多數(shù)據(jù)源的統(tǒng)一查詢?nèi)肟?,以統(tǒng)一的一站式查詢能力滿足業(yè)務(wù)人員多元化的查詢需求。
交互式數(shù)據(jù)分析及在線數(shù)據(jù)服務(wù):提供高并發(fā)與高時效的在線查詢體驗,以極低的建設(shè)成本,高效的支持業(yè)務(wù)側(cè)報表、大屏或即席查詢等需求。
百度基于 Apache Doris 所構(gòu)建的商業(yè)化數(shù)據(jù)倉庫產(chǎn)品 Palo 自 2017 年 對外提供服務(wù)以來,在各行業(yè)均有落地實踐,積累了大量商業(yè)用例。
截至目前,已有近百家企業(yè)在使用 Palo 商業(yè)服務(wù)。比如我們在某頭部金融支付公司項目中,重點加強建設(shè)了 Palo 的多租戶能力,滿足企業(yè)各省、市子公司的數(shù)據(jù)與資源隔離需求;在某頭部聲學元件制造商項目中,充分利用了 Palo 在時序性數(shù)據(jù)方面的寫入和查詢能力,支持生產(chǎn)車間的設(shè)備數(shù)據(jù)分析與監(jiān)控;在與某互聯(lián)網(wǎng)頭部問答社區(qū)的合作中,我們針對客戶的廣告與畫像需求,對 bitmap 及相關(guān)用法做了重點優(yōu)化,為客戶內(nèi)容數(shù)據(jù)中臺建設(shè)提供了極大支持。
SegmentFault:
近兩年也有一些基于 Apache Doris 的外部的商業(yè)公司開始嶄露頭角,PALO 團隊怎么看開源和商業(yè)的關(guān)系?又怎樣看待這之間的競爭與合作?
百度 PALO 團隊:
我們很高興的看到有越來越多的公司開始參與 Apache Doris 項目的建設(shè),這說明項目得到了用戶、社區(qū)和資本市場的認可,可見,最初我們將 Doris 捐贈給 Apache 軟件基金會是非常正確的選擇。未來,隨著社區(qū)的持續(xù)發(fā)展,我們希望還會有越來越多的公司能夠加入,跟百度 PALO 攜手共建一個繁榮和強大的開源軟件生態(tài)。
當然,我們也看到,過去確實有一些商業(yè)驅(qū)動的不良行為對社區(qū)帶來了損害。因此,作為 Apache Doris 的主創(chuàng)團隊,我們會堅定的維護好社區(qū)的秩序,確保社區(qū)的參與者都能夠遵守 Apache Way 行為規(guī)范,從而促進社區(qū)的健康可持續(xù)發(fā)展。
當前,大量底層技術(shù)產(chǎn)品都采用開源模式,客戶也越來越認可開源的模式,“是否開源”正在成為很多客戶進行商業(yè)決策的重要依據(jù);另一方面,開源社區(qū)能夠幫助我們構(gòu)建堅實的用戶基礎(chǔ),以及廣泛和正面的品牌認知,從而促進我們商業(yè)化的發(fā)展。所以,對于未來的技術(shù)產(chǎn)品,開源可能成為必須,這個“必須”不一定損害商業(yè)模式,反而會促進商業(yè)上的成功。
在“大廠”做開源,收獲更多的是“詩”和“遠方”
SegmentFault:
Doris 從捐贈、孵化到畢業(yè)也經(jīng)歷了接近 4 年的時間,在這期間團隊有沒有遇到過一些困難,是如何解決的?對于剛剛開源還在孵化中的項目有沒有一些建議?
百度 PALO 團隊:
Apache Doris 從捐贈到今天順利畢業(yè)已經(jīng)接近 4 年,這期間的確遇到了非常多的曲折,在這里著重跟大家分享幾點。
一是團隊內(nèi)部價值呈現(xiàn)和資源沖突的問題。開源讓 Doris 項目得到了快速發(fā)展,同時也給團隊帶來了額外工作量,團隊需要維護兩套代碼(開源產(chǎn)品 Doris 和商業(yè)化產(chǎn)品 Palo ),團隊需要平衡在兩個產(chǎn)品上的投入力度,同時還要跟公司講清楚這兩部分工作的價值及關(guān)系,直接地、間接地、甚至是隱藏在背后的無形價值。
其實這個問題的解決,最重要的是團隊對于“收益”的重新定義,開源的收獲,不止是反饋到績效和晉升上,它也會幫助團隊構(gòu)建在社區(qū)乃至行業(yè)中的影響力。這個過程帶來的成長,要比在一個公司中開發(fā)閉源產(chǎn)品來的更快、更多——正所謂:“海闊憑魚躍,天高任鳥飛”,開源給團隊帶來了“?!焙汀疤臁?/strong>。
在做好開源的同時,團隊也要規(guī)劃好商業(yè)產(chǎn)品的發(fā)展,給公司帶來商業(yè)收益,并且要把開源對商業(yè)化的正向作用向公司呈現(xiàn),這樣就會持續(xù)得到公司的支持,形成正循環(huán)。
第二個困難是由于沒有經(jīng)驗,我們走了一些彎路。最初大家對開源的認知有限,一開始什么都缺,什么都要從頭開始摸索,包括物料準備,包括意識和經(jīng)驗的積累,都是跌跌撞撞,一步步摸索過來的。從 Apache Doris 官網(wǎng)的建設(shè),到官方公眾號的運營,再到渠道生態(tài)體系的構(gòu)建,以及開源和商業(yè)化關(guān)系的梳理等等,我們經(jīng)歷了諸多艱辛與挑戰(zhàn),還好大家一起堅持下來了。
前期我們在內(nèi)容建設(shè)上,稍不留神,就容易越過“開源”的界限,摻雜“商業(yè)化”氣息,還好有 Apache 導師隨時幫我們指出問題,及時糾正。
這一點,我們團隊給出的建議是,項目一開始就想清楚團隊搞開源的最終目的是什么,“以終為始”,這樣路徑執(zhí)行上就不會有太多搖擺,資源投入也不會斷檔。同時要把開源和商業(yè)化嚴格區(qū)分開來(包括產(chǎn)品形態(tài)和運營模式),盡量在社區(qū)中不要摻雜私心,多跟項目導師溝通,他們有經(jīng)驗,而且比較中立,聽他們的,不會錯。
第三個困難是一些外部商業(yè)因素對項目的干擾。作為一個 Apache 的開源項目,Doris 并不排斥商業(yè)公司的使用和參與,然而,一些純商業(yè)利益驅(qū)動的不良行為并不符合 Apache Way,會對社區(qū)帶來損害。因此,對于正在考慮開源孵化的項目,前期除了選好協(xié)議及孵化組織外,我們建議還要做好對于項目名字和品牌的保護。像商標注冊之類的工作一定要做在前面,如果在孵化過程中遇到侵權(quán)等問題,要及時跟項目導師和公司法務(wù)溝通,必要時要動用法律手段,以保護社區(qū)的健康發(fā)展。
SegmentFault:
你們?nèi)绾卫斫?The Apache Way 的?
百度 PALO 團隊:
關(guān)于對 The Apache Way 的理解,可以參考 Sally老師 在 Apache 軟件基金會官方微博的一篇文章,有興趣的可以直接讀一下原文:
https://blogs.apache.org/foundation/entry/the-apache-way-to-sustainable
Apache 軟件基金會工作的重點,不是生產(chǎn)軟件,而是指導產(chǎn)出軟件的社區(qū),這個指導方法我們可以理解為就是 Apache Way,它是在實踐中不斷完善和成長的開源社區(qū)發(fā)展指導手冊,有了它個人或者組織就可以了解大規(guī)模開源軟件如何在激烈的競爭市場中進行良好運作。
The Apache Way 的核心原則是 “社區(qū)大于代碼”,它更多強調(diào)的是“人”,是“生態(tài)”,健康的社區(qū)才能孕育優(yōu)秀的代碼,畢竟人才是核心生產(chǎn)力,有了遵從規(guī)則的優(yōu)秀開發(fā)者,不愁沒有優(yōu)秀的代碼產(chǎn)出。一個健康的社區(qū)總能糾正代碼的問題,而一個不健康的社區(qū)難以保持代碼庫的正常維護,而 Apache Way 就是保護一個社區(qū)在 20 年后還能健康繁榮的“法律框架”,違背它就要接受“懲罰”。
Apache Way 是完全包容、開放、透明和基于共識的。它確保來自商業(yè)公司的參與者中立,以防止來自單個公司的不當影響(或控制)。它確保任何具有寶貴貢獻的個人都有權(quán)獲得授權(quán),并且盡管社區(qū)成員資格隨著時間的推移不可避免地發(fā)生變化,但它仍會確保項目有可持續(xù)性。
畢業(yè)成為頂級項目,Apache Doris 駛向星辰大海
SegmentFault:
從 Apache 孵化器畢業(yè)意味著,Apache Doris 將開始新的征程,展望未來,Doris 有怎樣的發(fā)展規(guī)劃(社區(qū)、產(chǎn)品、商業(yè))?
百度 PALO 團隊:
畢業(yè)意味著新的開始,也意味著新的責任,我們將一如既往地全力支持和貢獻社區(qū),把我們在實踐中所收獲的產(chǎn)品能力與社區(qū)分享,與社區(qū)的小伙伴一道將 Apache Doris 建設(shè)的更加完善,也讓更多人能體驗到 Doris 的優(yōu)秀能力。
在產(chǎn)品技術(shù)方面,我們將持續(xù)打磨 Doris 的核心能力,保持核心技術(shù)指標的領(lǐng)先。其中,在性能方面,我們將全方位的打磨或重構(gòu)現(xiàn)有的查詢層、執(zhí)行層和存儲層等核心組件,尤其是社區(qū)呼聲最高的向量化和優(yōu)化器,我們將實現(xiàn)完全的面向列的向量化執(zhí)行引擎,全面淘汰行存,同時,我們將實現(xiàn)全新的 CBO 優(yōu)化器以及更加精細和豐富的統(tǒng)計信息,這將把 Doris 的性能進一步推向極致。在穩(wěn)定性和可觀測性方面,我們將重點補齊 Doris 的短板,強化 Doris 的 Profiling、Trouble Shooting、細粒度的資源監(jiān)測和管控等能力,我們也將會持續(xù)將我們在大規(guī)模生產(chǎn)環(huán)境所遇到的各種穩(wěn)定性問題及解決方案貢獻到社區(qū),進而幫助 Doris 變得更加穩(wěn)定。我們也將持續(xù)完善 Doris 的各項重要功能以及生態(tài)對接能力,其中就包括對復(fù)雜類型的內(nèi)置支持、UDF/UDAF 的優(yōu)化、Hadoop/Spark 生態(tài)圈對接能力完善、數(shù)據(jù)湖和聯(lián)邦查詢能力的強化、管控平臺的完善等社區(qū)呼聲最高的功能,從而幫助 Doris 變得更加強大和易用。除此之外,Doris 仍然有很多值得完善的地方,我們十分愿意傾聽用戶的心聲,并歡迎大家多提 issues,與我們一道幫助 Doris 發(fā)展的更好。
在社區(qū)建設(shè)方面,Apache Doris 已經(jīng)度過了早期萌芽階段,正在進入高速發(fā)展期。一方面,我們要進一步強化社區(qū)的運營投入,讓 Doris 能被更多的貢獻者、開發(fā)者以及用戶等所知道,努力構(gòu)建一個多元、繁榮和國際化的社區(qū);另一方面,隨著社區(qū)的擴張,以及商業(yè)訴求的增長,我們將建立或完善社區(qū)的各項規(guī)章制度和行為準則,讓各方都能在 Apache Way 的指導下參與社區(qū),保障 Doris 社區(qū)能夠良性和健康的發(fā)展。
在商業(yè)方面,我們也在圍繞 Apache Doris 持續(xù)完善我們的商業(yè)產(chǎn)品“PALO 數(shù)據(jù)倉庫”。相比開源的 Doris 引擎,PALO 數(shù)據(jù)倉庫將提供大規(guī)模生產(chǎn)級的穩(wěn)定性、完善的企業(yè)級特性、易用的管控和訪問平臺、無感升級等專有特性,用戶也將享受到來自原廠資深專家的專業(yè)技術(shù)支持服務(wù)。除此之外,我們?nèi)峦瞥龅?PALO Cloud 產(chǎn)品將支持先進的多云原生能力,提供完善的云原生,以及多云和跨云能力,幫助用戶擁抱云和多云時代。同時,PALO Cloud 的在離線融合、湖倉融合等能力將幫助用戶構(gòu)建以數(shù)據(jù)為中心的新一代全場景統(tǒng)一湖倉,為企業(yè)提供數(shù)據(jù)的統(tǒng)一視圖、統(tǒng)一訪問,真正釋放數(shù)據(jù)的價值,正如 PALO 的寓意那樣能夠“玩轉(zhuǎn) OLAP”。
https://blogs.apache.org/foundation/entry/the-apache-software-foundation-announces81 https://doris.apache.org/ https://github.com/apache/incubator-doris
