主流云數(shù)倉性能對(duì)比分析

——威爾·杜蘭特(哲學(xué)家、歷史學(xué)家)





?











在性能方面,無論是單進(jìn)程還是并發(fā)方式,Redshift都是表現(xiàn)最好的,Synapse其次。
在并發(fā)性能方面,Snowflake和BigQuery似乎沒有Redshift和Synapse控制得好。
性價(jià)比方面,Redshift和Synapse差不多,BigQuery最貴。
本次測(cè)試主要只是性能對(duì)比,不涉及功能、安全性、擴(kuò)展性、高可用、備份、生態(tài)等等其它方面,有一定局限性。
Snowflake和BigQuery在市場(chǎng)上的宣傳一直都是強(qiáng)調(diào)其易用性和易管理性(無需DBA),這方面在本次測(cè)試中沒有涉及。
本次測(cè)試采用的TPC-H模型可能是為了遷就Actian而選擇,相對(duì)簡(jiǎn)單,無法完全反映真實(shí)環(huán)境中的各種復(fù)雜負(fù)載和ad-hoc查詢,另外5并發(fā)也相對(duì)較低。

當(dāng)今各云數(shù)倉版本迭代都很快,功能上Snowflake、Redshift、Synapse、BigQuery都已經(jīng)很接近,而且大家都在互相學(xué)習(xí),比如存儲(chǔ)計(jì)算分離、按需彈性擴(kuò)展、數(shù)據(jù)共享與交換、對(duì)象存儲(chǔ)集成等等, 90%的功能大家都雷同,只是在技術(shù)細(xì)節(jié)的實(shí)現(xiàn)上各有不同。
Snowflake與其它3家不大相同,它為獨(dú)立的第三方,有跨云部署的優(yōu)勢(shì)。但它底層還需要依賴第三方云廠商的基礎(chǔ)架構(gòu),比如AWS、GCP、Azure,隨著這些廠商自身云數(shù)倉服務(wù)的發(fā)展,這種合作關(guān)系可能未來可能會(huì)變得越來越微妙。
易用性和易管理性是未來各云數(shù)倉的發(fā)展重點(diǎn),Snowflake開了個(gè)好頭,其它各廠商都緊密跟進(jìn),今后可能真的沒有DBA這個(gè)職業(yè)了。
未來云數(shù)倉或云數(shù)據(jù)庫,更多的優(yōu)化可能會(huì)與底層專有硬件或網(wǎng)絡(luò)相結(jié)合,比如CPU、GPU、FPGA、專有協(xié)議等等,這些是云廠商自研產(chǎn)品的優(yōu)勢(shì),而像Snowflake、Actian、ClickHouse等第三方平臺(tái)是無法做到的。所以,易用性、通用性和性能本身就是一對(duì)矛盾的共同體,客戶可以按照自己的實(shí)際需求來權(quán)衡、選擇。
來源:肉眼品世界
版權(quán)申明:內(nèi)容來源網(wǎng)絡(luò),版權(quán)歸原創(chuàng)者所有。除非無法確認(rèn),我們都會(huì)標(biāo)明作者及出處,如有侵權(quán)煩請(qǐng)告知,我們會(huì)立即刪除并表示歉意。謝謝!

