阿里云-Databricks 數(shù)據(jù)洞察
Databricks數(shù)據(jù)洞察是基于Apache Spark的全托管數(shù)據(jù)分析平臺, 內(nèi)核采用更高效、穩(wěn)定的商業(yè)版Databricks Runtime和Delta Lake。可同時滿足數(shù)據(jù)分析師、數(shù)據(jù)開發(fā)工程師和數(shù)據(jù)科學(xué)家的分析需求,實(shí)現(xiàn)協(xié)同合作和數(shù)據(jù)共享。滿足用戶在大數(shù)據(jù)下對數(shù)據(jù)湖分析、實(shí)時數(shù)倉、離線數(shù)倉、BI數(shù)據(jù)分析、AI機(jī)器學(xué)習(xí)等場景需求。
產(chǎn)品優(yōu)勢:
極致性能
Databricks Runtime內(nèi)核,性能明顯優(yōu)于社區(qū)版Spark,最高可達(dá)50倍提升。滿足高性能、高穩(wěn)定性、可彈性的計(jì)算需求。
批流一體
Databricks Delta Lake為數(shù)據(jù)湖分析提供了ACID事務(wù)能力,輕松處理包含數(shù)十億文件的PB級表的元數(shù)據(jù)信息,實(shí)現(xiàn)了批流一體的數(shù)據(jù)處理方式。
協(xié)同分析
同時滿足數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師以及業(yè)務(wù)分析師的計(jì)算需求,提供交互式的協(xié)同分析工作平臺。
數(shù)據(jù)共享
計(jì)算存儲分離,減少數(shù)據(jù)冗余,實(shí)現(xiàn)多引擎間的數(shù)據(jù)共享,降低數(shù)據(jù)存儲成本,內(nèi)置對OSS的訪問性能優(yōu)化。
