Klever機器學(xué)習(xí)平臺
Klever 是一個支持 OCI(Open Container Initiative)標(biāo)準(zhǔn)存儲訓(xùn)練模型、支持在線模型服務(wù)部署的云原生機器學(xué)習(xí)平臺。由字節(jié)跳動基礎(chǔ)架構(gòu)團(tuán)隊研發(fā)。基于字節(jié)跳動在機器學(xué)習(xí)和云原生開源社區(qū)的技術(shù)積累,Klever 提供通用的開源技術(shù)標(biāo)準(zhǔn),方便企業(yè)無縫遷移線上應(yīng)用。
目前機器學(xué)習(xí)平臺 Klever 率先實現(xiàn)的是從模型倉庫到模型服務(wù)的自動化管理。
Klever 有三大特性。
首先,通過與 Harbor 結(jié)合,它可以滿足 OCI 標(biāo)準(zhǔn)的模型倉庫管理,用戶可以像使用 Docker 管理鏡像一樣管理機器學(xué)習(xí)模型。
其次,整個系統(tǒng)可通過容器化的方式部署在 Kubernetes 容器管理平臺之上,用戶無需管理模型解析、模型轉(zhuǎn)換、模型服務(wù)實際運行在哪臺物理機之上,系統(tǒng)會自動調(diào)度和運行資源充足的機器,并在模型服務(wù)負(fù)載較高時自動彈性伸縮。
最后,由于機器學(xué)習(xí)在不同訓(xùn)練過程中往往使用不同的數(shù)據(jù)集,會產(chǎn)生不同的模型,Klever 支持多種模型服務(wù)運行時,可將產(chǎn)生的模型用于提供生產(chǎn)環(huán)境可用的在線服務(wù)。
評論
圖片
表情
