FinOps Crane云原生成本優(yōu)化開源項目
為推進云原生用戶在確保業(yè)務穩(wěn)定性的基礎上做到真正的極致降本,騰訊推出了國內第一個基于云原生技術的成本優(yōu)化開源項目 Crane( Cloud Resource Analytics and Economics )。Crane 遵循 FinOps 標準,旨在為云原生用戶提供云成本優(yōu)化一站式解決方案。
當前 Crane 項目主要貢獻者包括有騰訊、小紅書、谷歌、eBay、微軟、特斯拉等知名公司的行業(yè)專家。
符合 FinOps 標準的 Crane 成本優(yōu)化工具能力模型
Crane 是騰訊內部云資源優(yōu)化流程方法和工具的系統(tǒng)性輸出,同時,Crane核心能力的構建與規(guī)劃均與 FinOps 基金會提出的能力模型完全契合。
Crane 架構與特性
Crane 致力于推薦資源和智能彈性配置,業(yè)務人員無需再為業(yè)務需要多少資源,自動擴縮容應該如何配置等問題而煩惱,Crane 會基于業(yè)務的時序變動數據給出最優(yōu)解。
一鍵部署
Crane 保持平臺獨立,通過一個 Helm 包將 Crane 安裝至任意 Kubernetes 集群,無論云上還是云下,即可享受一站式資源優(yōu)化能力。Crane 侵入性小,核心組件包括集中控制器 craned 和節(jié)點代理 crane agent,你可以自由組合安裝,通過 featureGate 選擇開啟哪些能力。
簡單易用可視化控制臺
為降低使用門檻,Crane 提供內置控制臺,用戶可基于控制臺查看成本分配,成本走勢,并通過鼠標點擊實現(xiàn)成本優(yōu)化。所有能力均提供灰度控制和預覽模式,以及回滾的能力,以消除業(yè)務側對資源變動的顧慮。
開箱即用的巡檢能力
Crane 可以全局掃描整體浪費情況,將隱藏浪費可視化的呈現(xiàn)出來,使運維人員免除拉取監(jiān)控數據,編寫查詢腳本等重復性工作。
優(yōu)化方案包含對成本變化的展示,對利用率變化的展示,可能的風險點,甚至是優(yōu)化建議的排序。因為我們相信,每個業(yè)務都是獨一無二的,都有其最適合的優(yōu)化方案,不能一概而論。
即時迅速的彈性 (EffectivePodAutoscaler(EPA))
傳統(tǒng)基于事件的彈性工具會導致一個天然缺陷——當業(yè)務指標偏離正常值后才會觸發(fā)彈性,這種滯后性使得云用戶不敢使用彈性。EPA 支持可擴展的預測算法,以預測結果驅動橫向和縱向彈性,確保業(yè)務能提前彈出來,徹底避免原生彈性能力未彈先死的尷尬。同時 Crane 將社區(qū)的 HPA 和 VPA 兩種彈性能力統(tǒng)一起來,提出了彈性概念 EPA。
穩(wěn)定性與資源優(yōu)化的雙重兼
Crane 對資源利用率的提升,絕不是以犧牲穩(wěn)定性作為代價。Crane 允許用戶對業(yè)務進行定級,節(jié)點代理負責周期性檢查節(jié)點資源水位和系統(tǒng)指標,識別應用干擾,并通過調度禁止,調整 cgroup,驅逐等多種手段確保敏感業(yè)務服務等級不受損。
