CoronaHadoop作業(yè)調(diào)度管理系統(tǒng)
Corona是Map-Reduce的改進(jìn)版本,可以更好地利用集群資源,更適合Facebook的“多租戶(Multi-Tenant)”環(huán)境。
在Facebook,Map-Reduce有一個單一的作業(yè)跟蹤器(JobTracker),用來管理集群資源和跟蹤每個作業(yè)的狀態(tài)。而使用Corona,集群資源通過一個中央集群管理器來跟蹤,每個作業(yè)都有自己的跟蹤器,這些跟蹤器只需跟蹤一個作業(yè)。
Corona在Map-Reduce的基礎(chǔ)上進(jìn)行了如下改進(jìn):
- 可擴(kuò)展性:單獨(dú)的Corona JobTrackers來負(fù)責(zé)任務(wù)的跟蹤,這為作業(yè)的數(shù)量和規(guī)模提供了更好的擴(kuò)展性。
- 延遲:任務(wù)調(diào)度工作在push模型中。Corona Job Tracker推送資源請求到Cluster Manager,然后在收到Cluster Manager的許可后,推送任務(wù)到Corona Task Tracker。這種調(diào)度決策是在收到heartbeats時發(fā)生,對于小的作業(yè)來說,heartbeat模型相關(guān)的延遲就變得重要。
- 與Map-Reduce v1相比,Corona中的Fair Scheduler能更好地分配資源到資源池中。
- 由于調(diào)度開銷較低,集群可以得到更好的利用。
中文介紹內(nèi)容來自 iteye
評論
圖片
表情
