HappyHadoop的Jython封裝
Hadoop + Python = Happy
Happy 為Jython開(kāi)發(fā)者使用Hadoop框架提供了便利,Happy框架封裝了Hadoop的復(fù)雜調(diào)用過(guò)程,讓Map-Reduce開(kāi)發(fā)變得更為容易。Happy中的Map-Reduce作業(yè)過(guò)程在子類(lèi)happy.HappyJob中定義,當(dāng)用戶(hù)創(chuàng)建類(lèi)實(shí)例后,設(shè)置作業(yè)任務(wù)的輸入輸出參數(shù),然后調(diào)用run()方法即可啟動(dòng)分治規(guī)約處理,此時(shí),Happy框架將序列化用戶(hù)的作業(yè)實(shí)例,并將任務(wù)及相應(yīng)依賴(lài)庫(kù)拷貝到Hadoop集群執(zhí)行。目前,Happy框架已被數(shù)據(jù)集成站點(diǎn)freebase.com采納,用于進(jìn)行站點(diǎn)的數(shù)據(jù)挖掘與分析工作。
評(píng)論
圖片
表情
