<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          DPark分布式計(jì)算框架

          聯(lián)合創(chuàng)作 · 2023-10-01 06:34

          DPark 是 Spark 的 Python 克隆,是一個(gè)Python實(shí)現(xiàn)的分布式計(jì)算框架,可以非常方便地實(shí)現(xiàn)大規(guī)模數(shù)據(jù)處理和迭代計(jì)算。 DPark 由豆瓣實(shí)現(xiàn),目前豆瓣內(nèi)部的絕大多數(shù)數(shù)據(jù)分析都使用DPark 完成,正日趨完善。

          示例代碼:

           import dpark
           file = dpark.textFile("/tmp/words.txt")
           words = file.flatMap(lambda x:x.split()).map(lambda x:(x,1))
           wc = words.reduceByKey(lambda x,y:x+y).collectAsMap()
           print wc

          該代碼可以在本地和 Mesos 集群上運(yùn)行:

          $ python wc.py
          $ python wc.py -m process
          $ python wc.py -m host[:port]
          瀏覽 20
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久久大香蕉精品在线 | 97人操| 香蕉福利在线观看 | 成人色情黄色电影 | 亚洲视频欧美色图 |