<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          用Python繪制誘人的桑基圖,一眼看透熬夜和狗糧的秘密...

          共 4421字,需瀏覽 9分鐘

           ·

          2021-04-09 12:40

          最近,不止一次收到群里小伙伴的截圖追問:



          “這個圖叫什么???”


          “這個圖真好看!!!怎么畫啊?”


          小z本沒有干貨,問的人多了,也便有了干貨。


          此圖姓桑名基,平素不喜露面。奈何天生麗質,偶有露面,必引眾人圍觀。



          時人有云:“桑基桑基,高貴美麗!”



          桑基是何許圖也


          據(jù)小z不嚴謹?shù)某闃犹釂柦y(tǒng)計,90%想學習桑基圖的旁友,都是被她妖艷炫酷的外表所吸引。


          而桑基圖真正代表了什么?和類似圖表相比的獨特性是什么?卻幾乎無人問津。


          害!人真的是視覺動物!

          言歸正傳,我們來看看百科的官方解釋:


          桑基圖(Sankey diagram),即桑基能量分流圖,也叫桑基能量平衡圖。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數(shù)據(jù)流量的大小,通常應用于能源、材料成分、金融等數(shù)據(jù)的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪制的"蒸汽機的能源效率圖"而聞名,此后便以其名字命名為"桑基圖"。


          Emmm,有點內個意思了,結合其他資料,做進一步的匯總提煉:


          • 桑基兩個字取自“發(fā)明”者的名字

          • 屬于流程圖的一種,核心在于展示數(shù)據(jù)的流轉

          • 主要由節(jié)點、邊和流量三要素構成,邊越寬代表流量越大

          • 遵循守恒定律,無論怎么流動,開端和末端數(shù)據(jù)總是一致的


          文字太蒼白,下面我們用Python來繪制一個具體的實例~



          Python手把手繪制桑基圖


          動手之前,我們再次敲黑板,回顧桑基圖組成要素的重點——節(jié)點、邊和流量。


          任何桑基圖,無論展現(xiàn)形式如何夸張,色彩如何艷麗,動效如何炫酷,本質都逃不出上述3點。


          只要我們定義好上述3個要素,Python的pyecharts庫能夠輕松實現(xiàn)桑基圖的繪制。


          這里我們用“當代青年熬夜原因分析”數(shù)據(jù)為例:

          數(shù)據(jù)來源:這個數(shù)據(jù)是小z近兩周賣炒粉時口頭做的調研




          很規(guī)整的性別、熬夜原因、人數(shù)三列數(shù)據(jù)。


          不過,要用pyecharts來畫圖,得入鄉(xiāng)隨俗,按照它定的規(guī)則來規(guī)整數(shù)據(jù)源。


          首先是節(jié)點,這一步需要把所有涉及到的節(jié)點去重規(guī)整在一起。也就是要把性別一列的“男”、“女”和熬夜原因一列的“打游戲”、“加班”、“看劇”以列表內嵌套字典的形式去重匯總:





          接著,定義邊和流量,數(shù)據(jù)從哪里流向哪里,流量(值)是多少,循環(huán)+字典依然可以輕松搞定:





          source-target-value的字典格式,很清晰的描述了數(shù)據(jù)的流轉情況。


          這兩塊數(shù)據(jù)準備完畢,桑基圖已經(jīng)完成了80%,剩下的20%,只是固定格式的繪圖代碼:



          from pyecharts.charts import Sankey
          from pyecharts import options as opts

          pic = (
              Sankey()
              .add(''#圖例名稱
                   nodes,    #傳入節(jié)點數(shù)據(jù)
                   linkes,   #傳入邊和流量數(shù)據(jù)
                   #設置透明度、彎曲度、顏色
                   linestyle_opt=opts.LineStyleOpts(opacity = 0.3, curve = 0.5, color = "source"),
                   #標簽顯示位置
                   label_opts=opts.LabelOpts(position="right"),
                   #節(jié)點之前的距離
                   node_gap = 30,
              )
              .set_global_opts(title_opts=opts.TitleOpts(title = '熬夜原因桑基圖'))
          )

          pic.render('test.html')


          一個回車下去,看看成果:




          果然,男打游戲女看劇,加班熬夜是兒戲。


          如果想要垂直顯示,只需要在add函數(shù)里面加一個orient="vertical"就好:



          pic = (
              Sankey()
              .add('',
                   nodes,
                   linkes,
                   linestyle_opt=opts.LineStyleOpts(opacity = 0.3, curve = 0.5, color = "source"),
                   label_opts=opts.LabelOpts(position="top"),
                   node_gap = 30,
                   orient="vertical",   #更改的是這里
              )
              .set_global_opts(title_opts=opts.TitleOpts(title = '熬夜原因細分桑基圖'))
          )

          pic.render('test2.html')





          OK!不過,還有同學意猶未盡,這個是涉及到兩層的流轉,那如果三層,需要怎么畫呢?


          不慌,先導入(狗糧)數(shù)據(jù):





          這是某寵物品牌,3月份主要產(chǎn)品購買路徑(第一次和第二次)的數(shù)據(jù),先是品類,其次是第一次購買的產(chǎn)品類型,接著是第二次購買的產(chǎn)品類型,最后一列對應人數(shù)。

          注:這里第一次購買的產(chǎn)品前面加了“1-”,第二次購買加了“2-”的區(qū)分標識。


          畫圖必備的nodes節(jié)點實現(xiàn)很簡單,所有節(jié)點(品類、第一次購買、第二次購買)做去重匯總,對上面生成nodes代碼稍作調整就可以:





          而linkes只接受source-traget-value的格式,得先對源數(shù)據(jù)進行格式調整,分別形成“品類-第一次購買-人數(shù)”,“第一次購買-第二次購買-人數(shù)”的樣式,再統(tǒng)一匯總:





          規(guī)整匯總好之后,只需要復用上面的linkes代碼:





          畫圖代碼幾乎沒變,只是改了個標題:



          pic = (
              Sankey()
              .add('',
                   nodes,
                   linkes,
                   linestyle_opt=opts.LineStyleOpts(opacity = 0.3, curve = 0.5, color = 'source'),
                   label_opts=opts.LabelOpts(position = 'top'),
                   node_gap = 30,
              )
              .set_global_opts(title_opts=opts.TitleOpts(title = '客戶購買路徑流轉圖'))
          )
          pic.render('test3.html')



          大功告成,So easy!無論是多少層數(shù)據(jù)的流轉,只要定義好nodes和linkes,就能以不變應萬變。



          最后,通過上面的桑基圖,我們能夠非常直觀的洞察到客戶購買流轉規(guī)律:


          • 出于試錯成本的考量,大部分客戶第一次購買的是小規(guī)格狗糧。

          • 第一次購買小規(guī)格狗糧的客戶,流失(第二次未購買)情況嚴重,且再次購買客戶,更傾向于繼續(xù)選擇小規(guī)格狗糧嘗試,而不是信任性的購買大規(guī)格狗糧。

          • 第一次購買大規(guī)格狗糧的客戶,留存下來的客戶已經(jīng)建立起對品牌的信任感,再次購買大部分選擇了大規(guī)格狗糧。

          • 購買狗糧的客戶第二次復購鮮有嘗試玩具的,而第一次購買玩具的客戶,也并未建立起對品牌狗糧的興趣。


          原本死板的數(shù)據(jù),在桑基的裝扮之下,變得楚楚動人。


          瀏覽 68
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲日韩人妻蜜臀专区无码 | 中文字幕手机在线观看 | www三级网站 | 免费在线观看AⅤ | 96精品秘 无码一区二区 |