<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          使用Plotly繪制常見5種動態(tài)交互式圖表

          共 6118字,需瀏覽 13分鐘

           ·

          2022-03-09 16:25

          來源:機器之心
          數(shù)據(jù)可以幫助我們描述這個世界、闡釋自己的想法和展示自己的成果,但如果只有單調(diào)乏味的文本和數(shù)字,我們卻往往能難抓住觀眾的眼球。而很多時候,一張漂亮的可視化圖表就足以勝過千言萬語。本文將介紹 5 種基于 Plotly 的可視化方法,你會發(fā)現(xiàn),原來可視化不僅可用直方圖和箱形圖,還能做得如此動態(tài)好看甚至可交互。
          對數(shù)據(jù)科學(xué)家來說,講故事是一個至關(guān)重要的技能。為了表達(dá)我們的思想并且說服別人,我們需要有效的溝通。而漂漂亮亮的可視化是完成這一任務(wù)的絕佳工具。本文將介紹?5 種非傳統(tǒng)的可視化技術(shù),可讓你的數(shù)據(jù)故事更漂亮和更有效。這里將使用 Python 的 Plotly 圖形庫(也可通過 R 使用),讓你可以毫不費力地生成動畫圖表和交互式圖表。

          dd04f026d502da540cf834e71d2aa409.webp

          那么,Plotly 有哪些好處?Plotly 的整合能力很強:可與 Jupyter Notebook 一起使用,可嵌入網(wǎng)站,并且完整集成了 Dash——一種用于構(gòu)建儀表盤和分析應(yīng)用的出色工具。

          啟動
          如果你還沒安裝 Plotly,只需在你的終端運行以下命令即可完成安裝:
          pip?install?plotly

          安裝完成后,就開始使用吧!
          動畫
          在研究這個或那個指標(biāo)的演變時,我們常涉及到時間數(shù)據(jù)。Plotly 動畫工具僅需一行代碼就能讓人觀看數(shù)據(jù)隨時間的變化情況,如下圖所示:

          49926237ffafbfff157f890c19ec9bde.webp


          代碼如下:
          import?plotly.express?as?px
          from?vega_datasets?import?data
          df?=?data.disasters()
          df?=?df[df.Year?>?1990]
          fig?=?px.bar(df,
          ?????????????y="Entity",
          ?????????????x="Deaths",
          ?????????????animation_frame="Year",
          ?????????????orientation='h',
          ?????????????range_x=[0,?df.Deaths.max()],
          ?????????????color="Entity")
          #?improve?aesthetics?(size,?grids?etc.)
          fig.update_layout(width=1000,
          ??????????????????height=800,
          ??????????????????xaxis_showgrid=False,
          ??????????????????yaxis_showgrid=False,
          ??????????????????paper_bgcolor='rgba(0,0,0,0)',
          ??????????????????plot_bgcolor='rgba(0,0,0,0)',
          ??????????????????title_text='Evolution?of?Natural?Disasters',
          ??????????????????showlegend=False)
          fig.update_xaxes(title_text='Number?of?Deaths')
          fig.update_yaxes(title_text='')
          fig.show()

          只要你有一個時間變量來過濾,那么幾乎任何圖表都可以做成動畫。下面是一個制作散點圖動畫的例子:
          import?plotly.express?as?px
          df?=?px.data.gapminder()
          fig?=?px.scatter(
          ????df,
          ????x="gdpPercap",
          ????y="lifeExp",
          ????animation_frame="year",
          ????size="pop",
          ????color="continent",
          ????hover_name="country",
          ????log_x=True,
          ????size_max=55,
          ????range_x=[100,?100000],
          ????range_y=[25,?90],

          ????#???color_continuous_scale=px.colors.sequential.Emrld
          )
          fig.update_layout(width=1000,
          ??????????????????height=800,
          ??????????????????xaxis_showgrid=False,
          ??????????????????yaxis_showgrid=False,
          ??????????????????paper_bgcolor='rgba(0,0,0,0)',
          ??????????????????plot_bgcolor='rgba(0,0,0,0)')


          太陽圖
          太陽圖(sunburst chart)是一種可視化 group by 語句的好方法。如果你想通過一個或多個類別變量來分解一個給定的量,那就用太陽圖吧。
          假設(shè)我們想根據(jù)性別和每天的時間分解平均小費數(shù)據(jù),那么相較于表格,這種雙重 group by 語句可以通過可視化來更有效地展示。

          39e2485246c0bed339372f586c02e73b.webp


          這個圖表是交互式的,讓你可以自己點擊并探索各個類別。你只需要定義你的所有類別,并聲明它們之間的層次結(jié)構(gòu)(見以下代碼中的 parents 參數(shù))并分配對應(yīng)的值即可,這在我們案例中即為 group by 語句的輸出。
          import?plotly.graph_objects?as?go
          import?plotly.express?as?px
          import?numpy?as?np
          import?pandas?as?pd
          df?=?px.data.tips()
          fig?=?go.Figure(go.Sunburst(
          ????labels=["Female",?"Male",?"Dinner",?"Lunch",?'Dinner?',?'Lunch?'],
          ????parents=["",?"",?"Female",?"Female",?'Male',?'Male'],
          ????values=np.append(
          ????????df.groupby('sex').tip.mean().values,
          ????????df.groupby(['sex',?'time']).tip.mean().values),
          ????marker=dict(colors=px.colors.sequential.Emrld)),
          ????????????????layout=go.Layout(paper_bgcolor='rgba(0,0,0,0)',
          ?????????????????????????????????plot_bgcolor='rgba(0,0,0,0)'))

          fig.update_layout(margin=dict(t=0,?l=0,?r=0,?b=0),
          ??????????????????title_text='Tipping?Habbits?Per?Gender,?Time?and?Day')
          fig.show()

          現(xiàn)在我們向這個層次結(jié)構(gòu)再添加一層:

          65e3a10a91fdcdd720a1a02d228c09e4.webp


          為此,我們再添加另一個涉及三個類別變量的 group by 語句的值。
          import?plotly.graph_objects?as?go
          import?plotly.express?as?px
          import?pandas?as?pd
          import?numpy?as?np
          df?=?px.data.tips()
          fig?=?go.Figure(go.Sunburst(labels=[
          ????"Female",?"Male",?"Dinner",?"Lunch",?'Dinner?',?'Lunch?',?'Fri',?'Sat',
          ????'Sun',?'Thu',?'Fri?',?'Thu?',?'Fri??',?'Sat??',?'Sun??',?'Fri???',?'Thu???'
          ],
          ????????????????????????????parents=[
          ????????????????????????????????"",?"",?"Female",?"Female",?'Male',?'Male',
          ????????????????????????????????'Dinner',?'Dinner',?'Dinner',?'Dinner',
          ????????????????????????????????'Lunch',?'Lunch',?'Dinner?',?'Dinner?',
          ????????????????????????????????'Dinner?',?'Lunch?',?'Lunch?'
          ????????????????????????????],
          ????????????????????????????values=np.append(
          ????????????????????????????????np.append(
          ????????????????????????????????????df.groupby('sex').tip.mean().values,
          ????????????????????????????????????df.groupby(['sex',
          ????????????????????????????????????????????????'time']).tip.mean().values,
          ????????????????????????????????),
          ????????????????????????????????df.groupby(['sex',?'time',
          ????????????????????????????????????????????'day']).tip.mean().values),
          ????????????????????????????marker=dict(colors=px.colors.sequential.Emrld)),
          ????????????????layout=go.Layout(paper_bgcolor='rgba(0,0,0,0)',
          ?????????????????????????????????plot_bgcolor='rgba(0,0,0,0)'))
          fig.update_layout(margin=dict(t=0,?l=0,?r=0,?b=0),
          ??????????????????title_text='Tipping?Habbits?Per?Gender,?Time?and?Day')

          fig.show()

          平行類別
          另一種探索類別變量之間關(guān)系的方法是以下這種流程圖。你可以隨時拖放、高亮和瀏覽值,非常適合演示時使用。

          f90f82582582321aecefe53d8be79a0b.webp


          代碼如下:
          import?plotly.express?as?px
          from?vega_datasets?import?data
          import?pandas?as?pd
          df?=?data.movies()
          df?=?df.dropna()
          df['Genre_id']?=?df.Major_Genre.factorize()[0]
          fig?=?px.parallel_categories(
          ????df,
          ????dimensions=['MPAA_Rating',?'Creative_Type',?'Major_Genre'],
          ????color="Genre_id",
          ????color_continuous_scale=px.colors.sequential.Emrld,
          )
          fig.show()

          平行坐標(biāo)圖
          平行坐標(biāo)圖是上面的圖表的連續(xù)版本。這里,每一根弦都代表單個觀察。這是一種可用于識別離群值(遠(yuǎn)離其它數(shù)據(jù)的單條線)、聚類、趨勢和冗余變量(比如如果兩個變量在每個觀察上的值都相近,那么它們將位于同一水平線上,表示存在冗余)的好用工具。

          fedbe20298521d6b8c9125d2a8c57e9c.webp


          代碼如下:
          ?import?plotly.express?as?px
          from?vega_datasets?import?data
          import?pandas?as?pd
          df?=?data.movies()
          df?=?df.dropna()
          df['Genre_id']?=?df.Major_Genre.factorize()[0]
          fig?=?px.parallel_coordinates(
          ????df,
          ????dimensions=[
          ????????'IMDB_Rating',?'IMDB_Votes',?'Production_Budget',?'Running_Time_min',
          ????????'US_Gross',?'Worldwide_Gross',?'US_DVD_Sales'
          ????],
          ????color='IMDB_Rating',
          ????color_continuous_scale=px.colors.sequential.Emrld)
          fig.show()

          量表圖和指示器

          33257684dc7f913b903091754ee77b0f.webp


          量表圖僅僅是為了好看。在報告 KPI 等成功指標(biāo)并展示其與你的目標(biāo)的距離時,可以使用這種圖表。
          指示器在業(yè)務(wù)和咨詢中非常有用。它們可以通過文字記號來補充視覺效果,吸引觀眾的注意力并展現(xiàn)你的增長指標(biāo)。
          ?import?plotly.graph_objects?as?go
          fig?=?go.Figure(go.Indicator(
          ????domain?=?{'x':?[0,?1],?'y':?[0,?1]},
          ????value?=?4.3,
          ????mode?=?"gauge+number+delta",
          ????title?=?{'text':?"Success?Metric"},
          ????delta?=?{'reference':?3.9},
          ????gauge?=?{'bar':?{'color':?"lightgreen"},
          ????????'axis':?{'range':?[None,?5]},
          ?????????????'steps'?:?[
          ?????????????????{'range':?[0,?2.5],?'color':?"lightgray"},
          ?????????????????{'range':?[2.5,?4],?'color':?"gray"}],
          ??????????}))
          fig.show()

          原文鏈接:https://towardsdatascience.com/5-visualisations-to-level-up-your-data-story-e131759c2f416f2b3b50ebd3f7986bd206dcf84540b5.webp

          加入知識星球【我們談?wù)摂?shù)據(jù)科學(xué)】

          500+小伙伴一起學(xué)習(xí)!








          ·?推薦閱讀?·

          盤點2021最佳數(shù)據(jù)可視化作品

          「Python實用秘技04」pdf文件批量添加文字水印

          新一代Python包管理工具來了


          瀏覽 74
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  俺来也俺去射 | 国产激情小| 免费看的av| 在线a观看 | 熟女激情|