<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          數(shù)據(jù)可視化的方法和工具V1.1

          共 2581字,需瀏覽 6分鐘

           ·

          2021-07-16 23:52

          ↑↑↑關(guān)注后"星標(biāo)"簡說Python

          人人都可以簡單入門Python、爬蟲、數(shù)據(jù)分析
           簡說Python推薦 

          來源:林驥

          作者:林驥

          大家好,我是老表,今天給大家分享一篇我一直很喜歡的一個(gè)號主林驥大佬的一篇關(guān)于數(shù)據(jù)分析方法和工具匯總的文章,希望對大家學(xué)習(xí)數(shù)據(jù)分析有所幫助,可以和今天的頭條:贊,2021屆應(yīng)屆生數(shù)據(jù)分析師面經(jīng)和知識點(diǎn)總結(jié) 結(jié)合閱讀。

          1. 數(shù)據(jù)可視化簡介
          數(shù)據(jù)可視化,是指用圖形的方式來展現(xiàn)數(shù)據(jù),從而更加清晰有效地傳遞信息,主要方法包括圖表類型的選擇和圖表設(shè)計(jì)的準(zhǔn)則。
          隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,我們的工作和生活等各個(gè)方面,每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù)。

          數(shù)據(jù)可視化作為一種有效傳遞信息的手段,被越來越廣泛地應(yīng)用到很多領(lǐng)域,比如說,是淘寶雙十一的數(shù)據(jù)可視化,在一塊大屏幕上實(shí)時(shí)動態(tài)展示交易數(shù)據(jù)。

          如果想要讓數(shù)據(jù)發(fā)揮更大的價(jià)值,那么合理地運(yùn)用數(shù)據(jù)可視化的方法和工具就顯得特別重要。

          2. 數(shù)據(jù)可視化的圖表選擇

          根據(jù)數(shù)據(jù)分析的實(shí)際情況,需要有針對性地選擇合適的數(shù)據(jù)可視化方法。

          但是,可視化的圖表花樣繁多,我們應(yīng)該如何選擇并設(shè)計(jì)好你的圖表呢?

          下面這張圖源自 http://chart.guide


          本文將把它拆分為 8 個(gè)部分,逐一進(jìn)行介紹。

          (1) 當(dāng)你需要對不同的類別進(jìn)行比較時(shí),有很多種圖形可供選擇,其中條形圖是最常見的,垂直瀑布圖適合用來比較并分析各個(gè)組成部分的變化情況,詞云圖適用于大量文本的分析和比較。


          (2) 當(dāng)你想要直觀反映關(guān)鍵業(yè)績指標(biāo)隨時(shí)間的變化情況時(shí),用柱形圖或曲線圖是比較好的選擇。


          (3) 當(dāng)你需要展示二八定律時(shí),用柏拉圖(Pareto)能方便地找出主要因素。


          (4) 當(dāng)你希望展示數(shù)據(jù)之間的聯(lián)系或關(guān)系時(shí),漏斗圖和散點(diǎn)圖是比較好的選擇。

          對于氣泡圖,我個(gè)人覺得可以適當(dāng)?shù)丶右赃\(yùn)用,因?yàn)樗芫C合反應(yīng)出 3 個(gè)重要的指標(biāo),在一些數(shù)據(jù)分析場景中,氣泡圖能有效地傳遞出重要的信息。

          比如說,Hans Rosling 曾經(jīng)利用動態(tài)氣泡圖,展現(xiàn)了全球人口、收入、健康的動態(tài)變化,在網(wǎng)站 http://www.gapminder.org 上也可以找到大量動態(tài)氣泡圖的應(yīng)用。


          (5) 當(dāng)你關(guān)注數(shù)據(jù)的分布狀況時(shí),可以使用直方圖或小提琴圖。

          剛開始看到小提琴圖,可能會覺得她比較費(fèi)解,但當(dāng)你理解她代表的具體含義之后,就會知道她能傳遞很多專業(yè)的統(tǒng)計(jì)信息,包括數(shù)據(jù)的密度分布、中位數(shù)、四分位數(shù)等。


          (6) 如果你想增強(qiáng)圖表的表現(xiàn)力,那么可以增加箭頭和標(biāo)簽等圖表元素。


          (7) 當(dāng)你只需要突出顯示某個(gè)單值,可以用放大的粗體文字或圖片。


          (8) 在進(jìn)行數(shù)據(jù)可視化的過程中,應(yīng)該時(shí)刻關(guān)注數(shù)據(jù)可視化的目標(biāo),記住這些圖表設(shè)計(jì)的提示:
          • 使用2D圖表,不要使用三維立體效果

          • 使用反映真實(shí)情況的刻度,避免造成誤導(dǎo)

          • 使用單一的 Y 軸,不要使用雙軸圖表

          • 折線圖用角度體現(xiàn)真實(shí)的數(shù)據(jù)變化,不要使用平滑效果

          • 數(shù)據(jù)序列最多不超過 4 個(gè)

          • 條形圖按大小排序進(jìn)行排列

          • 不要使用無意義的顏色

          • 高亮顯示重要的圖表元素

          • 坐標(biāo)軸等輔助元素盡量淡化



          3. 數(shù)據(jù)可視化的六種制作方

          (一) 將指標(biāo)值圖形化

          一個(gè)指標(biāo)值就是一個(gè)數(shù)據(jù),將數(shù)據(jù)的大小以圖形的方式表現(xiàn)。比如說,用柱形圖的高度表現(xiàn)數(shù)據(jù)大小。

          (二) 將指標(biāo)圖形化

          一般用與指標(biāo)含義相近的 icon 圖標(biāo)來表現(xiàn)。

          (三) 將指標(biāo)關(guān)系圖形化

          當(dāng)存在多個(gè)指標(biāo)時(shí),挖掘指標(biāo)之間的關(guān)系,并將其圖形化表達(dá),可提升圖表的可視化深度。

          (四) 將時(shí)間和空間可視化

          通過時(shí)間的維度來查看指標(biāo)值的變化情況,一般通過增加時(shí)間軸的形式,也就是常見的趨勢圖。

          當(dāng)圖表存在地域信息并且需要突出表現(xiàn)的時(shí)候,可用地圖將空間可視化,地圖作為主背景呈現(xiàn)所有信息點(diǎn)。

          (五) 將數(shù)據(jù)進(jìn)行概念轉(zhuǎn)換

          對數(shù)據(jù)進(jìn)行概念轉(zhuǎn)換,可加深用戶對數(shù)據(jù)的感知,常用方法有對比和比喻。

          (六) 讓圖表「動」起來

          數(shù)據(jù)圖形化完成后,可結(jié)合實(shí)際情況,將其變?yōu)閯討B(tài)化和可操控性的圖表,用戶在操控過程中能更好地感知數(shù)據(jù)的變化過程,提升體驗(yàn)。實(shí)現(xiàn)動態(tài)化主要有兩種方式:交互和動畫。

          4. 數(shù)據(jù)可視化的十個(gè)準(zhǔn)則

          (一) 明確數(shù)據(jù)可視化的目的;
          (二) 通過對比來反映問題; 
          (三) 提供數(shù)據(jù)指標(biāo)的業(yè)務(wù)背景; 
          (四) 通過從總體到部分的形式,展示數(shù)據(jù)分析報(bào)告; 
          (五) 聯(lián)系實(shí)際的生產(chǎn)和生活,對數(shù)據(jù)指標(biāo)的大小進(jìn)行可視化; 
          (六) 通過明確而全面的標(biāo)注,盡可能消除誤差和歧義; 
          (七) 將可視化的圖標(biāo),同聽覺上的描述,進(jìn)行有機(jī)的整合; 
          (八) 通過圖形化工具,增加信息的可讀性和生動性; 
          (九) 允許但并非強(qiáng)制,通過表格的形式,呈現(xiàn)數(shù)據(jù)信息; 
          (十) 目標(biāo)是:讓受眾思考呈現(xiàn)的數(shù)據(jù)指標(biāo),而非數(shù)據(jù)的呈現(xiàn)形式。

          5. 數(shù)據(jù)可視化的工具

          目前市面上的數(shù)據(jù)可視化工具多種多樣,其中 Excel 作圖工具是最常用的

          從數(shù)據(jù)可視化的自動化方面來看,建議使用 Python 編程來實(shí)現(xiàn)。

          Python 中用于數(shù)據(jù)可視化的庫有很多,比較常見的有: 
          • Matplotlib(強(qiáng)大、復(fù)雜)

          • Seaborn(基于Matplotlib、簡單)

          • pyecharts(基于Echarts、炫酷)

          • plotnine(移植于R的ggplot2、圖形語法)

          • PyQtGraph(交互、高性能)


          從數(shù)據(jù)可視化工具的敏捷性方面來看,建議使用 BI 軟件,例如 Tableau、Power BI 等等。

          最后的話

          有些人打著數(shù)據(jù)可視化的幌子,片面追求視覺上的花哨,做出來的圖表只是為了吸引眼球,這就違背了有效傳遞信息的目標(biāo)。

          數(shù)據(jù)可視化的目標(biāo),并不是單純地為了「好看」,而是為了更加有效地傳遞信息,讓人能準(zhǔn)確快速地獲取有價(jià)值的信息,從而更好地解決問題。


          --END--

          掃碼即可加我微信

          老表朋友圈經(jīng)常有贈書/紅包福利活動


          學(xué)習(xí)更多:
          整理了我開始分享學(xué)習(xí)筆記到現(xiàn)在超過250篇優(yōu)質(zhì)文章,涵蓋數(shù)據(jù)分析、爬蟲、機(jī)器學(xué)習(xí)等方面,別再說不知道該從哪開始,實(shí)戰(zhàn)哪里找了

          優(yōu)秀的讀者都知道,“點(diǎn)贊”傳統(tǒng)美德不能丟 

          瀏覽 58
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产区在线观看 | 中文字幕人成人乱码亚洲电影 | 三级黄色成人网站国产操花 | 女人的天堂av | 手机在线欧美 |