<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          在數(shù)據(jù)可視化這一塊,我們可能真比不上幾百年前的科學(xué)家

          共 1767字,需瀏覽 4分鐘

           ·

          2020-12-26 12:22

          大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自Python專欄


          只要是跟數(shù)據(jù)打交道,數(shù)據(jù)可視化繞不過去的一個最后步驟。


          現(xiàn)在我們有很多工具來實現(xiàn)數(shù)據(jù)可視化,比如 Excel 、PowerPoint 、Tableau ,都可以根據(jù)你的數(shù)據(jù)自動生成各種圖表,而且非常好看。


          但是自動產(chǎn)生的圖表就一定正確嗎?或者說,是不是我們數(shù)據(jù)的最佳表現(xiàn)形式?


          自動化貌似為我們省了不少事,但我們卻逐漸忘了數(shù)據(jù)可視化的本質(zhì),在這一點上,我們真還得跟幾百年前的科學(xué)家們好好學(xué)學(xué)。


          數(shù)據(jù)可視化不完全歷史

          數(shù)據(jù)可視化的歷史遠遠比計算機的歷史要長,也就是說,在科學(xué)家們最初試圖用圖形表現(xiàn)數(shù)據(jù)的時候,是沒有任何輔助工具的,更別提可以自動生成的軟件了。

          早在公元前1160年,一份都靈紙莎草地圖就準(zhǔn)確地描繪了地質(zhì)資源的分布,并提供了這些資源的開采信息,這可以說是歷史上第一份數(shù)據(jù)可視化地圖,也可以看做是數(shù)據(jù)可視化的開端。


          當(dāng)然了,這可能太久遠了,地理信息的可視化可以說是人類的一種本能,包括邁錫尼的 Linear b 碑文中描繪的關(guān)于青銅時代晚期地中海貿(mào)易的可視化信息,以及大名鼎鼎的托勒密地圖,都屬于最早期的數(shù)據(jù)可視化。


          紙張和羊皮紙的發(fā)明使得數(shù)據(jù)可視化的發(fā)展到達了新的階段,除了地圖,其他形式的可視化也出現(xiàn)了,下圖是一張10世紀(jì)的一個圖表,描繪了行星的運動情況。


          看看,是不是有點內(nèi)味了?

          這個圖表表示的是行星軌道的傾角隨時間變化的曲線,為了達到這個目的,黃道帶被表示在一個平面上,水平線被劃分為三十個部分,作為時間或縱軸。垂直軸表示黃道帶的寬度。

          到了十七世紀(jì),隨著法國數(shù)學(xué)家笛卡爾皮埃爾·德·費馬發(fā)明了解析幾何二維坐標(biāo)系,數(shù)值顯示和計算方法產(chǎn)生了革命性的改變,這為現(xiàn)代數(shù)據(jù)可視化鼻祖 William Playfair 的工作打下了堅實的基礎(chǔ)。

          我們現(xiàn)在熟悉的折線圖、條形圖餅狀圖幾乎都是他一手創(chuàng)建。

          在他1786年出版的《商業(yè)與政治地圖集》中,William Playfair 用34個條形圖展現(xiàn)了1781年蘇格蘭對17個國家的進出口情況。


          在這本《商業(yè)與政治地圖集》中,William Playfair 還采用了面積圖來表示丹麥和挪威從1700年到1780年的進出口情況。


          1801年,William Playfair 在倫敦出版的《統(tǒng)計短語》中繪制了歷史上第一張餅圖,顯示了1789年前土耳其人分布在亞洲、歐洲和非洲的比例。


          我們應(yīng)該學(xué)什么?

          有了計算機之后,計算機先是承擔(dān)了計算的任務(wù),圖形化界面的出現(xiàn)后,計算機又開始承擔(dān)了可視化的任務(wù)。

          既然有了更先進的技術(shù),在進行數(shù)據(jù)可視化時,我們還需要從幾百年前的科學(xué)家們學(xué)點什么?

          其實我們最需要學(xué)習(xí)的,不是技巧,而是目的。

          為什么這么說?這里先給大家舉兩個例子。

          2014年在在《可負(fù)擔(dān)醫(yī)療法案》進行激烈辯論期間,福克斯新聞播放了一個畫面,這是一個柱狀圖,表明ACA對醫(yī)療保健的需求低于預(yù)期。


          沒仔細看的人,可能也會認(rèn)為,3月27才600萬,離3月31日706萬的目標(biāo)差的很遠啊。

          但是仔細看一下我們就會發(fā)現(xiàn),按比例來看,縱軸并不是從0開始的,而是大概從525萬開始,如果我們從0開始繪制,圖像應(yīng)該是這樣。


          看見沒有?差的不是很多,奧巴馬其實已經(jīng)完成了85%,還有4天去實現(xiàn)剩下的15%。

          另一個是路透社于 2014 年發(fā)布的佛羅里達州槍擊犯罪的統(tǒng)計。很明顯,這張圖的作者把Y軸翻轉(zhuǎn),通過這樣的方式,成功讓許多讀者誤認(rèn)為 ‘Stand Your Ground’ 法律讓槍擊案下降了。


          然而事實恰恰相反,真實的圖應(yīng)該是這樣的。


          看完這兩個例子,相信大家應(yīng)該懂了,數(shù)據(jù)可視化是一種讓數(shù)據(jù)更直觀的手段,但是我們首先要秉承的,是遵從客觀數(shù)據(jù)。

          在進行數(shù)據(jù)可視化時,我們必須首先考慮我們真正想描述的東西,就像 William Playfair 所做的一樣,我們先必須考慮收集數(shù)據(jù)的過程以及數(shù)字如何彼此關(guān)聯(lián),而不是通過各種技巧誤導(dǎo)讀者

          用一句熟悉的話來說,就是“不忘初心”。

          在這方面,我們是得跟幾百年前的科學(xué)家好好學(xué)學(xué)。



          點「在看」的人都變好看了哦!
          瀏覽 37
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  精品极品在线 | 日韩A片电影 | 亚洲第一大成人网站 | 美女黄片网站 | 欧美性69 |