<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Python數(shù)據(jù)可視化教程之基礎篇

          共 5007字,需瀏覽 11分鐘

           ·

          2020-08-28 03:09



          開運張 | 作者

          知乎專欄 |?來源

          https://zhuanlan.zhihu.com/p/55642042




          經(jīng)過學習之后,我總結了利用python實現(xiàn)可視化的三個步驟:


          • 確定問題,選擇圖形

          • 轉換數(shù)據(jù),應用函數(shù)

          • 參數(shù)設置,一目了然


          1


          首先,要知道我們用哪些庫來畫圖?


          matplotlib


          python中最基本的作圖庫就是matplotlib,是一個最基礎的Python可視化庫,一般都是從matplotlib上手Python數(shù)據(jù)可視化,然后開始做縱向與橫向拓展。


          Seaborn


          是一個基于matplotlib的高級可視化效果庫,針對的點主要是數(shù)據(jù)挖掘和機器學習中的變量特征選取,seaborn可以用短小的代碼去繪制描述更多維度數(shù)據(jù)的可視化效果圖


          其他庫還包括


          Bokeh(是一個用于做瀏覽器端交互可視化的庫,實現(xiàn)分析師與數(shù)據(jù)的交互);Mapbox(處理地理數(shù)據(jù)引擎更強的可視化工具庫)等等


          本篇文章主要使用matplotlib進行案例分析


          第一步:確定問題,選擇圖形


          業(yè)務可能很復雜,但是經(jīng)過拆分,我們要找到我們想通過圖形表達什么具體問題。分析思維的訓練可以學習《麥肯錫方法》和《金字塔原理》中的方法。


          這是網(wǎng)上的一張關于圖表類型選擇的總結。



          在python中,我們可以總結為以下四種基本視覺元素來展現(xiàn)圖形:


          • 點:scatter plot 二維數(shù)據(jù),適用于簡單二維關系;

          • 線:line plot 二維數(shù)據(jù),適用于時間序列;

          • 柱狀:bar plot 二維數(shù)據(jù),適用于類別統(tǒng)計;

          • 顏色:heatmap 適用于展示第三維度;


          數(shù)據(jù)間存在分布,構成,比較,聯(lián)系以及變化趨勢等關系。對應不一樣的關系,選擇相應的圖形進行展示。


          第二步:轉換數(shù)據(jù),應用函數(shù)


          數(shù)據(jù)分析和建模方面的大量編程工作都是用在數(shù)據(jù)準備的基礎上的:加載、清理、轉換以及重塑。我們可視化步驟也需要對數(shù)據(jù)進行整理,轉換成我們需要的格式再套用可視化方法完成作圖。


          下面是一些常用的數(shù)據(jù)轉換方法:


          • 合并:merge,concat,combine_frist(類似于數(shù)據(jù)庫中的全外連接)

          • 重塑:reshape;軸向旋轉:pivot(類似excel數(shù)據(jù)透視表)

          • 去重:drop_duplicates

          • 映射:map

          • 填充替換:fillna,replace

          • 重命名軸索引:rename


          將分類變量轉換‘啞變量矩陣’的get_dummies函數(shù)以及在df中對某列數(shù)據(jù)取限定值等等。


          函數(shù)則根據(jù)第一步中選擇好的圖形,去找python中對應的函數(shù)。


          第三步:參數(shù)設置,一目了然


          原始圖形畫完后,我們可以根據(jù)需求修改顏色(color),線型(linestyle),標記(maker)或者其他圖表裝飾項標題(Title),軸標簽(xlabel,ylabel),軸刻度(set_xticks),還有圖例(legend)等,讓圖形更加直觀。


          第三步是在第二步的基礎上,為了使圖形更加清晰明了,做的修飾工作。具體參數(shù)都可以在制圖函數(shù)中找到。


          2


          可視化作圖基礎


          Matplotlib作圖基礎


          #導入包
          import?numpy?as?np
          import?pandas?as?pd
          import?matplotlib.pyplot?as?plt


          Figure和Subplot


          matplotlib的圖形都位于Figure(畫布)中,Subplot創(chuàng)建圖像空間。不能通過figure繪圖,必須用add_subplot創(chuàng)建一個或多個subplot。


          figsize可以指定圖像尺寸。


          #創(chuàng)建畫布
          fig = plt.figure()

          #創(chuàng)建subplot,221表示這是2行2列表格中的第1個圖像。
          ax1 = fig.add_subplot(221)
          #但現(xiàn)在更習慣使用以下方法創(chuàng)建畫布和圖像,2,2表示這是一個2*2的畫布,可以放置4個圖像
          fig , axes = plt.subplots(2,2,sharex=True,sharey=True)
          #plt.subplot的sharex和sharey參數(shù)可以指定所有的subplot使用相同的x,y軸刻度。



          利用Figure的subplots_adjust方法可以調整間距。


          subplots_adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None)



          顏色color,標記marker,和線型linestyle


          matplotlib的plot函數(shù)接受一組X和Y坐標,還可以接受一個表示顏色和線型的字符串縮寫:'g--',表示顏色是綠色green,線型是'--'虛線。也可以使用參數(shù)明確的指定。


          線型圖還可以加上一些標記(marker),來突出顯示數(shù)據(jù)點的位置。標記也可以放在格式字符串中,但標記類型和線型必須放在顏色后面。


          plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')
          []



          刻度,標簽和圖例


          plt的xlim、xticks和xtickslabels方法分別控制圖表的范圍和刻度位置和刻度標簽。


          調用方法時不帶參數(shù),則返回當前的參數(shù)值;調用時帶參數(shù),則設置參數(shù)值。


          plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')
          plt.xlim() #不帶參數(shù)調用,顯示當前參數(shù);
          #可將xlim替換為另外兩個方法試試
          (-1.4500000000000002,?30.45)



          plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')
          plt.xlim([0,15]) #橫軸刻度變成0-15
          (0,?15)



          設置標題,軸標簽,刻度以及刻度標簽


          fig?= plt.figure();ax?= fig.add_subplot(1,1,1)
          ax.plot(np.random.randn(1000).cumsum())
          ticks = ax.set_xticks([0,250,500,750,1000])?#設置刻度值
          labels = ax.set_xticklabels(['one','two','three','four','five'])?#設置刻度標簽
          ax.set_title('My first Plot')?#設置標題
          ax.set_xlabel('Stage')?#設置軸標簽
          Text(0.5,0,'Stage')



          添加圖例


          圖例legend是另一種用于標識圖標元素的重要工具。可以在添加subplot的時候傳入label參數(shù)。


          fig?= plt.figure(figsize=(12,5));ax?= fig.add_subplot(111)
          ax.plot(np.random.randn(1000).cumsum(),'k',label='one')?#傳入label參數(shù),定義label名稱
          ax.plot(np.random.randn(1000).cumsum(),'k--',label='two')
          ax.plot(np.random.randn(1000).cumsum(),'k.',label='three')
          #圖形創(chuàng)建完后,只需要調用legend參數(shù)將label調出來即可。
          ax.legend(loc='best')?#要求不是很嚴格的話,建議使用loc=‘best’參數(shù)來讓它自己選擇最佳位置



          注解


          除標準的圖表對象之外,我們還可以自定義添加一些文字注解或者箭頭。


          注解可以通過text,arrow和annotate等函數(shù)進行添加。text函數(shù)可以將文本繪制在指定的x,y坐標位置,還可以進行自定義格式


          plt.plot(np.random.randn(1000).cumsum())
          plt.text(600,10,'test ',family='monospace',fontsize=10)
          #中文注釋在默認環(huán)境下并不能正常顯示,需要修改配置文件,使其支持中文字體。具體步驟請自行搜索。


          保存圖表到文件


          利用plt.savefig可以將當前圖表保存到文件。例如,要將圖表保存為png文件,可以執(zhí)行


          文件類型是根據(jù)拓展名而定的。其他參數(shù)還有:

          • fname:含有文件路徑的字符串,拓展名指定文件類型

          • dpi:分辨率,默認100 facecolor,edgcolor 圖像的背景色,默認‘w’白色

          • format:顯示設置文件格式('png','pdf','svg','ps','jpg'等)

          • bbox_inches:圖表需要保留的部分。如果設置為“tight”,則將嘗試剪除圖像周圍的空白部分


          plt.savefig('./plot.jpg')?#保存圖像為plot名稱的jpg格式圖像
          432x288?with?0?Axes>


          3


          Pandas中的繪圖函數(shù)


          Matplotlib作圖


          matplotlib是最基礎的繪圖函數(shù),也是相對較低級的工具。組裝一張圖表需要單獨調用各個基礎組件才行。Pandas中有許多基于matplotlib的高級繪圖方法,原本需要多行代碼才能搞定的圖表,使用pandas只需要短短幾行。


          我們使用的就調用了pandas中的繪圖包。


          import?matplotlib.pyplot?as?plt


          線型圖


          Series和DataFrame都有一個用于生成各類圖表的plot方法。默認情況下,他們生成的是線型圖。


          s = pd.Series(np.random.randn(10).cumsum(),index=np.arange(0,100,10))
          s.plot() #Series對象的索引index會傳給matplotlib用作繪制x軸。
          0xf553128>



          df?= pd.DataFrame(np.random.randn(10,4).cumsum(0),columns=['A','B','C','D'])
          df.plot()?#plot會自動為不同變量改變顏色,并添加圖例



          Series.plot方法的參數(shù)


          • label:用于圖表的標簽

          • style:風格字符串,'g--'

          • alpha:圖像的填充不透明度(0-1)

          • kind:圖表類型(bar,line,hist,kde等)

          • xticks:設定x軸刻度值

          • yticks:設定y軸刻度值

          • xlim,ylim:設定軸界限,[0,10]

          • grid:顯示軸網(wǎng)格線,默認關閉

          • rot:旋轉刻度標簽

          • use_index:對象的索引用作刻度標簽

          • logy:在Y軸上使用對數(shù)標尺


          DataFrame.plot方法的參數(shù)


          DataFrame除了Series中的參數(shù)外,還有一些獨有的選項。


          • subplots:將各個DataFrame列繪制到單獨的subplot中

          • sharex,sharey:共享x,y軸

          • figsize:控制圖像大小

          • title:圖像標題

          • legend:添加圖例,默認顯示

          • sort_columns:以字母順序繪制各列,默認使用當前順序


          柱狀圖


          在生成線型圖的代碼中加上kind=‘bar’或者kind=‘barh’,可以生成柱狀圖或水平柱狀圖。


          fig,axes = plt.subplots(2,1)
          data = pd.Series(np.random.rand(10),index=list('abcdefghij'))
          data.plot(kind='bar',ax=axes[0],rot=0,alpha=0.3)
          data.plot(kind='barh',ax=axes[1],grid=True)
          0xfe39898>



          柱狀圖有一個非常實用的方法:

          利用value_counts圖形化顯示Series或者DF中各值的出現(xiàn)頻率。


          比如df.value_counts().plot(kind='bar')


          Python可視化的基礎語法就到這里,其他圖形的繪制方法大同小異。


          重點是遵循三個步驟的思路來進行思考、選擇、應用。多多練習可以更加熟練。


          -?END -

          本文為轉載分享&推薦閱讀,若侵權請聯(lián)系后臺刪除



          掃一掃下面的二維碼
          一起學習進步哦~


          “掃一掃,領取Python學習資料”

          瀏覽 62
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩在线黄色视频 | 三级视频在线看 | 高清无码在线视频 | 色综合天天综合网天天狠天天 | 骚逼美女 |