<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Pandas,還能做這些

          共 1685字,需瀏覽 4分鐘

           ·

          2022-08-14 01:53

          各位看官們里面請,今天慕寒再來接著說一下這Pandas的用法。在本系列的前一篇中,慕寒已經(jīng)介紹過了一些基本的數(shù)據(jù)結構,今天我們就來看看Pandas到底為我們提供了哪些神奇的工具。我們都知道,Pandas庫可以用來處理數(shù)據(jù),既然如此,那數(shù)據(jù)的讀寫就是最基本的了Pandas庫內(nèi)置的數(shù)據(jù)讀寫函數(shù)支持CSV、JSON、txt等多種數(shù)據(jù),我們就以CSV格式為例。Pandas庫提供了“read_csv”函數(shù)來進行CSV數(shù)據(jù)的讀入操作,該函數(shù)的語法結構及參數(shù)說明如下:

          0a7467e8066e59a989b1976ebd748d5c.webp

          • filepath_or_buffer:需要讀寫的文件名

          • sep:指定分隔符,默認使用逗號

          • header:指定某行作為列名,默認為0行,設為None表示不設置列名

          • index_col:指定某列作為行名

          • names:可作為結果的列名列表,若沒有列的標題行可設為None

          • dtype:表明每列的數(shù)據(jù)類型

          下面代碼以帶有經(jīng)緯度信息的房價數(shù)據(jù)為例,該案例中data.head()表示只輸出前5行的數(shù)據(jù):

          c94464d9b9ea29659d9a8eae0d90f49a.webp

          65d2cc58b511b0f5c3dca655605675ba.webp

          當然,Pandas庫還提供了CSV數(shù)據(jù)的寫入函數(shù)“to_csv()”,該函數(shù)的語法結構及參數(shù)說明如下:

          a19f66f72222d7bd16afe67740c934e9.webp

          • path_or_buf:寫入的文件名

          • sep:指定分隔符,默認使用逗號

          • header:寫入文件的列名,默認為true

          • columns:選擇寫入文件的列

          • index:寫入的行名

          • encoding:寫入文件時的編碼方式

          我們以前文的房價為例:

          93f637530427e3679f76b5cadcf8b654.webp


          37eac51dc58a48f716bc83387a5fad81.webp

          在擁有了數(shù)據(jù)之后,我們就要想法子對他們采取必要的操作,所以Pandas庫就為我們提供了很多數(shù)據(jù)操作函數(shù),涉及數(shù)據(jù)處理的整個流程:數(shù)據(jù)采集、數(shù)據(jù)讀寫、數(shù)據(jù)預處理、數(shù)據(jù)探索性分析等。我們今天就先了解一下數(shù)據(jù)預處理階段的操作函數(shù),以下是常用的操作函數(shù)及簡要說明:
          • dtypes:返回每列的數(shù)據(jù)類型

          • empty:如果數(shù)據(jù)幀為空,返回true,否則false

          • size:返回元素數(shù)

          • head(n):返回前n行數(shù)據(jù)

          • tail(n):返回后n行數(shù)據(jù)

          • cov:計算數(shù)據(jù)幀指定列的協(xié)方差

          • corr:計算數(shù)據(jù)幀各列數(shù)據(jù)的相關系數(shù)

          • lower:將字符轉為小寫

          • upper:將字符轉為大寫

          • info:返回數(shù)據(jù)幀的基本信息

          • describe:返回數(shù)據(jù)幀各列的統(tǒng)計信息

          前文的head函數(shù)就是一個操作函數(shù),在此我們再來了解很重要的函數(shù)“corr”。在GIS的空間統(tǒng)計分析中,往往需要分析多個因子之間的相關性,corr函數(shù)可得出指定數(shù)據(jù)的相關系數(shù):

          a3bae9714bfc614d9966c8058a07fd0f.webp

          de514dc3d625f9b4f524878f83277337.webp

          本案例分析的是房價的均價信息與經(jīng)度的相關關系,由輸出可知二者沒有明顯的相關關系,當然啦,這可能是個廢話(手動滑稽~)。其他的函數(shù),慕寒就不一一介紹了,各位看官可以自行嘗試一下。其實,我們在處理數(shù)據(jù)的時候,往往會遇到一種特殊的數(shù)據(jù):缺失數(shù)據(jù)。在Pandas中這部分數(shù)據(jù)會以“NaN”的形式進行顯示。這部分數(shù)據(jù)被稱為噪聲數(shù)據(jù),會對數(shù)據(jù)分析成果的精確度產(chǎn)生一定的影響。所以,Pandas庫為我們提供了許多處理缺失數(shù)據(jù)的方法:0值填充、前一個值填充、刪除等。
          • isnull/notnull:檢查數(shù)據(jù)幀中的缺失數(shù)據(jù)

          • fillna:用指定的數(shù)值填充缺失值

          • dropna:刪除缺失值

          如果我們用isnull函數(shù)的話,我們就會以每個元素作為判斷對象,如果該元素為空則輸出True,否則輸出False:

          13ca8f4640f34379828ce97d31a522a0.webp

          c95d5c829b83aa20603ce0bd7ec4256f.webp

          在我們對數(shù)據(jù)進行分析的整個流程中,分析結果的可視化是數(shù)據(jù)與使用者之間交互的重要途徑。在統(tǒng)計分析領域涉及到很多種可視化圖表,接下來慕寒將介紹Pandas庫中常用的幾種圖形繪制函數(shù)。
          • bar:條形圖,stacked參數(shù)表示是否堆積,默認false,不堆積

          • hist:直方圖

          • box:箱形圖

          • area:面積圖

          • scatter:散點圖,可用作回歸分析

          • pie:餅狀圖

          還是用前文的房價信息作為數(shù)據(jù)。以scatter繪制散點圖為例,在GIS空間分析領域會經(jīng)常涉及到回歸分析,即分析所選要素之間的關系。

          d004de92e50886942252a6496b1fafb5.webp

          acfcc8658194e14d50b471987998de29.webp

          從圖形可知,均價與總價之間存在一定的線性關系。以上便是今天的慕言慕語,各位看官是否還在回味呢?至此,慕寒已經(jīng)簡單介紹了numpy庫與Pandas庫的兩個系列,后面慕寒將在此基礎上簡要介紹一些機器學習及相關。溜~


          瀏覽 49
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产黑丝操逼 | 亚洲日韩国产AV无码无码精品 | 波多野结衣中文字幕一区二区 | 美女尿口无遮挡 | 黑人一级片|