<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【Python】Pandas數據排序實現

          共 2101字,需瀏覽 5分鐘

           ·

          2022-01-10 02:36

          公眾號:尤而小屋
          作者:Peter
          編輯:Peter

          在以前的一篇文章? ?圖解Pandas的排序機制sort_values? ?詳細介紹了如何使用pandas的內置函數sort_values來實現數據的排序。本文講解的是如何使用自定義方式來實現排序:

          • 映射關系實現
          • CategoricalDtype類型實現

          模擬數據

          先模擬一份簡單的數據:

          import?pandas?as?pd
          import?numpy?as?np

          df?=?pd.DataFrame({
          ????"nick":["aaa","bbb","aba","abc","cac","ccc"],??#?昵稱
          ????"math":[100,120,130,111,100,128],??#?數學
          ????"english":[140,80,120,90,125,116],??#?英語
          ????"size":["S","M","L","XS","XL","L"]???#?衣服大小
          ????})

          df

          sort_values

          DataFrame.sort_values(by,?
          ???????????????axis=0,?
          ???????????????ascending=True,?
          ???????????????inplace=False,?
          ???????????????kind='quicksort',?
          ???????????????na_position='last',?# last,first;默認是last
          ???????????????ignore_index=False,?
          ???????????????key=None)

          參數的具體解釋為:

          • by:表示根據什么字段或者索引進行排序,可以是一個或多個
          • axis:排序是在橫軸還是縱軸,默認是縱軸axis=0
          • ascending:排序結果是升序還是降序,默認是升序
          • inplace:表示排序的結果是直接在原數據上的就地修改還是生成新的DatFrame
          • kind:表示使用排序的算法,快排quicksort,,歸并mergesort, 堆排序heapsort,穩(wěn)定排序stable ,默認是 :快排quicksort
          • na_position:缺失值的位置處理,默認是最后,另一個選擇是首位
          • ignore_index:新生成的數據幀的索引是否重排,默認False(采用原數據的索引)
          • key:排序之前使用的函數

          下面通過幾個簡單的例子來復習下sort_values的使用:

          單個字段排序

          通過nick字段排序,字符串是根據字母的ASCII碼;默認是從小到大的升序。第一個字母相同,則比較第二個,類推:

          根據數值的大小來升序排列:

          可以將排序方式改為降序:

          多個字段排序

          多個字段的同時排序,默認也是升序。當第一個字段的取值相同,再根據第二個字段來升序排列

          給不同的字段指定不同的排序方式:

          再完整地對比下兩種不同的方式:

          上面的就是sort_values方法的常見排序方式。

          自定義排序

          使用sort_values方法排序的時候都是內置的字母或者數值型數據的大小直接來排序,當遇到下面的情況,該如何操作?

          當我們根據衣服的大小size來排序,得到的結果是:

          明顯這樣的排序方式不是我們理想中的樣子,在我們的認知中:

          • XS:很小
          • S:小
          • M:中等
          • L:大
          • XL:超大

          該如何解決這個問題?提供兩種方式:

          方法1:通過映射

          1、先找到每個size的順序對應的數值大小

          2、生成新的字段order

          3、我們對order進行排序

          方法2:使用CategoricalDtype

          CategoricalDtype是具有類別和順序的分類數據的類型,能夠創(chuàng)建我們自定義的排序數據類型。官網地址:

          https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.CategoricalDtype.html

          1、指定一個分類的數據類型CategoricalDtype

          category_size?=?pd.CategoricalDtype(
          ????['XS',?'S',?'M',?'L',?'XL'],?
          ????ordered=True)

          category_size

          2、將size字段設置成上面的CategoricalDtype類型

          3、我們直接對size使用sort_values就可以達到我們的目的,和上面的map映射的效果是相同的

          而且通過查看df的數據類型,我們也看到size的類型是category:

          往期精彩回顧




          站qq群955171419,加入微信群請掃碼:
          瀏覽 62
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  91久久久精品视频 | 亚洲狼人天堂 | 操逼射精视频 | 亚洲成人免费高清无码 | 久久艹精品视频 |