<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          盤點一個Pandas分組聚類問題

          共 4196字,需瀏覽 9分鐘

           ·

          2022-06-29 17:22

          點擊上方“Python共享之家”,進行關注

          回復“資源”即可獲贈Python學習資料

          對棋陪謝傅,把劍覓徐君。

          大家好,我是皮皮。

          一、前言

          前幾天在Python最強王者交流群【Chloe】問了一道Pandas處理的問題,如下圖所示。

          原始數據如下:

          df = pd.DataFrame({
          'ord_no':[70001,70009,70002,70004,70007,70005,70008,70010,70003,70012,70011,70013],
          'purch_amt':[150.5, 270.65, 65.26, 110.5, 948.5, 2400.6, 5760, 1983.43, 2480.4, 250.45, 75.29, 3045.6],
          'ord_date': ['05-10-2012','09-10-2012','05-10-2012','08-17-2012','10-09-2012','07-27-2012','10-09-2012','10-10-2012','10-10-2012','06-17-2012','07-08-2012','04-25-2012'],
          'customer_id':['C3001','C3001','D3005','D3001','C3005','D3001','C3005','D3001','D3005','C3001','D3005','D3005'],
          'salesman_id': [5002,5005,5001,5003,5002,5001,5001,5006,5003,5002,5007,5001]})

          def f(x):
              return (x[0]=='C').sum()

          df.groupby('salesman_id').agg({'customer_id':[('customer_id_C',f),('customer_id_list',lambda x:','.join(x)),('purc',lambda x:x.max()-x.min())]})

          題目的要求是:

          要求就是: calculate the number of customers starting with 'C'
          # the list of all products and the difference of maximum purchase amount and minimum purchase amount.

          預期的結果如下圖所示:

          二、實現(xiàn)過程

          這個是聚類求和的問題,這里【月神】給出一個可行的代碼,大家后面遇到了,可以對應的修改下,事半功倍,代碼如下所示:

          # 要求就是: calculate the number of customers starting with 'C',
          # the list of all products and the difference of maximum purchase amount and minimum purchase amount.
          import pandas as pd

          df = pd.DataFrame({
              'ord_no': [70001, 70009, 70002, 70004, 70007, 70005, 70008, 70010, 70003, 70012, 70011, 70013],
              'purch_amt': [150.5, 270.65, 65.26, 110.5, 948.5, 2400.6, 5760, 1983.43, 2480.4, 250.45, 75.29, 3045.6],
              'ord_date': ['05-10-2012''09-10-2012''05-10-2012''08-17-2012''10-09-2012''07-27-2012''10-09-2012',
                           '10-10-2012''10-10-2012''06-17-2012''07-08-2012''04-25-2012'],
              'customer_id': ['C3001''C3001''D3005''D3001''C3005''D3001''C3005''D3001''D3005''C3001''D3005',
                              'D3005'],
              'salesman_id': [5002, 5005, 5001, 5003, 5002, 5001, 5001, 5006, 5003, 5002, 5007, 5001]})

          result = df.groupby('salesman_id').agg({'customer_id': [('customer_id_start_C', lambda x: (x.str[0] == 'C').sum()),
                                                         ('customer_id_list', lambda x: ', '.join(x))],
                                        'purch_amt': [('purchase_amt_app', lambda x: x.max() - x.min())]})

          print(result)

          運行之后,結果就是想要的了。

          完美的解決了粉絲的問題!關于索引取值,還有其他的一個方法,如下所示。

          三、總結

          大家好,我是皮皮。這篇文章主要盤點了一道使用Pandas處理數據的問題,文中針對該問題給出了具體的解析和代碼實現(xiàn),幫助粉絲順利解決了問題。

          最后感謝粉絲【Chloe】提問,感謝【月神】給出的思路和代碼解析,感謝【dcpeng】、【馮誠】等人參與學習交流。

          小伙伴們,快快用實踐一下吧!如果在學習過程中,有遇到任何問題,歡迎加我好友,我拉你進Python學習交流群共同探討學習。

          ------------------- End -------------------

          往期精彩文章推薦:

          歡迎大家點贊,留言,轉發(fā),轉載,感謝大家的相伴與支持

          想加入Python學習群請在后臺回復【

          萬水千山總是情,點個【在看】行不行

          瀏覽 36
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人做爱视频在线观看免费版网站 | 日逼天堂 | 东京热黄色录像大全 | 天天日天天日天天 | 欧美高清 日韩 中文字幕 |