<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Pandas 的這個知識點,估計 80% 的人都得掛!

          共 1411字,需瀏覽 3分鐘

           ·

          2021-02-09 07:31

          作者:Lemon

          來源:Python數(shù)據(jù)之道


          大家好,我是 Lemon,今天來跟大家分享下 pandas 中 apply 函數(shù)的一個技巧。

          Pandas 中 apply 函數(shù),應(yīng)用廣泛,今天要跟大家分享一個使用的技巧,使用 apply 將 dataframe 中內(nèi)容為 list 的列拆分為多列。

          拆分前的數(shù)據(jù)情況,如下圖紅色標注所示:

          拆分后,如下圖所示:

          這個案例中,Lemon 使用的數(shù)據(jù)來自 akshare ,在開始前,引入相關(guān) package :

          import?pandas?as?pd
          import?akshare?as?ak

          Lemon 使用的兩個 Python 庫的版本信息如下:

          print(ak.__version__)
          0.7.22
          print(pd.__version__)
          1.1.4

          先從 akshare 獲取需要的數(shù)據(jù),分為兩步,第一步是獲取基金代碼的列表,如下:

          df?=?ak.fund_em_fund_name().head(20).tail(5)
          df?=?df[['基金代碼','基金簡稱']]
          print(df)

          第二步是獲取基金凈值數(shù)據(jù)和凈值日期,通過一個自定義函數(shù)來獲取,自定義函數(shù)如下:

          #?獲取基金單位凈值以及凈值日期
          def?get_mutual_fund(code):
          ????df?=?ak.fund_em_open_fund_info(fund=code,?indicator="單位凈值走勢")
          ????df.columns?=?['凈值日期',?'單位凈值',?'equityReturn',?'unitMoney']
          ????df['凈值日期']?=?pd.to_datetime(df['凈值日期'])
          ????df?=?df.sort_values('凈值日期',ascending=False)
          ????unit_equity?=?df.head(1)['單位凈值'].values[0]
          ????date_latest?=?df.head(1)['凈值日期'].values[0]
          ????return?[unit_equity,?date_latest]

          對于這個自定義函數(shù),在 pandas 使用 apply 來應(yīng)用自定義函數(shù),這是使用 apply 的一種常用的方法,如下:

          #?獲取基金最新的單位凈值和凈值日期
          df['tmp']?=?df['基金代碼'].apply(get_mutual_fund)
          print(df)

          獲取的數(shù)據(jù)截圖如下:

          上圖中的 tmp 列,就是我們這次需要進行處理的對象。

          處理方法可以有多種,這里 Lemon 使用 pandas 中的 apply 來處理,相對來說,也是比較便捷的方式。

          在 apply 函數(shù)中,使用 pd.Series 就可以達到我們的目的。

          #?將單位凈值和凈值日期單獨成列
          df[['最新單位凈值','凈值日期']]?=?df['tmp'].apply(pd.Series)
          df?=?df.drop('tmp',axis=1)
          print(df)

          結(jié)果如下:

          看起來復(fù)雜的問題,解決起來也很便捷,是不是很容易啊,趕緊用起來吧。

          瀏覽 31
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  免费观看日本污的视频 | 男人天堂导航 | 大鸡巴操逼视频免费看 | 夜色福利精品 | 求一个做爱视频网站免费在线观看 |