<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          50 個(gè)常見的 Python 數(shù)據(jù)分析小方法(上)

          共 2191字,需瀏覽 5分鐘

           ·

          2020-12-04 20:53

          作為數(shù)據(jù)分析的初學(xué)者,我感受最深的就是很多時(shí)候我想分析處理下數(shù)據(jù),無從下手,有的代碼也不記得,查找使用方法又得花費(fèi)時(shí)間,所以我整理了一份數(shù)據(jù)分析問答形式的專題,這里都是平時(shí)實(shí)戰(zhàn)中常用到的,方便以后直接利用!



          嘿嘿,進(jìn)入正題!上題目~
          Q1:查看數(shù)據(jù)相關(guān)信息?
          df.info()?#查看數(shù)據(jù)類型
          df.shape?#查看數(shù)據(jù)規(guī)模
          df.describe()?#數(shù)據(jù)統(tǒng)計(jì)信息描述

          Q2:如何設(shè)置才能不隱藏DataFram的列?





          pd.set_option("max_columns",100)?#這里100可以調(diào)整:最大顯示列數(shù)
          pd.set_option('display.max_columns',None)?#這種是都顯示
          Q3:統(tǒng)計(jì)空值?
          df.isnull().sum()
          Q4:查看是否有重復(fù)值?
          df.duplicated().any()
          Q5:填充空值?
          df.fillna(method?=?"ffill")?#這是前向方法填充,bfill為后向填充
          df.fillna(0)?#用0填充空值
          Q6:刪除列?
          df.drop([""],?axis?=1,?inplace?=?True)
          Q7:刪除有空值的行?
          df.dropna(axis?=?0,?how?=?'any',?inplace?=?True)
          Q8:刪除重復(fù)值?
          df.drop_duplicates(inplace=True)
          Q9:排除特殊值的數(shù)據(jù)?
          df?=?df[~df["列名"].isin(['這里寫特殊值/錯(cuò)誤值'])]
          Q10:修改數(shù)據(jù)類型?
          df[""]?=?df[""].astype(int)
          Q11:重置索引?
          df?=?df.reset_index(drop?=?True)
          Q12:按照某一列降序重新排序?
          m?=?df[''].sort_values(ascending?=?False).index[:].tolist()
          df?=?df.loc[m]
          df?=?df.reset_index(drop?=?True)
          Q13:從某個(gè)指標(biāo)上考慮分組?
          s?=?df.groupby("列")["指標(biāo)列"].agg(["count","sum","mean"])
          Q14:篩選出指標(biāo)統(tǒng)計(jì)大于10的,以均值排序輸出前十名?
          s?=?s[s["count"]>20]
          s.sort_values("mean",?ascending?=?False).head(10)
          Q15:分組統(tǒng)計(jì)輸出為DataFram,并且進(jìn)行列重命名?
          df?=?df.groupby('',as_index?=?False).count[['','']]
          df.rename(columns?=?{'原來的列名':'新的列名'},inplace?=?True)
          Q16:時(shí)間標(biāo)準(zhǔn)化?
          data['時(shí)間']=pd.to_datetime(data['時(shí)間'])
          Q17:根據(jù)生日計(jì)算年齡?
          df['age']?=?(pd.to_datetime('這里是當(dāng)前日期如:2020-4')?-?pd.to_datetime(df['birthday']))?/?pd.Timedelta('365?days')
          Q18:分割字符串?(以斜杠為例)
          t?=?df[""].str.split("\",expand?=?True)
          t[0]
          Q19:切片分段?(以分?jǐn)?shù)列為例)
          cut_bins?=?np.arrange(90,130,5)#分段設(shè)置,這里是分成5段
          bins?=?pd.cut(df['score'],?cut_bins)#將數(shù)據(jù)切片
          bin_counts?=?df['score'].groupby(bins).count()
          Q20:統(tǒng)計(jì)列值?
          df[''].value_counts()
          Q21:列值對比可視化?
          df[''].value_counts().plot(kind?=?"bar")
          Q22:查看相關(guān)性?
          df.corr()
          Q23:畫散點(diǎn)圖,看兩個(gè)屬性之間的關(guān)系?
          df.plot.scatter(x="",y?=?"",?figsize=(,),?title?=?"")
          Q24:DataFram直接可視化?
          fig?=?df[['','']].plot(kind?=?"kde",?figsize?=?(24,8),?title?=?"")
          fig.axes.title.set_size(10)
          Q25:邏輯回歸預(yù)測?
          from?sklearn.linear_model?import?LogisticRegression
          model?=?LogisticRegression()
          X?=?df.drop(['y'],axis?=?1)
          y?=?df['y']
          model.fit(X,?y)
          y_pre?=?model.predict(test)


          推薦閱讀



          一行代碼讓 pandas 的 apply 速度飆到極致!


          用 Style 方法提高 Pandas 數(shù)據(jù)的顏值


          高性能 Pandas 方法:query 和 eval


          點(diǎn)擊下方閱讀原文加入社區(qū)會(huì)員



          點(diǎn)贊鼓勵(lì)一下



          瀏覽 57
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩欧美国产综合 | 91干B| 国产精品久久久久久久久久 | 国产婷婷精品视频 | 国产ts视频 |