<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          超詳細(xì)! 生成DataFrame、讀取和保存各種格式數(shù)據(jù)

          共 1268字,需瀏覽 3分鐘

           ·

          2022-04-12 12:27

          一、生成DataFrame

          以字典形式生成
          import?pandas?as?pd

          datas?=?{
          ????'排名':?[1,?2,?3,?4,?5],
          ????'綜合得分':?[894,?603,?589,?570,?569],
          ????'粉絲數(shù)':?[309147,?93704,?98757,?124712,?59847],
          ????'獲贊數(shù)':?[12200,?31637,?4987,?1736,?8996]
          }

          df?=?pd.DataFrame(datas)
          df

          結(jié)果如下:

          以列表形式生成
          datas1?=?[
          ????{'排名':?1,?'綜合得分':?894,?'粉絲數(shù)':?309147,?'獲贊數(shù)':?12200},
          ????{'排名':?2,?'綜合得分':?603,?'粉絲數(shù)':?93704,?'獲贊數(shù)':?31637},
          ????{'排名':?3,?'綜合得分':?589,?'粉絲數(shù)':?98757,?'獲贊數(shù)':?4987},
          ????{'排名':?4,?'綜合得分':?570,?'粉絲數(shù)':?124712,?'獲贊數(shù)':?1736},
          ????{'排名':?5,?'綜合得分':?569,?'粉絲數(shù)':?59847,?'獲贊數(shù)':?8996}
          ]

          df1?=?pd.DataFrame(datas1)
          df1

          結(jié)果如下:

          在爬取數(shù)據(jù)時,保存數(shù)據(jù)如果用pandas,需要組織數(shù)據(jù)生成DataFrame,以上兩種方法是很常用的,熟練掌握這兩種方法在保存爬取下來的數(shù)據(jù)時很有幫助。

          二、讀取數(shù)據(jù)

          pd.read_excel( ):讀取 Excel 表格數(shù)據(jù)
          #?讀取?Excel?數(shù)據(jù)
          df2?=?pd.read_excel('rank_datas.xlsx')
          #?隨機(jī)抽取5行數(shù)據(jù)
          df2.sample(5)
          pd.read_csv( ):讀取 csv 表格數(shù)據(jù)
          #?讀取?csv?數(shù)據(jù)
          df3?=?pd.read_csv('job_info.csv')
          #?隨機(jī)抽取5行數(shù)據(jù)
          df3.sample(5)
          pd.read_html( ):讀取 html 網(wǎng)頁上的表格數(shù)據(jù)
          #?讀取?html?數(shù)據(jù)
          df4?=?pd.read_html('aliyun-ddns.html')[0]
          #?隨機(jī)抽取5行數(shù)據(jù)
          df4.sample(5)

          結(jié)果如下:pd.read_html( )這個方法雖然少用,但它的功能非常強(qiáng)大,有時可以用做爬蟲,直接抓取網(wǎng)頁 Table 表格型數(shù)據(jù),得到DataFrame。

          pd.read_json( ):讀取 json 數(shù)據(jù)
          #?讀取?json?數(shù)據(jù)
          df5?=?pd.read_json('fake_useragent.json')
          df5.head()
          pd.read_clipboard( ):從剪切板讀取數(shù)據(jù)

          三、保存數(shù)據(jù)

          df.to_csv( ):保存到csv

          結(jié)果如下:

          df.to_excel( ):保存到 Excel

          結(jié)果如下:
          df.to_html():保存到html
          結(jié)果如下:



          萬水千山總是情,點個??行不行

          瀏覽 157
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  青青草视频在线免费 | 国产大骚逼 | 日韩无码毛片视频 | 国产精品福利在线播放 | 无码精品一区二区三区四区五 |