<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          超詳細! 生成DataFrame、讀取和保存各種格式數(shù)據(jù)

          共 1991字,需瀏覽 4分鐘

           ·

          2021-09-10 15:39

          一、生成DataFrame

          以字典形式生成
          import pandas as pd

          datas = {
              '排名': [12345],
              '綜合得分': [894603589570569],
              '粉絲數(shù)': [309147937049875712471259847],
              '獲贊數(shù)': [1220031637498717368996]
          }

          df = pd.DataFrame(datas)
          df

          結(jié)果如下:

          以列表形式生成
          datas1 = [
              {'排名'1'綜合得分'894'粉絲數(shù)'309147'獲贊數(shù)'12200},
              {'排名'2'綜合得分'603'粉絲數(shù)'93704'獲贊數(shù)'31637},
              {'排名'3'綜合得分'589'粉絲數(shù)'98757'獲贊數(shù)'4987},
              {'排名'4'綜合得分'570'粉絲數(shù)'124712'獲贊數(shù)'1736},
              {'排名'5'綜合得分'569'粉絲數(shù)'59847'獲贊數(shù)'8996}
          ]

          df1 = pd.DataFrame(datas1)
          df1

          結(jié)果如下:

          在爬取數(shù)據(jù)時,保存數(shù)據(jù)如果用pandas,需要組織數(shù)據(jù)生成DataFrame,以上兩種方法是很常用的,熟練掌握這兩種方法在保存爬取下來的數(shù)據(jù)時很有幫助。

          二、讀取數(shù)據(jù)

          pd.read_excel( ):讀取 Excel 表格數(shù)據(jù)
          # 讀取 Excel 數(shù)據(jù)
          df2 = pd.read_excel('rank_datas.xlsx')
          # 隨機抽取5行數(shù)據(jù)
          df2.sample(5)
          pd.read_csv( ):讀取 csv 表格數(shù)據(jù)
          # 讀取 csv 數(shù)據(jù)
          df3 = pd.read_csv('job_info.csv')
          # 隨機抽取5行數(shù)據(jù)
          df3.sample(5)
          pd.read_html( ):讀取 html 網(wǎng)頁上的表格數(shù)據(jù)

          # 讀取 html 數(shù)據(jù)
          df4 = pd.read_html('aliyun-ddns.html')[0]
          # 隨機抽取5行數(shù)據(jù)
          df4.sample(5)

          結(jié)果如下:pd.read_html( )這個方法雖然少用,但它的功能非常強大,有時可以用做爬蟲,直接抓取網(wǎng)頁 Table 表格型數(shù)據(jù),得到DataFrame。

          pd.read_json( ):讀取 json 數(shù)據(jù)
          # 讀取 json 數(shù)據(jù)
          df5 = pd.read_json('fake_useragent.json')
          df5.head()
          pd.read_clipboard( ):從剪切板讀取數(shù)據(jù)

          三、保存數(shù)據(jù)

          df.to_csv( ):保存到csv

          結(jié)果如下:

          df.to_excel( ):保存到 Excel

          結(jié)果如下:

          df.to_html():保存到html
          結(jié)果如下:


          點擊下方閱讀原文加入社區(qū)會員

          瀏覽 43
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产三级无码视频 | 操小逼 | 精品卡一卡二 | 看中国毛片 | 亚洲五月天网站 |