干貨 | 如何利用Python處理JSON格式的數(shù)據(jù),建議收藏!??!
JSON數(shù)據(jù)格式在我們的日常工作中經(jīng)常會接觸到,無論是做爬蟲開發(fā)還是一般的數(shù)據(jù)分析處理,今天,小編就來分享一下當(dāng)數(shù)據(jù)接口是JSON格式時,如何進行數(shù)據(jù)處理進行詳細的介紹,內(nèi)容分布如下
什么是JSON JSON模塊的使用方法
JSON(JavaScript Object Notation, JS對象簡譜)是一種輕量級的數(shù)據(jù)交換格式,通常是以鍵值對的方式呈現(xiàn),其簡潔和清晰的層次結(jié)構(gòu)使得JSON成為理想的數(shù)據(jù)交換語言,而在Python中處理JSON格式的模塊有json和pickle兩個
json模塊和pickle都提供了四個方法:dumps, dump, loads, load 序列化:將python的數(shù)據(jù)轉(zhuǎn)換為json格式的字符串 反序列化:將json格式的字符串轉(zhuǎn)換成python的數(shù)據(jù)類型
首先我們來看一下序列化是如何操作的,我們首先用json.dump()將字典寫入json格式的文件中

能夠進行類似操作的則是dataframe當(dāng)中的to_json()方法,比方說

而當(dāng)你分別打開這兩個文件時,里面的內(nèi)容分別是以鍵值對呈現(xiàn)的json數(shù)據(jù)。另外,我們看到有json.dumps()和json.dump(), 兩者看著十分的相似,但是在功能上可是大相徑庭,json.dump()進行的是對json文件的讀寫操作,就比如上述的例子中,我們將字典數(shù)據(jù)寫入json的文件中用的就是json.dump,而json.dumps()則是聚焦于數(shù)據(jù)本身類型的轉(zhuǎn)換,對數(shù)據(jù)的操作,比如

在反序列化的過程中,我們需要用到的則是json.load()和json.loads()方法,比如說

可以看到的是變量teachers的類型是字典類型,所以可以通過相應(yīng)的方式來獲取以及改變其中的數(shù)值以及格式,另外一種方法則是通過pandas模塊中的read_json()方法,例如

從上述的例子中可以看出,json.load()主要處理的是json格式的文件,而json.loads()主要是對JSON編碼的字符串進行數(shù)據(jù)類型的轉(zhuǎn)換,

本文主要是講了序列化與反序列化的相關(guān)操作步驟,讀者需要在其中留心的則是json.loads()與json.load(),以及json.dumps()和json.dump()之間的區(qū)別和使用場景,總的來說
json.loads():是將json格式的字符串(str)轉(zhuǎn)換為字典類型(dict)的數(shù)據(jù) json.dumps():返回來,是將字典類型(dict)的數(shù)據(jù)轉(zhuǎn)換成json格式的字符串 json.load():用于讀取json格式的文件,將文件中的數(shù)據(jù)轉(zhuǎn)換為字典類型(dict) json.dump():主要用于存入json格式的文件,將字典類型轉(zhuǎn)換為json形式的字符串

