一行代碼實(shí)現(xiàn)地址信息解析
?本文完整示例代碼及文件已上傳至我的
?Github倉庫https://github.com/CNFeffery/PythonPracticalSkills
我們即將學(xué)習(xí)的是:一行代碼解析地址信息。
在日常數(shù)據(jù)處理的過程中,有時候拿到手的是完整的地址信息,如果需要從地址信息中解析出相應(yīng)的各級行政單元名稱,方式有很多,而今天要介紹的方式只需要一行代碼即可快速實(shí)現(xiàn)。
首先我們需要安裝jionlp這個非常好用的文本預(yù)處理工具包,建議使用國內(nèi)鏡像安裝:
pip?install?jionlp?-i?https://pypi.douban.com/simple/
安裝完成后,只需要使用其parse_location()接口即可進(jìn)行地址信息的解析,且具有多種不同的功能:
- 基礎(chǔ)的省市區(qū)信息提取
- 街鎮(zhèn)鄉(xiāng)、村或居委會信息提取
通過設(shè)置參數(shù)town_village=True,還可以額外嘗試提取出街鎮(zhèn)鄉(xiāng)、村或居委會信息等級別的信息字段:
- 自動補(bǔ)全省市信息
若地址信息中缺失省市信息也無妨,在不存在歧義的情況下,parse_location()會自動關(guān)聯(lián)并補(bǔ)全相關(guān)信息:
除此之外,parse_location()還具有舊地名修正為新地名、自定義行政區(qū)劃詞典等功能,你可以在其官方文檔https://github.com/dongrixinyu/JioNLP/wiki/Gadget-說明文檔#地址解析中了解更多。
本期分享結(jié)束,咱們下回見~??
END
推薦閱讀
牛逼!Python常用數(shù)據(jù)類型的基本操作(長文系列第①篇)
牛逼!Python的判斷、循環(huán)和各種表達(dá)式(長文系列第②篇)
牛逼!Python函數(shù)和文件操作(長文系列第③篇)
吳恩達(dá)deeplearining.ai的經(jīng)典總結(jié)資料
Ps:從小程序直接獲取下載
