Python實(shí)戰(zhàn)教程 | 輕松批量識(shí)別數(shù)百個(gè)快遞單號(hào)

前情提要
了解我的小伙伴可能都知道,經(jīng)常給大家送書,不算聯(lián)合抽獎(jiǎng)送書,單獨(dú)我自購(gòu)+出版社贊助已累計(jì)送出幾百本書籍。
如果是自購(gòu)的話,還需要自己聯(lián)系快速小哥寄出書籍。

寄出后快遞小哥會(huì)給我截圖來(lái)反饋,然而我想要單號(hào)的時(shí)候就遇到問(wèn)題了。

每次寄完書,我都只能得到n個(gè)截圖(內(nèi)含快遞信息)。

為了及時(shí)反饋大家物流信息,我需要盡快將快遞單號(hào)提取出來(lái)。
思考解決辦法
每次大概都有十幾到幾十張截圖,手動(dòng)去識(shí)別真的太麻煩。
不如先看看每張截圖大概是什么樣子,再去想想批量處理的辦法吧。

主要是為了批量獲取圖片中的快遞單號(hào),我想到了兩個(gè)解決辦法:
用python識(shí)別條形碼來(lái)直接獲得準(zhǔn)確快遞單號(hào)
用python調(diào)用ocr,識(shí)別截圖中的快遞單號(hào)文字
大家覺得哪個(gè)更簡(jiǎn)單更準(zhǔn)確呢?

今天我先聊聊第一種方法的流程和踩坑經(jīng)歷。
遍歷圖片
首先,第一步需要先獲取文件夾中的所有截圖,再依次進(jìn)行條形碼識(shí)別。
具體操作可以參考注釋
import os
def get_jpg():
jpgs = []
path = os.getcwd()
for i in os.listdir(path): #獲取文件列表
if i.split(".")[-1] == "jpg": #篩選jpg文件(截圖)
oldname=os.path.join(path,i) #舊文件名
i = i.replace('微信圖片_','')
newname=os.path.join(path,i) #新文件名
os.rename(oldname,newname) #改名
jpgs.append(i)
return jpgs
上面的代碼中除了遍歷篩選圖片,還涉及了改名的操作。
這是因?yàn)槲以诤竺媸褂?opencv 時(shí),打開的路徑只要含有中文就會(huì)一直報(bào)錯(cuò),于是我就干脆把截圖名稱里的中文去除。
執(zhí)行構(gòu)建的get_jpg()函數(shù),得到

這些就是演示文件中的四個(gè)截圖文件,下面開始對(duì)他們進(jìn)行識(shí)別。
識(shí)別條形碼
python的第三方模塊 pyzbar 可以很方便地處理二維碼的識(shí)別。我們這次用它來(lái)識(shí)別一維條形碼的話,用法也大致一樣。不過(guò)還要搭配 cv2 使用,主要是為了利用cv2.imread()來(lái)讀取圖片文件。
注意:對(duì)于cv2模塊,安裝時(shí)需要輸入
pip3 install opencv-python,但在導(dǎo)入的時(shí)候采用import cv2。
識(shí)別條形碼的具體語(yǔ)句如下所示:
import pyzbar.pyzbar as pyzbar
import cv2
def get_barcode(img):
image = cv2.imread(img)
barcodes = pyzbar.decode(image)
barcode = barcodes[0]
barcode_data = barcode.data.decode("utf-8")
return barcode_data
上面構(gòu)建的get_barcode()函數(shù)可以實(shí)現(xiàn)識(shí)別條形碼,并返回結(jié)果數(shù)據(jù)。
我們可以用for循環(huán)遍歷前文獲取的所有圖片,再依次使用get_barcode()函數(shù)來(lái)識(shí)別條形碼。
data_m =[]
for i in jpgs:
data = get_barcode(i)
data_m.append(data)
data_m

可以發(fā)現(xiàn),成功識(shí)別了四張截圖里的條形碼,并獲取了對(duì)應(yīng)的快遞單號(hào)。

小結(jié)
回顧今天的問(wèn)題案例,我先通過(guò)思考想出了兩種解決辦法。第一種的優(yōu)點(diǎn)是識(shí)別條形碼比OCR更準(zhǔn)確,但是其只獲取了快遞單號(hào)。后續(xù)在給獲得贈(zèng)書的同學(xué)反饋時(shí),我還需要手動(dòng)將名字和單號(hào)對(duì)應(yīng),不夠偷懶。后續(xù)將給大家介紹第二種方法的流程和優(yōu)缺點(diǎn)。
如果想看更多python改變生活的真實(shí)問(wèn)題案例,給本文右下角點(diǎn)個(gè)贊吧??
如果你也有一直想用python解決的問(wèn)題,歡迎在評(píng)論區(qū)告訴我??
我們的文章到此就結(jié)束啦,如果你喜歡今天的Python實(shí)戰(zhàn)教程,請(qǐng)持續(xù)關(guān)注菜鳥學(xué)Python。
推薦閱讀:
入門: 最全的零基礎(chǔ)學(xué)Python的問(wèn)題 | 零基礎(chǔ)學(xué)了8個(gè)月的Python | 實(shí)戰(zhàn)項(xiàng)目 |學(xué)Python就是這條捷徑
干貨:爬取豆瓣短評(píng),電影《后來(lái)的我們》 | 38年NBA最佳球員分析 | 從萬(wàn)眾期待到口碑撲街!唐探3令人失望 | 笑看新倚天屠龍記 | 燈謎答題王 |用Python做個(gè)海量小姐姐素描圖 |碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影
趣味:彈球游戲 | 九宮格 | 漂亮的花 | 兩百行Python《天天酷跑》游戲!
AI: 會(huì)做詩(shī)的機(jī)器人 | 給圖片上色 | 預(yù)測(cè)收入 | 碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影
小工具: Pdf轉(zhuǎn)Word,輕松搞定表格和水印! | 一鍵把html網(wǎng)頁(yè)保存為pdf!| 再見PDF提取收費(fèi)! | 用90行代碼打造最強(qiáng)PDF轉(zhuǎn)換器,word、PPT、excel、markdown、html一鍵轉(zhuǎn)換 | 制作一款釘釘?shù)蛢r(jià)機(jī)票提示器! |60行代碼做了一個(gè)語(yǔ)音壁紙切換器天天看小姐姐!|
年度爆款文案
2).學(xué)Python真香!我用100行代碼做了個(gè)網(wǎng)站,幫人PS旅行圖片,賺個(gè)雞腿吃
3).首播過(guò)億,火爆全網(wǎng),我分析了《乘風(fēng)破浪的姐姐》,發(fā)現(xiàn)了這些秘密
9).發(fā)現(xiàn)一個(gè)舔狗福利!這個(gè)Python爬蟲神器太爽了,自動(dòng)下載妹子圖片
點(diǎn)閱讀原文,領(lǐng)AI全套資料!


