Python實戰(zhàn)教程 | 輕松批量識別數(shù)百個快遞單號
這是Python改變生活系列的第三篇,也是一個與你們有關(guān)的問題案例
。
前情提要
了解我的小伙伴可能都知道,小五經(jīng)常給大家送書。最近一年,不算聯(lián)合抽獎送書,單獨我自購+出版社贊助已送出1000本書籍。
如果是自購的話,還需要自己聯(lián)系快速小哥寄出書籍。

寄出后快遞小哥會給我截圖來反饋,然而我想要單號的時候就遇到問題了。

每次寄完書,我都只能得到n個截圖(內(nèi)含快遞信息)。

為了及時反饋大家物流信息,我需要盡快將快遞單號提取出來。
思考解決辦法
每次大概都有十幾到幾十張截圖,手動去識別真的太麻煩。
不如先看看每張截圖大概是什么樣子,再去想想批量處理的辦法吧。

主要是為了批量獲取圖片中的快遞單號,我想到了兩個解決辦法:
用python識別條形碼來直接獲得準確快遞單號
用python調(diào)用ocr,識別截圖中的快遞單號文字
大家覺得哪個更簡單更準確呢?

今天我先聊聊第一種方法的流程和踩坑經(jīng)歷。
遍歷圖片
首先,第一步需要先獲取文件夾中的所有截圖,再依次進行條形碼識別。
具體操作可以參考注釋
import os
def get_jpg():
jpgs = []
path = os.getcwd()
for i in os.listdir(path): #獲取文件列表
if i.split(".")[-1] == "jpg": #篩選jpg文件(截圖)
oldname=os.path.join(path,i) #舊文件名
i = i.replace('微信圖片_','')
newname=os.path.join(path,i) #新文件名
os.rename(oldname,newname) #改名
jpgs.append(i)
return jpgs
上面的代碼中除了遍歷篩選圖片,還涉及了改名的操作。
這是因為我在后面使用 opencv 時,打開的路徑只要含有中文就會一直報錯,于是我就干脆把截圖名稱里的中文去除。
執(zhí)行構(gòu)建的get_jpg()函數(shù),得到

這些就是演示文件中的四個截圖文件,下面開始對他們進行識別。
識別條形碼
python的第三方模塊 pyzbar 可以很方便地處理二維碼的識別。我們這次用它來識別一維條形碼的話,用法也大致一樣。不過還要搭配 cv2 使用,主要是為了利用cv2.imread()來讀取圖片文件。
注意:對于cv2模塊,安裝時需要輸入
pip3 install opencv-python,但在導入的時候采用import cv2。
識別條形碼的具體語句如下所示:
import pyzbar.pyzbar as pyzbar
import cv2
def get_barcode(img):
image = cv2.imread(img)
barcodes = pyzbar.decode(image)
barcode = barcodes[0]
barcode_data = barcode.data.decode("utf-8")
return barcode_data
上面構(gòu)建的get_barcode()函數(shù)可以實現(xiàn)識別條形碼,并返回結(jié)果數(shù)據(jù)。
我們可以用for循環(huán)遍歷前文獲取的所有圖片,再依次使用get_barcode()函數(shù)來識別條形碼。
data_m =[]
for i in jpgs:
data = get_barcode(i)
data_m.append(data)
data_m

可以發(fā)現(xiàn),成功識別了四張截圖里的條形碼,并獲取了對應(yīng)的快遞單號。

小結(jié)
回顧今天的問題案例,我先通過思考想出了兩種解決辦法。第一種的優(yōu)點是識別條形碼比OCR更準確,但是其只獲取了快遞單號。后續(xù)在給獲得贈書的同學反饋時,我還需要手動將名字和單號對應(yīng),不夠偷懶。后續(xù)將給大家介紹第二種方法的流程和優(yōu)缺點。
如果想看更多python改變生活的真實問題案例,給本文右下角點個贊吧??
如果你也有一直想用python解決的問題,歡迎在評論區(qū)告訴我??
我們的文章到此就結(jié)束啦,如果你喜歡今天的Python 實戰(zhàn)教程,請持續(xù)關(guān)注Python實用寶典。
有任何問題,可以在公眾號后臺回復:加群,回答相應(yīng)紅字驗證信息,進入互助群詢問。
原創(chuàng)不易,希望你能在下面點個贊和在看支持我繼續(xù)創(chuàng)作,謝謝!
點擊下方閱讀原文可獲得更好的閱讀體驗
Python實用寶典 (pythondict.com)
不只是一個寶典
歡迎關(guān)注公眾號:Python實用寶典
