技能 | Python處理圖像10大經(jīng)典庫(附下載地址)
點(diǎn)擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達(dá)
?
scikit-image是一個與numpy數(shù)組配合使用的開源Python包,在學(xué)術(shù)研究、教育和行業(yè)領(lǐng)域都可應(yīng)用。
即使是那些剛接觸Python生態(tài)系統(tǒng)的人,也會覺得這是一個相當(dāng)簡單直接的庫。
通過這個包能完成很多任務(wù),比如圖像過濾:

使用match_template 函數(shù)進(jìn)行模板匹配:

官方地址:
https://scikit-image.org/
用戶指南:
https://scikit-image.org/docs/stable/user_guide.html?
Numpy是Python的核心庫之一,也能支持?jǐn)?shù)組,圖像本質(zhì)上是包含數(shù)據(jù)點(diǎn)像素的標(biāo)準(zhǔn)Numpy數(shù)組。
因此,通過基本的NumPy操作,可以修改圖像的像素值。
也可以使用skimage加載圖像并用matplotlib顯示。
使用方法也和簡單,比如需要mask一張圖像時:

官方地址:
http://www.numpy.org/?
scipy是Python中另一個核心模塊,可用于基本的圖像操作和處理任務(wù)。
特別需要注意的是,子模塊scipy.ndimage提供在n維NumPy數(shù)組上運(yùn)行的功能。這個包目前包括線性和非線性濾波器、二元形態(tài)、B-spline插值和物體測量等功能。
可以用高斯過濾用Scipy模糊高斯濾波器:

官方資料:
https://docs.scipy.org/doc/scipy/reference/tutorial/ndimage.html#correlation-and-convolution
PIL(Python Imaging Library)是一個免費(fèi)的Python編程語言庫,它增加了對打開,操作和保存不同圖像文件格式的支持。然而,它的發(fā)展停滯不前,最后一次更新還是在2009年。
其分支Pillow更易于安裝,在所有主要操作系統(tǒng)上運(yùn)行并支持Python 3。這個庫包含基本的圖像處理功能,包括點(diǎn)操作、使用一組內(nèi)置卷積核濾波及顏色空間轉(zhuǎn)換。
當(dāng)用ImageFilter增強(qiáng)Pillow中的圖像時,操作是這樣的:

官方介紹:
https://pillow.readthedocs.io/en/3.1.x/index.html?
OpenCV是計算機(jī)視覺應(yīng)用中使用最廣泛的庫之一,OpenCV-Python是OpenCV的python API。
總體來說,因為后臺由用C / C ++編寫,因此OpenCV-Python不僅速度快,也易于編程和部署。
這使其成為執(zhí)行計算密集型視覺程序的絕佳選擇。
來看一下用例,下圖展示的是OpenCV-Python在Image Blending中使用Pyramids創(chuàng)建一個名為’Orapple’的新水果的功能。

上手指南:
https://github.com/abidrahmank/OpenCV2-Python-Tutorials
SimpleCV也是廣泛被使用的構(gòu)建計算機(jī)視覺應(yīng)用程序的開源框架。
手握SimpleCV,你可以訪問幾個高性能的視覺庫,而無需先了解圖像色深(bit depth)、文件格式、色彩空間等。
SimpleCV擁護(hù)者的支持理由有兩個,一是初學(xué)者也可以借此編寫簡單的視覺任務(wù),二是無論是相機(jī)、視頻文件、圖像和視頻流可互相操作。

用戶指南:
https://simplecv.readthedocs.io/en/latest/?
Mahotas包含傳統(tǒng)的圖像處理功能,如濾波和圖像形態(tài)學(xué)處理,以及用于特征計算,比如興趣點(diǎn)檢測和局部描述子等。
這個庫適用于快速開發(fā),算法是用C++實現(xiàn)的,并且針對速度進(jìn)行了調(diào)整。

官方地址:
https://mahotas.readthedocs.io/en/latest/
用戶指南:
https://mahotas.readthedocs.io/en/latest/index.html?
ITK是一個開源的跨平臺系統(tǒng),提供一整套用于圖像分析的軟件工具。
其中,SimpleITK是一個建立在ITK之上的簡化層,促進(jìn)其在簡化原型、教育和解釋語言中的應(yīng)用。
SimpleITK是一個圖像分析工具包,內(nèi)含大量組件,支持一般濾波操作、圖像分割和圖形配準(zhǔn)。
SimpleITK本身是用C++編寫的,但也適用于包括Python在內(nèi)的大量編程語言。
下面就是用SimpleITK和Python創(chuàng)建的可視化的CT/MR圖:

官方地址:
https://itk.org/
學(xué)習(xí)資料:
http://insightsoftwareconsortium.github.io/SimpleITK-Notebooks/?
GraphicsMagick號稱圖像處理領(lǐng)域的瑞士軍刀。代碼短小卻提供了一個魯棒、高效的工具和庫集合,可用來處理圖像的讀取、寫入和操作。
支持超過88種圖像格式,包括重要的DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM和TIFF。
將它用于圖像邊緣提取任務(wù),效果如下:

官方資料:
https://pypi.org/project/pgmagick/
相關(guān)資源:
https://github.com/hhatto/pgmagick?
pyCairo是一個Python的2D圖形渲染庫,可用于繪制矢量圖形的2D圖形,在調(diào)整大小或變換時不會丟失清晰度。
下面這個用例是用Pycairo繪制線條、基本形狀和徑向梯度。

官方介紹:
https://cairographics.org/
相關(guān)資源:
https://github.com/pygobject/pycairo
https://towardsdatascience.com/image-manipulation-tools-for-python-6eb0908ed61f
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~
