国色天香AⅤ一区二区三区,97精品云霸高清在线视频小说 ,探花的搜索结果 - 91n,精品国产91乱码一区二区三区,国产精品久久久九九性,国产又粗又长又大在线免费观看,七级毛片,久久一道本色

點(diǎn)擊上方“AI算法與圖像處理”，選擇加"星標(biāo)"或“置頂”

重磅干貨，第一時(shí)間送達(dá)

圖像處理適用于圖像和視頻。良好的圖像處理結(jié)果會(huì)為后續(xù)的進(jìn)一步處理帶來(lái)很大的幫助，例如提取到圖像中的直線(xiàn)有助于對(duì)圖像中物體的結(jié)構(gòu)進(jìn)行分析，良好的特征提取會(huì)優(yōu)化深度學(xué)習(xí)的結(jié)果等。今天我們來(lái)回顧一下圖像處理中的最基礎(chǔ)的，但是卻非常實(shí)用的一些操作。

圖像處理

圖像處理始于計(jì)算機(jī)識(shí)別數(shù)據(jù)。首先，為圖像格式的數(shù)據(jù)創(chuàng)建一個(gè)矩陣。圖像中的每個(gè)像素值都被處理到此矩陣中。例如，為尺寸為200x200的圖片創(chuàng)建尺寸為200x200的矩陣。如果此圖像是彩色的，則此尺寸變?yōu)?00x200x3（RGB）。實(shí)際上，圖像處理中的每個(gè)操作都是矩陣運(yùn)算。假設(shè)需要對(duì)圖像進(jìn)行模糊操作。特定的過(guò)濾器會(huì)在整個(gè)矩陣上移動(dòng)，從而對(duì)所有矩陣元素或部分矩陣元素進(jìn)行更改。作為該過(guò)程的結(jié)果，圖像的所需部分或全部變得模糊。

在許多情況下都需要對(duì)圖像進(jìn)行處理[1]。通常，這些操作應(yīng)用于將在深度學(xué)習(xí)模型中使用。例如，使用彩色圖像進(jìn)行訓(xùn)練會(huì)導(dǎo)致性能下降。卷積神經(jīng)網(wǎng)絡(luò)是圖像處理最廣泛使用的深度學(xué)習(xí)結(jié)構(gòu)之一。該網(wǎng)絡(luò)確定圖像上卷積層訓(xùn)練所需的屬性。在這一點(diǎn)上，僅圖像中將用于訓(xùn)練的某些部分可能需要處理。圖片中更圓的線(xiàn)條而不是清晰的線(xiàn)條突出有時(shí)可以提高訓(xùn)練的成功率。

除上述情況外，相同的邏輯還基于日常生活中使用的圖像優(yōu)化程序的操作。圖像處理中有許多過(guò)程，例如提高圖像質(zhì)量，對(duì)圖像進(jìn)行還原，消除噪聲，直方圖均衡化。

OpenCV

OpenCV是用于圖像處理的最流行的庫(kù)之一[2]。有許多使用OpenCV的公司，例如Microsoft，Intel，Google，Yahoo。OpenCV支持多種編程語(yǔ)言，例如Java，C ++，Python和Matlab。本工作中的所有示例都是使用Python編碼的。

import cv2from matplotlib import pyplot as pltimport numpy as np

首先，導(dǎo)入庫(kù)。OpenCV中的某些功能在每個(gè)版本中均無(wú)法穩(wěn)定運(yùn)行。這些功能之一是“ imshow”。此功能使我們可以查看由于操作導(dǎo)致的圖像變化。對(duì)于有此類(lèi)問(wèn)題的人，matplotlib庫(kù)將用作這項(xiàng)工作的替代解決方案。

圖1.標(biāo)準(zhǔn)圖像

要執(zhí)行的過(guò)程將應(yīng)用于上面顯示的圖像（圖1）。最初會(huì)讀取圖像，以便對(duì)其進(jìn)行處理。

img_path = "/Users/..../opencv/road.jpeg"img = cv2.imread(img_path)print(img.shape)
>>>(960, 1280, 3)

圖2中圖像的尺寸為960 x 1280像素。當(dāng)我們要在讀取過(guò)程后打印尺寸時(shí)，我們看到960x1280x3的結(jié)果。因此，根據(jù)圖像的尺寸創(chuàng)建了一個(gè)矩陣，并為該矩陣分配了圖像每個(gè)像素的值。RGB有3個(gè)維度，因?yàn)閳D像是彩色的。

如果我們想將圖像轉(zhuǎn)換為黑白圖像，則使用cvtColor函數(shù)。

gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

如果要查看由于該函數(shù)而發(fā)生的更改，可以使用matplotlib中的imshow函數(shù)。

gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)plt.imshow(gray_image)plt.show()print(gray_image.shape)
>>>(960, 1280)

圖2.黑白圖像

如圖2所示，我們已將圖像轉(zhuǎn)換為黑白圖像。當(dāng)我們檢查其尺寸時(shí)，不再有3個(gè)尺寸。
當(dāng)查看圖像的矩陣值時(shí)，我們看到它由0到255之間的值組成。在某些情況下，我們可能希望此矩陣僅由0到255的值組成[3]。在這種情況下使用閾值功能。

(thresh, blackAndWhiteImage) = cv2.threshold(gray_image, 20, 255, cv2.THRESH_BINARY)(thresh, blackAndWhiteImage) = cv2.threshold(gray_image, 80, 255, cv2.THRESH_BINARY)(thresh, blackAndWhiteImage) = cv2.threshold(gray_image, 160, 255, cv2.THRESH_BINARY)(thresh, blackAndWhiteImage) = cv2.threshold(gray_image, 200, 255, cv2.THRESH_BINARY)plt.imshow(blackAndWhiteImage)plt.show()

圖3.應(yīng)用了閾值功能的圖像

OpenCV中閾值功能所需的第一個(gè)參數(shù)是要處理的圖像。以下參數(shù)是閾值。第三個(gè)參數(shù)是我們要分配超出閾值的矩陣元素的值。可以在圖3中看到四個(gè)不同閾值的影響。在第一張圖像（圖像1）中，該閾值確定為20.將20之上的所有值分配給255.其余值為設(shè)置為0。這僅允許黑色或非常深的顏色為黑色，而所有其他陰影直接為白色。圖像2和圖像3的閾值分別為80和160.最后，在圖像4中將閾值確定為200.與圖像1不同，白色和非常淺的顏色被指定為255，而所有在圖4中將剩余值設(shè)置為0。

圖像處理中使用的另一種方法是模糊。這可以通過(guò)多個(gè)功能來(lái)實(shí)現(xiàn)。

output2 = cv2.blur(gray_image, (10, 10))plt.imshow(output2)plt.show()

圖4具有模糊功能的模糊圖像

output2?=?cv2.GaussianBlur(gray_image,?(9,?9),?5)plt.imshow(output2)plt.show()

圖5.具有高斯模糊函數(shù)的模糊圖像

如圖4和圖5所示，黑白圖像使用指定的模糊濾鏡和模糊度模糊。此過(guò)程通常用于消除圖像中的噪點(diǎn)。此外，在某些情況下，由于圖像中的線(xiàn)條清晰，訓(xùn)練也會(huì)受到嚴(yán)重影響。出于此原因使用它的情況下可用。

在某些情況下，可能需要旋轉(zhuǎn)數(shù)據(jù)以進(jìn)行擴(kuò)充，或者用作數(shù)據(jù)的圖像可能會(huì)偏斜。在這種情況下，可以使用以下功能。

(h,?w)?=?img.shape[:2]center?=?(w?/?2,?h?/?2)M?=?cv2.getRotationMatrix2D(center,?13,?scale??=1.1)rotated?=?cv2.warpAffine(gray_image,?M,?(w,?h))plt.imshow(rotated)plt.show()

圖6.具有g(shù)etRotationMatrix2D函數(shù)的旋轉(zhuǎn)圖像

首先，確定圖像的中心，并以此中心進(jìn)行旋轉(zhuǎn)。getRotationMatrix2D函數(shù)的第一個(gè)參數(shù)是計(jì)算出的中心值。第二個(gè)參數(shù)是角度值。最后，第三個(gè)參數(shù)是旋轉(zhuǎn)后要應(yīng)用的縮放比例值。如果將此值設(shè)置為1，它將僅根據(jù)給定的角度旋轉(zhuǎn)同一圖像，而不會(huì)進(jìn)行任何縮放。

實(shí)驗(yàn)1

上述方法通常在項(xiàng)目中一起使用。讓我們制作一個(gè)示例項(xiàng)目，以更好地了解這些結(jié)構(gòu)和過(guò)程。
假設(shè)我們要訓(xùn)練車(chē)輛的自動(dòng)駕駛飛行員[4]。當(dāng)檢查圖1中的圖像以解決此問(wèn)題時(shí)，我們的自動(dòng)駕駛儀應(yīng)該能夠理解路徑和車(chē)道。我們可以使用OpenCV解決此問(wèn)題。由于顏色在此問(wèn)題中無(wú)關(guān)緊要，因此圖像將轉(zhuǎn)換為黑白。矩陣元素通過(guò)確定的閾值設(shè)置值0和255。如上面在閾值功能的解釋中提到的，閾值的選擇對(duì)于該功能至關(guān)重要。該問(wèn)題的閾值設(shè)置為200。我們可以清除其他詳細(xì)信息，因?yàn)檫@足以專(zhuān)注于路邊和車(chē)道。為了消除噪聲，使用高斯模糊函數(shù)執(zhí)行模糊處理。可以從圖1到5詳細(xì)檢查到此為止的部分。

這些過(guò)程之后，將應(yīng)用Canny邊緣檢測(cè)。

img = cv2.imread(img_path)
gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
(thresh, output2) = cv2.threshold(gray_image, 200, 255, cv2.THRESH_BINARY)
output2 = cv2.GaussianBlur(output2, (5, 5), 3)
output2 = cv2.Canny(output2, 180, 255)
plt.imshow(output2)
plt.show()

圖7. Canny函數(shù)結(jié)果圖像

Canny函數(shù)采用的第一個(gè)參數(shù)是將對(duì)其執(zhí)行操作的圖像。第二參數(shù)是低閾值，第三參數(shù)是高閾值。逐像素掃描圖像以進(jìn)行邊緣檢測(cè)。一旦存在低于下閾值的值，則檢測(cè)到邊緣的第一側(cè)。當(dāng)找到一個(gè)比較高閾值高的值時(shí)，確定另一側(cè)并創(chuàng)建邊緣。因此，為每個(gè)圖像和每個(gè)問(wèn)題確定閾值參數(shù)值。為了更好地觀察高斯模糊效果，讓我們做同樣的動(dòng)作而又不模糊這次。

img?=?cv2.imread(img_path)gray_image?=?cv2.cvtColor(img,?cv2.COLOR_BGR2GRAY)(thresh,?output2)?=?cv2.threshold(gray_image,?200,?255,?cv2.THRESH_BINARY)output2?=?cv2.Canny(output2,?180,?255)plt.imshow(output2)plt.show()

圖8.非模糊圖像

如果未實(shí)現(xiàn)GaussianBlur函數(shù)，則噪聲在圖8中清晰可見(jiàn)。這些噪聲對(duì)于我們的項(xiàng)目可能不是問(wèn)題，但它們將對(duì)不同項(xiàng)目和情況下的培訓(xùn)成功產(chǎn)生重大影響。在該階段之后，基于確定的邊緣在真實(shí)（標(biāo)準(zhǔn)）圖像上執(zhí)行處理。為此使用HoughLinesP和line函數(shù)。

lines?=?cv2.HoughLinesP(output2,?1,?np.pi/180,30)for?line?in?lines:???x1,y1,x2,y2?=?line[0]???cv2.line(img,(x1,y1),(x2,y2),(0,255,0),4)plt.imshow(img)

圖9.應(yīng)用了HoughLinesP函數(shù)的圖像

如圖9所示，可以很好地實(shí)現(xiàn)道路邊界和車(chē)道。但是，當(dāng)仔細(xì)檢查圖9時(shí)，會(huì)發(fā)現(xiàn)一些問(wèn)題。盡管確定車(chē)道和道路邊界沒(méi)有問(wèn)題，但云也被視為道路邊界。應(yīng)該使用掩蔽方法來(lái)防止這些問(wèn)題[5]。

def?mask_of_image(image):???height?=?image.shape[0]???polygons?=?np.array([[(0,height),(2200,height),(250,100)]])???mask?=?np.zeros_like(image)???cv2.fillPoly(mask,polygons,255)???masked_image?=?cv2.bitwise_and(image,mask)   return masked_image

我們可以使用mask_of_image函數(shù)進(jìn)行屏蔽過(guò)程。首先，將要掩蓋的區(qū)域確定為多邊形。參數(shù)值完全是特定于數(shù)據(jù)的值。

圖10.確定的遮罩區(qū)域

蒙版（圖10）將應(yīng)用于真實(shí)圖片。對(duì)與真實(shí)圖像中黑色區(qū)域相對(duì)應(yīng)的區(qū)域不進(jìn)行任何處理。但是，上述所有過(guò)程都應(yīng)用于與白色區(qū)域相對(duì)應(yīng)的區(qū)域。

圖11.遮罩應(yīng)用的圖像

如圖11所示，通過(guò)屏蔽過(guò)程，我們解決了在云中看到的問(wèn)題。

實(shí)驗(yàn)2

我們使用HougLinesP解決了車(chē)道識(shí)別問(wèn)題。讓我們假設(shè)這個(gè)問(wèn)題適用于圓形[6]。

圖12.硬幣圖像[8]

讓我們創(chuàng)建一個(gè)識(shí)別圖12中硬幣的圖像處理。在這種情況下，這里還將使用車(chē)道識(shí)別項(xiàng)目中使用的方法。

img = cv2.imread("/Users/.../coin.png")gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)(thresh, output2) = cv2.threshold(gray_image, 120, 255, cv2.THRESH_BINARY)output2 = cv2.GaussianBlur(output2, (5, 5), 1)output2 = cv2.Canny(output2, 180, 255)plt.imshow(output2, cmap = plt.get_cmap("gray"))circles = cv2.HoughCircles(output2,cv2.HOUGH_GRADIENT,1,10,                       param1=180,param2=27,minRadius=20,maxRadius=60)circles = np.uint16(np.around(circles))for i in circles[0,:]:   # draw the outer circle   cv2.circle(img,(i[0],i[1]),i[2],(0,255,0),2)   # draw the center of the circle   cv2.circle(img,(i[0],i[1]),2,(0,0,255),3)
plt.imshow(img)

圖13.最終硬幣圖片

作為圖像處理的結(jié)果，可以在圖13中找到i。圖像被轉(zhuǎn)換為黑白圖像。然后應(yīng)用閾值函數(shù)。使用了高斯模糊和Canny邊緣檢測(cè)功能。最后，使用HoughCircles函數(shù)繪制圓。

圖像處理也適用于圖像格式的文本。

圖14.圖像格式的文本

假設(shè)我們要使用圖14中所示的文本來(lái)訓(xùn)練我們的系統(tǒng)，我們希望通過(guò)訓(xùn)練，我們的模型可以識(shí)別所有單詞或某些特定單詞。我們可能需要向系統(tǒng)傳授單詞的位置信息。OpenCV也用于此類(lèi)問(wèn)題。首先，圖像（在圖14中）被轉(zhuǎn)換為文本。為此，使用了一種稱(chēng)為T(mén)esseract的光學(xué)字符識(shí)別引擎[7]。

data?=?pytesseract.image_to_data(img,?output_type=Output.DICT,?config?=?"--psm?6")n_boxes?=?len(data['text'])for?i?in?range(n_boxes):???(x,?y,?w,?h)?=?(data['left'][i],?data['top'][i],?data['width'][i],?data['height'][i])???cv2.rectangle(img,?(x,?y),?(x?+?w,?y?+?h),?(0,?255,?0),?2)plt.imshow(img)plt.show()

圖15.單詞位置信息的處理

通過(guò)將在Tesseract的幫助下獲得的信息與OpenCV相結(jié)合，可以實(shí)現(xiàn)圖15所示的圖像。每個(gè)單詞和每個(gè)單詞塊都用圓括起來(lái)。通過(guò)操縱來(lái)自Tesseract的信息，也可以只操縱框架中的某些單詞。另外，可以應(yīng)用圖像處理以從噪聲中清除文本。但是，如果將其他示例中使用的GaussianBlur函數(shù)應(yīng)用于文本，則會(huì)對(duì)文本的質(zhì)量和易讀性產(chǎn)生不利影響，因此將使用midBlur函數(shù)代替GaussianBlur函數(shù)。

img?=?cv2.imread(img_path)gray_image?=?cv2.cvtColor(img,?cv2.COLOR_BGR2GRAY)output2?=?cv2.medianBlur(gray_image,?ksize=5)plt.imshow(output2)plt.show()

圖16. meanBlur函數(shù)應(yīng)用的圖像

在圖14中檢查圖像時(shí)，虛線(xiàn)在某些單詞下方清晰可見(jiàn)。在這種情況下，光學(xué)字符識(shí)別引擎可能會(huì)誤讀某些單詞。圖16中位數(shù)模糊處理的結(jié)果是，這些虛線(xiàn)消失了。

注意：必須檢查黑白圖像矩陣的尺寸。大多數(shù)情況下，即使是黑白，也有RGB尺寸。這可能會(huì)導(dǎo)致在OpenCV的某些函數(shù)中出現(xiàn)尺寸錯(cuò)誤。

侵蝕和膨脹功能也可以用來(lái)消除圖像格式文本的干擾。

kernel = np.ones((3,3),np.uint8)output2 = cv2.dilate(gray_image,kernel,iterations = 3)plt.imshow(output2)plt.show()

圖17.膨脹函數(shù)產(chǎn)生的圖像

當(dāng)查看圖14中的文本時(shí)，將看到存在一些點(diǎn)形噪聲。可以看出，使用圖17中的膨脹函數(shù)可以大大消除這些噪聲。可以通過(guò)更改創(chuàng)建的濾波器和迭代參數(shù)值來(lái)更改制品的稀疏率。必須正確確定這些值，以保持文本的可讀性。與擴(kuò)張功能相反，侵蝕功能使文本變粗。

kernel = np.ones((3,3),np.uint8)output2 = cv2.erode(gray_image,kernel,iterations = 3)plt.imshow(output2)plt.show()

圖18.侵蝕功能產(chǎn)生的圖像

如圖18所示，使用Erode功能可以增加字體的粗細(xì)。這是一種通常用來(lái)提高用精細(xì)字體書(shū)寫(xiě)的文章質(zhì)量的方法。這里要注意的另一點(diǎn)是，我們的文章為黑色，背景為白色。如果背景為黑色，文本為白色，則將取代這些功能的過(guò)程。

OpenCV用于提高某些圖像的質(zhì)量。例如對(duì)比度差的圖像的直方圖值分布在狹窄的區(qū)域。
為了提高該圖像的對(duì)比度，有必要將直方圖值分布在很大的區(qū)域上。equalizeHist函數(shù)用于這些操作。讓我們對(duì)圖19中的圖像進(jìn)行直方圖均衡。

圖19.直方圖值未修改的圖像（原始圖像）

圖20.原始圖像的直方圖分布

原始圖像的直方圖（圖19）可以在圖20中看到。
圖像中對(duì)象的可見(jiàn)性很低。

equ?=?cv2.equalizeHist(gray_image)plt.imshow(equ)

圖21.直方圖均衡圖像

圖22.直方圖均衡圖像的直方圖分布

直方圖由equalizeHist函數(shù)均衡的圖像如圖21所示。圖像的質(zhì)量和清晰度得到了提高。此外，在圖22中完成了直方圖均衡化的圖像的直方圖圖形可以看出，在直方圖均衡化之后，圖20中一個(gè)區(qū)域中收集的值分布在更大的區(qū)域上。可以為每個(gè)圖像檢查這些直方圖值。必要時(shí)可以通過(guò)使直方圖相等來(lái)提高圖像質(zhì)量。

參考文獻(xiàn)

[1]P.Erbao, Z.Guotong, “Image Processing Technology Research of On-Line Thread Processing”, 2012 International Conference on Future Electrical Power and Energy System, April 2012.

[2]H.Singh, Practical Machine Learning and Image Processing, pp.63–88, January 2019.

[3]R.H.Moss, S.E.Watkins, T.Jones, D.Apel, “Image thresholding in the high resolution target movement monitor”, Proceedings of SPIE — The International Society for Optical Engineering, March 2009.

[4]Y.Xu, L.Zhang, “Research on Lane Detection Technology Based on OPENCV”, Conference: 2015 3rd International Conference on Mechanical Engineering and Intelligent Systems, January 2015.

下載1：OpenCV黑魔法

在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù)：OpenCV黑魔法，即可下載小編精心編寫(xiě)整理的計(jì)算機(jī)視覺(jué)趣味實(shí)戰(zhàn)教程


下載2 CVPR2020

在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù)：CVPR2020，即可下載1467篇CVPR?2020論文
個(gè)人微信（如果沒(méi)有備注不拉群！）
請(qǐng)注明：地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱(chēng)

覺(jué)得有趣就點(diǎn)亮在看吧

OpenCV的實(shí)用圖像處理操作案例分享