計算機視覺:你必須了解的圖像數(shù)據(jù)底層技術
點擊上方“智能算法”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
轉自|新機器視覺
引言
????計算機視覺(Computer Vision)自興起以來就非常迅速且廣泛應用于各個領域,比如我們熟悉的且每天都會使用的基于手機攝像頭的人臉識別,除此之外,它還可以在自動駕駛領域輔助汽車識別交通信號、標志和行人;在制造業(yè)輔助工業(yè)機器人監(jiān)督和指導人工操作。
?

?
????計算機視覺的主要目的是讓計算機能像人類一樣甚至比人類更好地看見和識別世界。計算機視覺通常使用C++、Python和MATLAB等編程語言,是增強現(xiàn)實(AR)的一項重要技術。目前主流的計算機視覺工具有OpenCV、Tensorflow、Gpu、YOLO、Keras等。計算機視覺其實是一個復雜多元的交叉領域,包含了很多來自數(shù)字信號處理、神經(jīng)科學、圖像處理、模式識別、機器學習(ML)、機器人、人工智能(AI)等領域的概念。
?

?
本文,小編想具體介紹一下計算機視覺的工作流程。
?
什么是計算機視覺(Computer Vision)
?
????一言蔽之,計算機視覺是讓計算機理解并標記圖像內容的技術領域。
?
????舉個例子,請看下圖:
?
????對于人類來說,你很難向從沒穿過衣服的原始人解釋什么是連衣裙或者什么是鞋。計算機視覺也是如此,如果它并沒有相關輸入,就不會理解上圖的東西都是什么。
?
????所以,我們需要收集并標記大量關于衣服、鞋、包包的圖片,輸入進計算機“告訴”它這些圖片里的東西是什么,在經(jīng)過不斷的學習和訓練后,計算機將會識別出哪個是連衣裙,哪個是鞋、哪個是包包。
?
計算機視覺的主要應用
?
計算機視覺目前應用的領域不勝枚舉,小編就挑出5個具有代表性的應用吧:
?
?物體與行為識別
?自動駕駛汽車
?醫(yī)療影像分析與診斷
?圖片標記
?人臉識別
?
?
計算機視覺工作流程
?
????計算機視覺工作流程其實是大多數(shù)計算機視覺應用程序將經(jīng)歷的一系列步驟。許多視覺應用程序都是從獲取圖像和數(shù)據(jù)開始,然后處理數(shù)據(jù),執(zhí)行一些分析和識別步驟,最后執(zhí)行一個動作的:
?

計算機視覺工作流程
?
????就拿人臉識別來說吧,它也主要遵循了計算機視覺的工作流程:
?

人臉識別工作流程
?
????我們可以看到,大部分計算機視覺技術應用其實都是從數(shù)據(jù)預處理開始的,其實這也是機器學習的關鍵。
?
數(shù)據(jù)標準化
?
????所謂預處理圖像就是將輸入的圖像數(shù)據(jù)標準化,以便后續(xù)工作流程的順利進行。例如,假設我們創(chuàng)建了一個簡單的聚類算法來區(qū)分紅玫瑰和其他花朵:
?

?
????我們將算法設計為計算給定圖像中紅色像素的數(shù)量,如果有足夠多的紅色像素(大于300個紅色像素)就被歸類為紅玫瑰。(這個例子里我們只提取了顏色特征)
?
????還有一點需要注意的是,輸入圖像的大小、裁切方式都會影響算法的輸出結果,因此數(shù)據(jù)預處理非常重要!
?
作為數(shù)據(jù)的圖像
?
????圖像中的每一個像素都是一個我們可以改變的數(shù)值,比如,我們可以將一個像素乘以一個標量來改變圖像亮度,我們也可以將每個像素值向右移動來改變圖像飽和度等。
?

?
????將圖像視為數(shù)字網(wǎng)格是許多圖像處理技術的基礎。一般來說,色彩與形狀改變都是通過數(shù)學運算對圖像進行逐像素變換完成的。
?
訓練神經(jīng)網(wǎng)絡
????為了訓練神經(jīng)網(wǎng)絡,我們要提供一組標記過的圖像數(shù)據(jù),然后比較這些輸入圖像與計算機預測的輸出標簽或識別的測量值的差異以檢測算法模型的準確率?;谏窠?jīng)網(wǎng)絡的深度學習會監(jiān)督它所犯的錯誤(誤差),并通過修正它發(fā)現(xiàn)的圖像數(shù)據(jù)間的模式與差異來實現(xiàn)迭代與擬合。
?
????其中,梯度下降法是一種減少神經(jīng)網(wǎng)絡誤差的數(shù)學方法,其中卷積神經(jīng)網(wǎng)絡是一種特殊類型的神經(jīng)網(wǎng)絡,通常用于計算機視覺應用,在我們往期推文里有詳細介紹~

?X =輸入;a = 活化函數(shù);W = 卷積神經(jīng)網(wǎng)絡中的權重;J = 損失函數(shù);Alpha = 學習率;y = 地面真值;y = 預測;k = 迭代次數(shù)
來源:數(shù)藝學苑
參考文獻
https://www.analyticsvidhya.com/blog/2020/11/computer-vision-a-key-concept-to-solve-many-problems-related-to-image-data/

