圖像增強(qiáng)簡(jiǎn)介
點(diǎn)擊上方“小白學(xué)視覺(jué)”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
數(shù)字圖像的誕生并不是與計(jì)算機(jī)的發(fā)展完全相關(guān),第一次世界大戰(zhàn)結(jié)束后的第二年,數(shù)字圖像被發(fā)明并用于報(bào)紙行業(yè)。為了當(dāng)時(shí)傳輸此圖像,發(fā)明了Bartlane電纜圖像傳輸系統(tǒng)。主要是為了從英國(guó)倫敦連接到美國(guó)紐約。
第一張數(shù)字圖像的傳輸是在1921年實(shí)現(xiàn)的,用打印機(jī)進(jìn)行了3個(gè)小時(shí)的編碼和解碼,當(dāng)時(shí)使用5個(gè)灰度級(jí)進(jìn)行編碼,因?yàn)槿搜壑荒芊直娉鲞@么多。

Bartlane系統(tǒng)在圖片傳輸中使用的Baudot磁帶樣本
電子計(jì)算機(jī)是在1950年代發(fā)明的,人們開始使用計(jì)算機(jī)來(lái)處理圖像,數(shù)字圖像處理在1960年代初開始正式誕生。
早期圖像處理的目的是提高圖像質(zhì)量。噴氣推進(jìn)實(shí)驗(yàn)室(JPL)使用圖像處理技術(shù)處理了空間探測(cè)器Prowler 7在1964年發(fā)回的數(shù)千張?jiān)虑蛘掌◣缀涡U突叶取3晒L制月球表面圖可以被認(rèn)為是最早的數(shù)字圖像處理。
01.圖像直方圖
直方圖通常可以為我們提供一些優(yōu)化圖像的方法。圖像實(shí)際上是一個(gè)二維矩陣,因此該矩陣的每個(gè)位置[i,j]必須對(duì)應(yīng)一個(gè)[0,255]的值。我們可以根據(jù)灰度值的大小將具有相同灰度值的像素分組到同一組中,并繪制每個(gè)灰度值中包含的像素?cái)?shù)以獲得直方圖。假設(shè)此時(shí)與圖像相對(duì)應(yīng)的灰度等級(jí)為[0,L-1],則直方圖實(shí)際上就是這樣一個(gè)函數(shù):

其中,r_k代表第k個(gè)灰度級(jí),n_k代表與圖像中第k個(gè)灰度級(jí)相對(duì)應(yīng)的像素?cái)?shù),n為該圖像中所有像素的總數(shù)在數(shù)字圖像處理中,我們經(jīng)常需要獲取歸一化的直方圖:

其中,P(r_k)實(shí)際上表示某種形式的概率,它表示像素總數(shù)中灰度級(jí)為r_k的像素?cái)?shù)。

左側(cè)代表深色部分,右側(cè)代表亮色部分,中間代表中間調(diào)。
垂直方向的高度表示像素的密度,并且高度越高,在該亮度下分布的像素越多。
02.點(diǎn)操作
圖像的點(diǎn)的操作是執(zhí)行相同的操作?F上的每個(gè)像素(X,Y)與圖像的相同灰度值予。

點(diǎn)操作改變?cè)枷袼氐遣皇芷湮恢没蛳噜徬袼赜绊懀ǔS糜诟幕叶确秶头植肌?/span>
03.圖像閾值
圖像閾值算法簡(jiǎn)單高效,至今仍在許多場(chǎng)景中使用,實(shí)時(shí)性非常好。
圖像閾值分為全局閾值,局部閾值和動(dòng)態(tài)閾值。全局閾值將對(duì)整個(gè)圖像使用單個(gè)閾值,而局部閾值將基于圖像的局部信息在本地執(zhí)行閾值化。
設(shè)置某個(gè)閾值T可以將圖像分為兩部分:大于T的像素組和小于T的像素組。

高于T的任何東西都變成1,低于T的任何東西都變成0。

Imgae閾值圖像的示例
04.對(duì)比拉伸
對(duì)比度拉伸是將灰度值范圍拉大,以達(dá)到色差更明顯的目的。

如果所有像素的灰度值集中在L和H之間,這將使整個(gè)圖像非常暗。換句話說(shuō),對(duì)比度不高。
如果我們使用灰度變換將灰度值擴(kuò)展到整個(gè)0-255間隔,則對(duì)比度明顯得到了增強(qiáng)。以下公式可用于將像素的灰度值映射到更大的灰度空間:

其中,L、H是原始圖像的最小和最大灰度值,而MIN和MAX是要拉伸的灰色空間的最小和最大灰度值。

對(duì)比度拉伸示例
LH之間的像素值將映射為0-255,L左側(cè)以外的值都將變?yōu)?,H右側(cè)以外的值將變?yōu)?55。
05.直方圖均衡化
直方圖均衡處理是將原始圖像的灰度直方圖從相對(duì)集中的灰度間隔更改為整個(gè)灰度范圍內(nèi)的均勻分布。非線性拉伸圖像并重新分配圖像像素值,以便某個(gè)灰度范圍大致相同。
當(dāng)圖像直方圖完全均勻分布時(shí),圖像的熵最大,圖像對(duì)比度高。提高圖像對(duì)比度的變換函數(shù)f(x)需要滿足以下條件:

其中p_x代表的概率密度函數(shù)。在離散圖像中,它表示直方圖每個(gè)灰度級(jí)的概率。變換函數(shù)f(x)實(shí)際上是連續(xù)隨機(jī)變量x的分布函數(shù),它表示該函數(shù)下的面積。
轉(zhuǎn)換后的概率密度:
從變量上限函數(shù)的推導(dǎo)規(guī)則可以知道:
逆函數(shù)的導(dǎo)數(shù)等于原始函數(shù)的導(dǎo)數(shù)的倒數(shù),因此:

除此之外,

變換后的概率密度函數(shù)是均勻分布。對(duì)于圖像,每個(gè)灰度等級(jí)的概率相等,這可以達(dá)到我們的目標(biāo)。
接下來(lái),我們需要將該變換函數(shù)轉(zhuǎn)換為圖像中的表達(dá)式,我們使用求和而不是積分,使用差而不是微分。因此,上述轉(zhuǎn)換函數(shù)為:

其中,h(xi)代表直方圖中每個(gè)灰度級(jí)的像素?cái)?shù),w和h分別代表圖像的寬度和高度。

對(duì)比度拉伸.Image的示例作者。
如果我們將累積直方圖H應(yīng)用為對(duì)比度變化,那么我們將在圖像上施加均勻的直方圖。我們使用H作為一種查找表來(lái)查找圖像的新值。
實(shí)際上,這可以通過(guò)以下方法完成:
? 標(biāo)準(zhǔn)化累積直方圖,以使最大值為1.0。這會(huì)將最終圖像映射到區(qū)間0,…,1。
? 將圖像灰度級(jí)轉(zhuǎn)換回間隔0,…,255作為int值。
? 將累積直方圖應(yīng)用于圖像像素的值
06.伽馬校正
伽瑪校正是對(duì)圖像的非線性操作,用于檢測(cè)圖像信號(hào)部分和淺色部分中的暗色,并增加二者的比率以提高圖像對(duì)比度效果。
每個(gè)顯示設(shè)備在像素輸入強(qiáng)度和顯示輸出亮度之間具有不同的非線性關(guān)系,取決于:

將非負(fù)實(shí)際輸入值V_in升高到CRT顯示屏的功率γ,以獲得輸出值V_out。
但是,實(shí)際上對(duì)于大多數(shù)相機(jī)或成像設(shè)備,該關(guān)系是線性的。這導(dǎo)致監(jiān)視器上顯示的圖像與照相機(jī)設(shè)備拍攝的實(shí)際圖像不一致。為了糾正這種差異,當(dāng)保存由以下內(nèi)容確定的圖像時(shí),相機(jī)將自動(dòng)對(duì)數(shù)據(jù)進(jìn)行伽瑪校正:

其中,γ仍然是顯示器的伽瑪值。監(jiān)視器顯示圖像時(shí),由監(jiān)視器的伽瑪值引起的錯(cuò)誤被抵消。

顯示器的伽瑪值越高,圖像越暗。
紅線代表顯示屏的伽瑪值
藍(lán)線代表相機(jī)保存照片時(shí)進(jìn)行的校正
紫色線代表兩者合并后的結(jié)果
大多數(shù)圖像捕獲設(shè)備在保存圖片時(shí)會(huì)自動(dòng)添加伽瑪校正,這意味著非線性空間中的顏色存儲(chǔ)在圖片中。我們直接使用存儲(chǔ)在圖片中的顏色數(shù)據(jù),然后最終輸出到屏幕時(shí),再次手動(dòng)執(zhí)行伽瑪校正,這將導(dǎo)致紋理太亮,因?yàn)槲覀儓?zhí)行了兩次伽瑪校正。

伽瑪校正的示例
交流群
歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺(jué)、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺(jué)SLAM“。請(qǐng)按照格式備注,否則不予通過(guò)。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~
