98年“后浪”科學(xué)家,首次挑戰(zhàn)圖片翻轉(zhuǎn)不變性假設(shè),一作拿下CVPR最佳論文提名?
點擊上方“AI算法與圖像處理”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達





和
分別與
和
的出現(xiàn)概率不一致:


訓(xùn)練方法

手性特征聚類方法

互聯(lián)網(wǎng)圖片集












D為數(shù)據(jù)集所來源于的圖像分布。 T為一個圖像變換函數(shù),例如鏡像翻轉(zhuǎn)。需要注意的是論文中的證明不僅限于鏡像翻轉(zhuǎn),也可以被用于任何具備結(jié)合律(associativitive)和可逆性(invertible)的變換。 J為一個圖像處理函數(shù)。例如去馬賽克以及JPEG圖片壓縮。
為經(jīng)過J處理后所得到的的新圖像分布。
,那么
同樣不具備視覺手性。
也不具備視覺手性。換句話說,我們可以通過檢查T和J的交換律,來判斷數(shù)字圖像處理能否造成視覺手性現(xiàn)象。去馬賽克(Demosaicing):數(shù)字相機的感光元件一般只能在每個像素格上捕捉RGB中的其中一種顏色,而其中最常用的為貝爾濾色鏡(Bayer Color Filter Array),如下圖所示。去馬賽克則是將感光元件得到的二維圖像還原為三維全彩的這一過程。 
JPEG壓縮算法(JPEG Compression):JPEG是一種有損的圖像壓縮方式,被廣泛應(yīng)用在如今大量的互聯(lián)網(wǎng)圖片上。一般以每16乘16的像素格為單位通過色彩空間變換,縮減像素采樣,離散余弦變換等步驟來進行圖片編碼壓縮。
去馬賽克或JPEG壓縮算法單獨使用時,會在特定的圖片大小產(chǎn)生視覺手性現(xiàn)象。對于去馬賽克,由于貝爾濾色鏡為2乘2的像素格,且濾色鏡本身不對稱(參考上圖綠紅藍綠的排序),任何能被2整除的圖片寬度均會導(dǎo)致視覺手性。對于JPEG壓縮,任何不被16整除的圖片寬度均會導(dǎo)致視覺手性。這意味著,當去馬賽克和JPEG壓縮被共同使用時,任意寬度的圖片都將產(chǎn)生視覺手性,因為同時滿足不被2整除和能被16整除的數(shù)字不存在。 當使用隨機剪裁(random cropping)時,去馬賽克或JPEG壓縮單獨使用并不產(chǎn)生視覺手性現(xiàn)象。 當使用隨機剪裁(random cropping)時,去馬賽克和JPEG壓縮同時使用將會產(chǎn)生視覺手性現(xiàn)象。這意味著互聯(lián)網(wǎng)圖片中可能存在大量有規(guī)律的,肉眼不可見的視覺手性線索,而人們將能夠利用這類線索來進行圖片識偽。

也不具備視覺手性。
即為一個循環(huán)群,而這個循環(huán)群的單位元(identity element)可以選這個集合里面任意一個元素。這些循環(huán)群的群運算(group operation)可以被定義如下:
,其所在群的階為1
。對于不對稱的一張照片
,其所在群的階為2
。
將變化為
:
:
中的元素都有相同的概率出現(xiàn)。因此,由于經(jīng)過J圖像處理后循環(huán)群變?yōu)榱?/span>
,我們只需要證明以下運算為同態(tài)(homomorphism):
在原分布D上有著相同的概率,意味著每個輸出
也具備相同的概率,也意味著
不具備視覺手性。



是向右平移一格并剪裁,
是向右平移兩個并剪裁)的結(jié)合,每一種有相同概率出現(xiàn)。
,
,
),而他們分別與T具備交換律時,我們可以用以下公式表達新的圖像分布:

,
,
)單獨并不和T具備交換律,但在一種打亂的排列下具備交換性,如圖中不同顏色的箭頭所示。這種排列帶來的交換律的關(guān)系可以用以下公式表達(a和b為排列中的序號)。


首先將任意圖片x進行填充,并確保邊緣足夠大。 將填充后的圖片進行Φ平移。 通過先后運算T和J,得到兩種圖片:
?和?
將這兩個圖片用T(-Φ)平移回原處。 將這兩個圖片多余的填充像素剪裁掉。
和
)檢查以下殘差是否為0:


最后的最后求一波分享!
YOLOv4 trick相關(guān)論文已經(jīng)下載并放在公眾號后臺
關(guān)注“AI算法與圖像處理”,回復(fù) “200714”獲取
個人微信 請注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱 如果沒有備注不拉群!
評論
圖片
表情

