手機拍視頻最怕抖,只能靠AI拯救了
視頻畫面的穩(wěn)定與否,很大程度上影響著觀感的舒適度!如何補償視頻抖動,拯救手抖黨,來自臺灣大學、谷歌等研究機構(gòu)的學者,提出了防抖新算法,視頻拍攝——穩(wěn)。


將神經(jīng)渲染技術(shù)應(yīng)用于視頻穩(wěn)定中,以緩解對流不準確的敏感性問題;
提出了一種混合融合機制,用于在特征和圖像級別上組合來自多幀的信息,并通過消融研究系統(tǒng)地驗證了各種設(shè)計選擇;
在兩個公共數(shù)據(jù)集上展示了與代表性視頻穩(wěn)定技術(shù)相比較而言,該研究所提出的方法具有良好性能。

傳統(tǒng)的全景圖像拼接(或基于圖像的渲染)方法通常在圖像級別對扭曲(穩(wěn)定)的圖像進行融合。在對齊比較準確時圖像級融合效果良好,但在流估計不可靠時可能產(chǎn)生混合偽影;
可以將圖像編碼為抽象的 CNN 特征,在特征空間中進行融合,并學習到一個解碼器,可將融合后的特征轉(zhuǎn)換為輸出幀。這種方法對流不準確性具有較好的魯棒性,但通常會產(chǎn)生過度模糊的圖像;
該研究提出的算法結(jié)合了這兩種策略的優(yōu)點。首先提取抽象的圖像特征(公式(6));然后融合多幀扭曲的特征。對于每一個源幀,將融合后的特征映射和各個扭曲的特征一起解碼為輸出幀和相關(guān)的置信度映射。最后使用公式(8)中生成圖像的加權(quán)平均值生成最終輸出幀。
,使其與目標幀
對齊。因為已經(jīng)有了從目標幀到關(guān)鍵幀的扭曲場
,以及從關(guān)鍵幀到相鄰幀
的估計光流,然后可以通過鏈接流向量來計算從目標幀到相鄰幀
的扭曲場。因此可以使用向后扭曲來扭曲相鄰幀 I_n 以對齊目標幀
。




? THE END
轉(zhuǎn)載請聯(lián)系 機器之心 公眾號獲得授權(quán)
投稿或?qū)で髨蟮溃篶[email protected]

點個在看 paper不斷!
評論
圖片
表情
