Meta開(kāi)發(fā)新虛擬背景處理AI,讓元宇宙中人像不再虛糊

??新智元報(bào)道??
??新智元報(bào)道??
編輯:袁榭 拉燕
【新智元導(dǎo)讀】為了讓廣大視頻通話用戶體驗(yàn)更佳,也讓更多AR、VR用戶青睞元宇宙,Meta的AI研發(fā)團(tuán)隊(duì)最近開(kāi)發(fā)了能更好處理虛擬背景的AI模型。

如何讓AI改進(jìn)虛擬背景
如何讓AI改進(jìn)虛擬背景
而且,該模型必須能支持各種長(zhǎng)寬比的手機(jī),這樣才可以在筆記本電腦、Meta的便攜式視頻通話設(shè)備和人們的手機(jī)的肖像模式、橫向模式中都保證模型的正常使用。

真實(shí)世界個(gè)人圖像分割模型的挑戰(zhàn)
真實(shí)世界個(gè)人圖像分割模型的挑戰(zhàn)
不正確的分割圖像輸出,會(huì)導(dǎo)致各種讓使用虛擬背景的視訊用戶走神的效果。更重要的是,圖像分割錯(cuò)誤會(huì)導(dǎo)致用戶的真實(shí)物理環(huán)境發(fā)生不必要的暴露。
Meta的軟件工程師們發(fā)現(xiàn),當(dāng)交并比已達(dá)到90%時(shí),圖像的可衡量指標(biāo)趨于飽和,在時(shí)間一致性與空間穩(wěn)定性上難有更好提升。
為真實(shí)世界應(yīng)用開(kāi)發(fā)AI訓(xùn)練與衡量策略
為真實(shí)世界應(yīng)用開(kāi)發(fā)AI訓(xùn)練與衡量策略


優(yōu)化模型
優(yōu)化模型
研究人員設(shè)計(jì)了一種配備輕量級(jí)解碼器加重量級(jí)編碼器的架構(gòu),這樣可以擁有比全對(duì)稱設(shè)計(jì)的架構(gòu)更好的性能。生成的架構(gòu)由神經(jīng)架構(gòu)搜索支撐,并對(duì)設(shè)備上運(yùn)行的速度進(jìn)行了高度優(yōu)化。

為了解決這個(gè)問(wèn)題,研究團(tuán)隊(duì)采用了 Detectron 2 的長(zhǎng)寬比相關(guān)的二次采樣方法,該方法將具有相似長(zhǎng)寬比的圖像分組,并將它們第二次采樣到相同的大小。

最新的一項(xiàng)研究中顯示,卷積層中的反射邊框可以通過(guò)最小化偽影傳播的方式來(lái)進(jìn)一步提高模型的質(zhì)量,但相對(duì)應(yīng)地,時(shí)延成本也會(huì)增加。偽影的案例,和如何移除偽影的示例如下。

研究人員發(fā)現(xiàn),這種利用第四通道跟蹤的策略顯著提高了時(shí)間一致性。同時(shí),他們還采用了最先進(jìn)的跟蹤模型中的一些想法,例如CRVOS和變換不變性CNN等建模策略,來(lái)獲得時(shí)間上較為穩(wěn)定的分割模型。


?
參考資料:https://ai.facebook.com/blog/creating-better-virtual-backdrops-for-video-calling-remote-presence-and-ar/

評(píng)論
圖片
表情
