Nature子刊研究顛覆常識(shí):視網(wǎng)膜計(jì)算使眼睛先于大腦產(chǎn)生視覺(jué)信息

??新智元報(bào)道??
來(lái)源:medicalxpress
編輯:元子、嘯林
【新智元導(dǎo)讀】眼睛中的神經(jīng)細(xì)胞是如何感知運(yùn)動(dòng)信號(hào)的?它們又是怎樣把感知信號(hào)轉(zhuǎn)化成神經(jīng)信號(hào)傳遞給大腦的?這個(gè)秘密一旦被揭露,或許能夠讓計(jì)算機(jī)視覺(jué)取得前所未有的飛躍?!感轮窃逼钢鞴P、高級(jí)主任編輯,添加HR微信(Dr-wly)或掃描文末二維碼了解詳情?!?/span>
今天,我們可以看到計(jì)算機(jī)視覺(jué)(CV)系統(tǒng)在醫(yī)療保健,安全,運(yùn)輸,零售,銀行,農(nóng)業(yè)等領(lǐng)域的成功應(yīng)用,已經(jīng)深刻地改變了整個(gè)行業(yè)。
剛剛過(guò)去的2019年(然而這個(gè)數(shù)字卻突然變得好像很遙遠(yuǎn)),我們看到了許多新穎的架構(gòu)和方法,進(jìn)一步提高了視覺(jué)系統(tǒng)的感知和生成能力。
目前我們?cè)谟?jì)算機(jī)視覺(jué)方面的研究,依然是依托卷積神經(jīng)、自監(jiān)督學(xué)習(xí)等理論,這在去年CVPR、ICCV等計(jì)算機(jī)視覺(jué)頂會(huì)上的幾篇論文中得到了非常好的體現(xiàn)。
EFFICIENTNET:對(duì)卷積神經(jīng)網(wǎng)絡(luò)的模型縮放的重新思考
Google Research Brain Team的研究人員介紹了一種更好的擴(kuò)大卷積神經(jīng)網(wǎng)絡(luò)(CNN)的方法。按照慣例,隨著可用資源的增多,首先要開(kāi)發(fā)CNN,然后再根據(jù)輸入圖像的深度,寬度或分辨率進(jìn)行放大。

作者表明,如果僅將這些參數(shù)之一放大,或者將所有參數(shù)任意放大,相對(duì)于所需的額外計(jì)算能力,這都會(huì)導(dǎo)致收益迅速減少。相反,他們證明了存在最佳的深度,寬度和分辨率比率,以使效率和準(zhǔn)確性最大化。這稱為復(fù)合縮放。
EfficientNet在8個(gè)數(shù)據(jù)集中的5個(gè)獲得了更好的精度,平均參數(shù)減少了9.6倍。特別是,具有66M參數(shù)的EfficientNet在ImageNet上達(dá)到了84.4%的top-1精度和97-1%的top-5精度,比GPipe(557M參數(shù))小8倍,快6倍,這是目前最好的成績(jī)。

面向視覺(jué)導(dǎo)航的增強(qiáng)型跨模態(tài)匹配和自監(jiān)督模擬學(xué)習(xí)
視覺(jué)語(yǔ)言導(dǎo)航要求機(jī)器使用口頭指令和視覺(jué)感知來(lái)導(dǎo)航真實(shí)的3D環(huán)境。
對(duì)人眼來(lái)說(shuō),這是一項(xiàng)再簡(jiǎn)單不過(guò)的任務(wù)。但對(duì)人工智能而言,這是一項(xiàng)極具挑戰(zhàn)性的任務(wù),因?yàn)樗枰獙⒄Z(yǔ)言線索與給定的物理環(huán)境相匹配,并且需要解析與該環(huán)境有關(guān)的語(yǔ)義指令。
研究人員提出了一種新的強(qiáng)化跨模態(tài)匹配(RCM)方法,該方法通過(guò)強(qiáng)化學(xué)習(xí)(RL)在本地和全球范圍內(nèi)實(shí)施跨模態(tài)接地。


最終,RCM框架在以下方面優(yōu)于R2R數(shù)據(jù)集上的最新視覺(jué)語(yǔ)言導(dǎo)航方法:
將SPL分?jǐn)?shù)從28%提高到35%;
成功率提高了8.1%。
此外,使用SIL模仿RCM代理先前在訓(xùn)練集上的最佳體驗(yàn),會(huì)導(dǎo)致平均路徑長(zhǎng)度從15.22m下降到11.97m,而SPL度量的平均結(jié)果更好(38%)
例如,視覺(jué)可確保我們?cè)诟叻鍟r(shí)段穿越繁忙的道路時(shí)能夠快速,準(zhǔn)確地確定汽車和自行車從何處駛近以及它們以多快的速度行駛。

當(dāng)物體在我們的視野中移動(dòng)時(shí),眼睛中的神經(jīng)細(xì)胞就會(huì)感知并發(fā)出運(yùn)動(dòng)方向的信號(hào)。然而,這些神經(jīng)細(xì)胞如何對(duì)大腦皮層中的神經(jīng)細(xì)胞產(chǎn)生影響,仍然是一個(gè)謎。
如果這個(gè)謎底無(wú)法揭開(kāi),恐怕很難讓計(jì)算機(jī)視覺(jué)達(dá)到我們希望達(dá)到的境界。
最近,奧爾胡斯大學(xué)(Aarhus University)的研究人員繪制了將視覺(jué)運(yùn)動(dòng)的信息傳遞到大腦皮層的神經(jīng)細(xì)胞的功能圖。這將使我們對(duì)大腦中意識(shí)的感覺(jué)印象如何產(chǎn)生有了全新的認(rèn)識(shí)。研究結(jié)果已在《自然通訊》上發(fā)表。
“我們已經(jīng)描述了一種特殊的神經(jīng)回路,該回路從眼睛的神經(jīng)細(xì)胞到大腦皮層的神經(jīng)細(xì)胞發(fā)送有關(guān)視覺(jué)運(yùn)動(dòng)的信息。這很重要,因此我們可以開(kāi)始了解大腦中意識(shí)性感覺(jué)印象如何產(chǎn)生的機(jī)制。”一作作者Rune Nguyen Rasmussen解釋說(shuō)。
從長(zhǎng)遠(yuǎn)來(lái)看,它可能會(huì)使研究人員理解和治療大腦感覺(jué)功能失調(diào)的疾病,比如癡呆,或精神分裂癥患者是如何出現(xiàn)幻覺(jué)的。

“如果視覺(jué)沒(méi)有感知運(yùn)動(dòng)的能力,就會(huì)導(dǎo)致嚴(yán)重的后果,如我們從那些喪失了感知物體運(yùn)動(dòng)能力的人身上所看到的。”
通過(guò)結(jié)合一系列先進(jìn)的實(shí)驗(yàn)方法,并使用小鼠作為影響眼睛中特殊神經(jīng)細(xì)胞的動(dòng)物模型,研究人員能夠了解眼睛神經(jīng)細(xì)胞如何影響大腦皮層神經(jīng)細(xì)胞。

在這項(xiàng)研究中,研究人員證明了眼睛中一組特殊的神經(jīng)細(xì)胞可確保大腦皮層中的視覺(jué)神經(jīng)細(xì)胞可以感知并響應(yīng)高速的視覺(jué)運(yùn)動(dòng)。
最有趣的地方是,它意味著以前認(rèn)為在大腦皮層中產(chǎn)生的東西實(shí)際上已經(jīng)在視覺(jué)的最早階段即眼睛中出現(xiàn)了。
“我們研究后剩下的一個(gè)重要問(wèn)題是該神經(jīng)回路如何以及何時(shí)涉及行為的各個(gè)方面。因此,我們研究的下一步將是了解老鼠四處移動(dòng)并需要在周圍環(huán)境中導(dǎo)航時(shí),這個(gè)神經(jīng)回路是否參與了感知視覺(jué)運(yùn)動(dòng)?!?論文一作Rune?Nguyen Rasmussen說(shuō)。
本文一作Aarhus大學(xué)博士生,第一篇論文即上Nature子刊

本文一作是奧爾胡斯大學(xué)的博士研究生Rune Nguyen Rasmussen,他的研究重點(diǎn)是視覺(jué)皮層是如何把視覺(jué)信息流轉(zhuǎn)換成神經(jīng)元消息的。
發(fā)了第一篇實(shí)驗(yàn)室論文,Rasmussen高興地發(fā)推慶祝:

我在Yonehara團(tuán)隊(duì)的第一篇實(shí)驗(yàn)室論文發(fā)表在了《自然通訊》上,我非常興奮!在這項(xiàng)工作中,我們發(fā)現(xiàn)了一個(gè)從小鼠視網(wǎng)膜方向選擇性細(xì)胞發(fā)出信號(hào)的分離的皮層流。
參考鏈接:
神經(jīng)回路映射:現(xiàn)在我們更好地理解視覺(jué)
https://medicalxpress.com/news/2020-04-neural-circuits-vision.html
Nature Communications原文參見(jiàn):
https://www.nature.com/articles/s41467-020-14643-z
