
來源:知乎等
編輯:白峰、QJP
【新智元導(dǎo)讀】近日,UCLA教授朱松純回國,加入清華自動化系。與此同時,還將與清華、北大共同籌建「北京通用人工智能研究院」,并出任院長。朱松純是計算機視覺領(lǐng)域的頂級學(xué)者,他的回國,將為國內(nèi)人工智能的發(fā)展帶來強勁動力。
近日,根據(jù)網(wǎng)絡(luò)流出的一份清華大學(xué)擬聘新進(jìn)校人員公示名單,加州大學(xué)洛杉磯分校(UCLA)統(tǒng)計學(xué)與計算機科學(xué)教授,UCLA 計算機視覺、認(rèn)知、學(xué)習(xí)與自主機器人中心主任朱松純擬加入清華大學(xué)自動化任職教授。
?
? ? ? ?
? ? ?
?
此外,朱松純教授此次以「國家戰(zhàn)略科學(xué)家」身份回國,還將受邀與清華、北大共建民辦非盈利機構(gòu),北京通用人工智能研究院,并出任院長一職。
?
該研究院將聚焦人工智能前沿技術(shù),致力培養(yǎng)人工智能領(lǐng)域的跨學(xué)科、原創(chuàng)型人工智能人才,同時打造新一代通用人工智能平臺。
?
構(gòu)建一個通用型的強人工智能,也是朱松純一直在追求的,而現(xiàn)在的人工智能還要從計算機視覺的突破性進(jìn)展說起。
?
朱松純于1996年獲哈佛大學(xué)計算機博士學(xué)位,師從國際數(shù)學(xué)大師大衛(wèi)·曼福德教授,在國際頂級期刊和會議上發(fā)表論文300余篇,并三次問鼎計算機視覺領(lǐng)域國際最高獎項——馬爾獎。朱松純對計算機視覺有著自己獨到的看法,在認(rèn)知科學(xué)領(lǐng)域,如視覺常識推理、場景理解等領(lǐng)域做出了重要貢獻(xiàn)。他信奉一句話,「一個民族如果忘記了歷史, 她也注定將失去未來」,而這句話,對計算機視覺來說,也是同樣發(fā)人深省。他提到,現(xiàn)在很多新發(fā)表的視覺的論文,很少有文章能夠引用到 5 年之前的文獻(xiàn),都是引用近兩年arxiv上的文章,去比一些Benchmarks。很少有人認(rèn)真去看 10 年前,20 年前,甚至 30 年前的論文,而當(dāng)時的一些思想和框架性的東西,對現(xiàn)在的研究仍有重要的意義,大家?guī)缀醵加猛瑯拥姆椒ㄔ诒刃?shù)點后面的精度。大家都相當(dāng)短視,只關(guān)注這幾年的歷史和流行的方法,根本無法傳承這個學(xué)科。特別是等當(dāng)前這一波方法退潮之后,這批人就會慢慢失去根基和源創(chuàng)力。談到自己的學(xué)術(shù)生涯,他認(rèn)為David Marr 對他影響最為深遠(yuǎn)。60 年代開始的時候大家已經(jīng)很多人研究視覺神經(jīng)生理學(xué)、心理學(xué)問題,也有人做一些邊緣檢測的工作。但是,計算機視覺到底要解決哪些問題?如何實現(xiàn)?大家莫衷一是,談不清楚。
? ? ? ?
? ? ?David Marr 分出了三個層次來解決這個問題,分別是計算(其實應(yīng)該說成是表達(dá))、算法、和實現(xiàn)。首先,在表達(dá)的層次, 如何把它寫成一個數(shù)學(xué)問題。任務(wù)是什么?輸出是什么?這是獨立于解決問題的方法的。其次,對這個數(shù)學(xué)問題去求解時,可以選擇不同的算法, 可以并行或者串行。再次,一個算法如何在硬件上實現(xiàn), 可以用 CPU,DSP, 或者神經(jīng)網(wǎng)絡(luò)來實現(xiàn)。?? ? ??
? ? ? ?除此之外,David Marr 還理清了視覺到底要計算什么。Marr 提出了一個系列的表達(dá),從primal sketch(首要簡約圖), 到 2 ? D sketch(深度簡約圖), 到 3D sketch。這里面還包含了紋理、立體視覺、運動分析、表面形狀等等。Marr認(rèn)為,視覺計算不是單純?nèi)デ笠粋€解,而是一個連續(xù)不斷的計算過程,越看、越琢磨,可能得到的理解就越多。值得一提的是,Marr 在1978 年冬診斷得了急性白血病,在得知來日無多后,Marr就趕緊整理了一本書《視覺:從計算的視角研究人的視覺信息表達(dá)與處理》,去世時年僅35歲。
? ? ? ?
? ? ?朱松純和同事在這本書上花了8年時間,把 Marr 提出的早期視覺概念, 包括紋理 、圖像基元以及原始簡約圖等轉(zhuǎn)換成了一個統(tǒng)一的數(shù)理模型。從此,視覺就可以從純粹的理論、計算的角度來研究了。除了視覺的統(tǒng)計建模和計算理論,朱松純還實現(xiàn)了圖像與場景的解譯(parsing)計算框架, 擴展了模式識別創(chuàng)始人傅京孫先生的句法模式識別理論。自2010年以來,朱松純將計算機視覺與認(rèn)知科學(xué)、自然語言理解、機器人等學(xué)科結(jié)合,探索他所稱的「人工智能的暗物質(zhì)」——占95%的、無法通過感知輸入觀測到的智能。現(xiàn)在,朱松純團(tuán)隊構(gòu)建了一個大規(guī)模、物理逼真的VR / AR環(huán)境,用于訓(xùn)練和測試負(fù)責(zé)執(zhí)行大量日常任務(wù)的自主AI智能體。這些智能體可以整合視覺,語言,認(rèn)知,機器學(xué)習(xí)和機器人技術(shù)等領(lǐng)域的能力,在此過程中發(fā)展物理常識和社會常識,并使用認(rèn)知架構(gòu)與人類進(jìn)行交流。熟悉朱松純教授的人,對他嚴(yán)謹(jǐn)?shù)闹螌W(xué)精神,也從不吝惜贊美之詞。他對數(shù)學(xué)一絲不茍,對視覺領(lǐng)域有著一流的直覺
微軟亞洲研究院視覺組研究員代季峰,曾經(jīng)在朱松純教授的VCLA實驗室訪學(xué)一年多,為我們分享了一些朱松純教授的學(xué)術(shù)人生。朱松純教授的實驗里學(xué)生人數(shù)較多,自然要用雄厚的funding資金來支撐。朱教授在最近幾年應(yīng)該都是美國大學(xué)視覺界里funding最多的教授(不知道是不是要加個「之一」)。從2011年起,朱老師的實驗室,作為PI拿到的資助超過4000萬美元,其主要原因就是其「研究思維超前」。能夠拿到這些大funding,意味著朱教授對這個領(lǐng)域的大方向「有著一流的直覺以及領(lǐng)先和準(zhǔn)確的把握」。而朱教授這種的「第六感」在多年前就已經(jīng)有所體現(xiàn)。
? ? ? ?
? ? ?2012年,朱松純教授主持的一個MURI大項目在UCLA開會,他上臺講了一通「vision meets language」,說視覺和語言的結(jié)合會是一個重要的問題,比如看到一整個圖片,系統(tǒng)應(yīng)該輸出一段話描述它,比如看到一個bounding box區(qū)域,要描述這里面發(fā)生了什么,這個用一個hierarchical的And-Or graph該如何實現(xiàn)。當(dāng)時很多視覺領(lǐng)域的大佬都覺得有些天方夜譚。沒想到過一兩年,這就是紅極一時的VQA任務(wù),不過是用神經(jīng)網(wǎng)絡(luò)實現(xiàn)的。「能夠提前感知到未來的大方向」,這是頂級的research感覺,這也是朱松純教授最厲害的地方。朱松純教授提的大方向,雖然有錯的,但是正確的概率已經(jīng)是很高了。對數(shù)學(xué)(尤其是統(tǒng)計)一絲不茍跟朱教授討論的時候,最經(jīng)常被challenge的就是「這個算法不對,數(shù)學(xué)上是錯的,這個CV領(lǐng)域最近火的技術(shù)在統(tǒng)計上是不對的」對大部分研究者來說,概率模型流行就用概率模型,SVM流行就用SVM,神經(jīng)網(wǎng)絡(luò)流行就用神經(jīng)網(wǎng)絡(luò)。而朱松純教授是有信仰的,那就是他的「概率模型」,曾經(jīng)在SVM之前引領(lǐng)了視覺領(lǐng)域的潮流。那是他們自己的東西,所以不像其他人那樣可以輕易舍棄。朱教授曾經(jīng)說過「做research像下圍棋,不能東下一顆西下一顆,地盤全被別人占了」。剛?cè)ニ麑嶒炇业臅r候,會很不適應(yīng)他的批評,但你慢慢了解他,就好了。他對學(xué)生的長遠(yuǎn)發(fā)展和重要利益,是非常好的;雖然批評時很難受,但過后他不記仇;還有同實驗室吳教授的平衡和調(diào)和。其實學(xué)術(shù)圈的老板,脾氣大一些、對學(xué)生push的非常多,算是research人的通病吧。但最后找工作什么的關(guān)鍵時刻,他和同實驗室的吳教授都是非常supportive,有人情味的。朱松純教授的女兒在年滿18歲之際放棄了美國國籍加入中國國籍,也許從那時起,朱松純教授的回國計劃就已經(jīng)提上了日程。朱松純這次回國,將為國內(nèi)人工智能尤其是通用人工智能的發(fā)展,帶來強勁動力。他也離「人工智能大一統(tǒng)理論」的夢想上更近了一步。http://www.stat.ucla.edu/~sczhu/research_blog.html#VisionHistory(朱松純:正本清源 | 初探計算機視覺的三個源頭、兼談人工智能 ,2016)https://www.zhihu.com/question/59182074(文中評價來自微軟研究員代季峰的知乎回答)
