2021 年了,機器/深度學(xué)習(xí)還有哪些坑比較好挖?

極市導(dǎo)讀
深度學(xué)習(xí)以及機器學(xué)習(xí)發(fā)展至今,涌入了大量的人才和資源,有很多方向已經(jīng)達到了一個瓶頸,短時間內(nèi)有非常大的突破有些難以實現(xiàn)。那么對于有學(xué)術(shù)要求與指標的學(xué)生來說,還有哪些方向可以去深挖呢? >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿
# 回答一
作者:張趔趄
康奈爾大學(xué) 電子與計算機博士在讀
來源鏈接:https://www.zhihu.com/question/440538267/answer/1719126442
例如MRI掃描加速。在紐約,在醫(yī)院掃一次MRI,大概要2k刀左右,具體跟你需要的sequence還可能有關(guān)系。如果你能在不損失圖像質(zhì)量和信息的情況下對其進行加速,將具備巨大的經(jīng)濟價值。想當(dāng)年的compressed sensing和衍生出來的sparse representation,dictionary learning等在deep learning era之前的火爆程度,這不就說明這里面解決到的是fundamental的問題,其原理不僅可以加速MRI掃描,也可以被泛化應(yīng)用到其他地方,從而產(chǎn)生很大的影響力。
又例如medical image reconstruction, 大多數(shù)這樣的問題都是ill-posed,傳統(tǒng)解法是formulate成一個優(yōu)化問題,加上一些constraint/prior,從而求解。然而這些圖像每個人掃出來的雖細節(jié)不一樣,但是呢大體結(jié)構(gòu)又類似,那么如何讓深度/機器學(xué)習(xí)能更好的學(xué)習(xí)到prior然后來更快更好的解這些優(yōu)化問題呢?如果這個問題能被解決,那是不是可以直接應(yīng)用到其他類似需要領(lǐng)域呢,
在醫(yī)學(xué)圖像里有一類優(yōu)化問題,自身存在結(jié)構(gòu),雖然from scratch去優(yōu)化可以得到正確的結(jié)果,但是深度學(xué)習(xí)是不是可以更好的去approximate這些優(yōu)化問題,利用自身的提取特征的能力來助力這些優(yōu)化?讓模型學(xué)習(xí)到這些結(jié)構(gòu),然后在之后的優(yōu)化中就可以進一步提升速度。讓深度網(wǎng)絡(luò)變成一個優(yōu)化器。比如我的一個co-authro Mert Sabuncu提出的VoxelMorph,用來深度學(xué)習(xí)來實現(xiàn)image registration; 比如另一個co-author,Jinwei提出的用fidelity loss來對沒有見過的數(shù)據(jù)進行refine.
又比如做medical image analysis的第一步,往往是對ROI進行segmentation,如何真正的利用人體結(jié)構(gòu)的相似性來更好的讓模型學(xué)習(xí)到一些結(jié)構(gòu),而不是直接遷移一些自然圖像里的方法呢?
# 回答二
作者:微調(diào)
CMU博士在讀
來源鏈接:https://www.zhihu.com/question/440538267/answer/1717701231
最容易的就是做交叉application,算法A在任務(wù)B上的表現(xiàn)等。如果發(fā)會議就能畢業(yè)的話,ccf的c類會議里有相當(dāng)一部分都有>40%接受率(ICANN,IJCNN,ICPR等),你魔改一點網(wǎng)絡(luò)結(jié)構(gòu)去嘗試解決一個沒人在乎的問題,只要寫的別太拉胯就碩士畢業(yè)了。我舉一些不存在的例子,如何使用「魔改的RCNN」(這個可以替換為任何經(jīng)典模型)解決「室內(nèi)建筑通風(fēng)能力預(yù)測」的問題。再來一個,如何集成「多個自編碼器」提升「圖片中太陽花」的檢測率。再來一個,如何用「自監(jiān)督學(xué)習(xí)」來發(fā)現(xiàn)「海洋圖片中的污染情況評估」。怎么找應(yīng)用看你有沒有啥合適的數(shù)據(jù),有的話多的是腦洞應(yīng)用。不行的話,翻翻這個答案隨便找點數(shù)據(jù):機器學(xué)習(xí)需要的大量數(shù)據(jù)集從哪里找?(https://www.zhihu.com/question/342295029/answer/915272899)其實這類沒啥意義的文章其實才是泛學(xué)術(shù)圈的主流,我們不鼓勵這類內(nèi)容,但也明白很多人只是為了畢業(yè),不丟人。
或者現(xiàn)在很多人也喜歡大規(guī)模的比較和benchmark,比如討論20種聚類算法在100個數(shù)據(jù)上的一些表現(xiàn)啥的。然后有些“驚人”的發(fā)現(xiàn),比如原來某個領(lǐng)域20年來都沒啥新進展。比如mlsys20上這篇arxiv.org/pdf/2003.0303 ,研究了81篇文章里的pruning的方法。
再來,就是做數(shù)據(jù)集,你去UCI上看看各種各樣的數(shù)據(jù)集,能不能把它們改成其他任務(wù)的。比如把分類任務(wù)改成聚類的,把回歸改成檢測。很多會議也喜歡新的數(shù)據(jù)集,尤其是大數(shù)據(jù)集,或者多個數(shù)據(jù)集。
的概率是正確的。# 回答三
作者:金雪鋒
MindSpore首席架構(gòu)師
來源鏈接:https://www.zhihu.com/question/440538267/answer/1699917805

推薦閱讀
2021-03-13
2021-03-10
2021-03-07

# CV技術(shù)社群邀請函 #
備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標檢測-深圳)
即可申請加入極市目標檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

