<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          2021 年了,機器/深度學(xué)習(xí)還有哪些坑比較好挖?

          共 4382字,需瀏覽 9分鐘

           ·

          2021-03-17 22:12

          ↑ 點擊藍字 關(guān)注極市平臺

          作者丨張趔趄、微調(diào)、金雪鋒
          來源丨知乎問答
          編輯丨極市平臺

          極市導(dǎo)讀

           

          深度學(xué)習(xí)以及機器學(xué)習(xí)發(fā)展至今,涌入了大量的人才和資源,有很多方向已經(jīng)達到了一個瓶頸,短時間內(nèi)有非常大的突破有些難以實現(xiàn)。那么對于有學(xué)術(shù)要求與指標的學(xué)生來說,還有哪些方向可以去深挖呢? >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿


          # 回答一

          作者:張趔趄

          康奈爾大學(xué) 電子與計算機博士在讀

          來源鏈接:https://www.zhihu.com/question/440538267/answer/1719126442

          凡是個坑,都不好挖,能挖一坑,便能雄霸一方,挖多挖大,方能一統(tǒng)江湖。若只求畢業(yè),hmmm....不需挖坑。
          做機器/深度學(xué)習(xí)相關(guān)的基礎(chǔ)方法研究,難度不小,在硬件資源和自身梳理基礎(chǔ)上有一定門檻。但是相關(guān)領(lǐng)域的應(yīng)用卻未見得。比如個人所在的醫(yī)學(xué)圖像領(lǐng)域,和臨床應(yīng)用息息相關(guān),每天都會有新的問題產(chǎn)生,也會有新的數(shù)據(jù)產(chǎn)生。如何利用這些數(shù)據(jù),建立合適的模型去幫助醫(yī)生或者醫(yī)學(xué)科研工作者,其意義不言而喻。這些問題有小也有大,可以具體到一個非常垂直場景的應(yīng)用,也可以泛化到一些基礎(chǔ)性的問題如下
          1. 例如MRI掃描加速。在紐約,在醫(yī)院掃一次MRI,大概要2k刀左右,具體跟你需要的sequence還可能有關(guān)系。如果你能在不損失圖像質(zhì)量和信息的情況下對其進行加速,將具備巨大的經(jīng)濟價值。想當(dāng)年的compressed sensing和衍生出來的sparse representation,dictionary learning等在deep learning era之前的火爆程度,這不就說明這里面解決到的是fundamental的問題,其原理不僅可以加速MRI掃描,也可以被泛化應(yīng)用到其他地方,從而產(chǎn)生很大的影響力。

          2. 又例如medical image reconstruction, 大多數(shù)這樣的問題都是ill-posed,傳統(tǒng)解法是formulate成一個優(yōu)化問題,加上一些constraint/prior,從而求解。然而這些圖像每個人掃出來的雖細節(jié)不一樣,但是呢大體結(jié)構(gòu)又類似,那么如何讓深度/機器學(xué)習(xí)能更好的學(xué)習(xí)到prior然后來更快更好的解這些優(yōu)化問題呢?如果這個問題能被解決,那是不是可以直接應(yīng)用到其他類似需要領(lǐng)域呢,

          3. 在醫(yī)學(xué)圖像里有一類優(yōu)化問題,自身存在結(jié)構(gòu),雖然from scratch去優(yōu)化可以得到正確的結(jié)果,但是深度學(xué)習(xí)是不是可以更好的去approximate這些優(yōu)化問題,利用自身的提取特征的能力來助力這些優(yōu)化?讓模型學(xué)習(xí)到這些結(jié)構(gòu),然后在之后的優(yōu)化中就可以進一步提升速度。讓深度網(wǎng)絡(luò)變成一個優(yōu)化器。比如我的一個co-authro Mert Sabuncu提出的VoxelMorph,用來深度學(xué)習(xí)來實現(xiàn)image registration; 比如另一個co-author,Jinwei提出的用fidelity loss來對沒有見過的數(shù)據(jù)進行refine.

          4. 又比如做medical image analysis的第一步,往往是對ROI進行segmentation,如何真正的利用人體結(jié)構(gòu)的相似性來更好的讓模型學(xué)習(xí)到一些結(jié)構(gòu),而不是直接遷移一些自然圖像里的方法呢?

          上面說的還是相對基礎(chǔ)的一些問題,在醫(yī)療數(shù)據(jù)中有很多應(yīng)用場景,任何一個需要用計算機輔助人工甚至替代的地方都可以嘗試用深度/機器學(xué)習(xí)的辦法來解決。但是這些場景對于一個純研究算法的人來說,不一定接觸的到。所以本質(zhì)上,現(xiàn)階段在沒有方法性的新坑的情況下,我們結(jié)合一些垂直場景的domain knowledge,把這個垂直結(jié)構(gòu)做深入,才是生存之道。醫(yī)療數(shù)據(jù)這一塊個人認為這個行業(yè)雖然下限不低,但是如果解決的問題不是醫(yī)學(xué)的一些本質(zhì)問題例如癌癥,阿爾茲海默等,是不會有那種大新聞的。但是隨著國內(nèi)醫(yī)療環(huán)境的改善,以及國家未來對醫(yī)療行業(yè)的加大投入,這里面機會很多。同樣對于其他的領(lǐng)域也是如此,比如遙感圖像,生物制藥等
          但說實話,求畢業(yè)的話,做應(yīng)用,或者改改模型,應(yīng)該很容易吧?

          # 回答二

          作者:微調(diào)

          CMU博士在讀

          來源鏈接:https://www.zhihu.com/question/440538267/answer/1717701231

          如果限制你的是研究能力,也的確可以用苦工來彌補研究上的不足,而順利畢業(yè)。
          既然題目里說是為了畢業(yè)不為其他,那就先說怎么畢業(yè)。這問題我很有經(jīng)驗,因為常常有網(wǎng)友問我要點子來畢業(yè),我無償?shù)奶峁┻^各種亂七八糟的方案,有很多成功案例。不過大家不必單獨聯(lián)系我了,我直接把策略寫出來了。
          1. 最容易的就是做交叉application,算法A在任務(wù)B上的表現(xiàn)等。如果發(fā)會議就能畢業(yè)的話,ccf的c類會議里有相當(dāng)一部分都有>40%接受率(ICANN,IJCNN,ICPR等),你魔改一點網(wǎng)絡(luò)結(jié)構(gòu)去嘗試解決一個沒人在乎的問題,只要寫的別太拉胯就碩士畢業(yè)了。我舉一些不存在的例子,如何使用「魔改的RCNN」(這個可以替換為任何經(jīng)典模型)解決「室內(nèi)建筑通風(fēng)能力預(yù)測」的問題。再來一個,如何集成「多個自編碼器」提升「圖片中太陽花」的檢測率。再來一個,如何用「自監(jiān)督學(xué)習(xí)」來發(fā)現(xiàn)「海洋圖片中的污染情況評估」。怎么找應(yīng)用看你有沒有啥合適的數(shù)據(jù),有的話多的是腦洞應(yīng)用。不行的話,翻翻這個答案隨便找點數(shù)據(jù):機器學(xué)習(xí)需要的大量數(shù)據(jù)集從哪里找?(https://www.zhihu.com/question/342295029/answer/915272899其實這類沒啥意義的文章其實才是泛學(xué)術(shù)圈的主流,我們不鼓勵這類內(nèi)容,但也明白很多人只是為了畢業(yè),不丟人。

          2. 或者現(xiàn)在很多人也喜歡大規(guī)模的比較和benchmark,比如討論20種聚類算法在100個數(shù)據(jù)上的一些表現(xiàn)啥的。然后有些“驚人”的發(fā)現(xiàn),比如原來某個領(lǐng)域20年來都沒啥新進展。比如mlsys20上這篇arxiv.org/pdf/2003.0303 ,研究了81篇文章里的pruning的方法。

          3. 再來,就是做數(shù)據(jù)集,你去UCI上看看各種各樣的數(shù)據(jù)集,能不能把它們改成其他任務(wù)的。比如把分類任務(wù)改成聚類的,把回歸改成檢測。很多會議也喜歡新的數(shù)據(jù)集,尤其是大數(shù)據(jù)集,或者多個數(shù)據(jù)集。

          如果不是為了著急畢業(yè),而是真的找一些別人還沒做的新坑,我覺得可以考慮一下scalability和machine learning (mlsys)。大概的問題定義是這樣的,隨著算法的不斷豐富,我們?nèi)绾卧谠絹碓酱蟮臄?shù)據(jù)上應(yīng)用這些算法。比如大型網(wǎng)絡(luò)平臺需要每秒上千萬次的推薦,金融風(fēng)控需要實時監(jiān)測欺詐交易等。細分的話內(nèi)容挺多的,比如并行訓(xùn)練、機器學(xué)習(xí)模型編譯、自動機器學(xué)習(xí)、模型壓縮等等。大概就是從很多角度都可以增強系統(tǒng)的吞吐和處理能力,當(dāng)然另一個極端就是怎么在低功耗的硬件上處理復(fù)雜的機器學(xué)習(xí)問題。
          算法在大規(guī)模上如何做到低并發(fā),很適合有系統(tǒng)啊、并行計算、高性能計算背景的同學(xué),尤其是適合編程能力很強的同學(xué),因為會涉及到很多開發(fā)的內(nèi)容。而且創(chuàng)新的方向很多,比如算法模擬上的(比如用locality sensitive hashing來計算不同樣本間的相似度),又比如計算精度上的(用half tensor的話會導(dǎo)致什么結(jié)果),也比如硬件上的(放到很多機器上分布怎么做等)。而且往往不同的方向都能疊起來一起用,這就導(dǎo)致了你可以有很多種排列組合解決不同的問題。也有很多理論上的坑,比如在模擬的同時如何確保正確性在  的概率是正確的。
          因為以前我們在ML領(lǐng)域主要是在意新算法,或許現(xiàn)在來做怎么把經(jīng)典算法變快、變得更有擴展性、更魯棒,也是很棒的坑。研究生三年,一年入門,一年做系統(tǒng),再爭取一年投出去,就能畢業(yè)啦。不僅進行了科研,還提高了編程能力,美滋滋。萬一一不小心做出個有用的系統(tǒng),還能有工業(yè)界影響力。
          所以回到問題本身,最容易畢業(yè)發(fā)文章的大概就是套application發(fā)個會議就順利過關(guān)了。但如果想真的挖出有意義的坑的話,大概率是不“好”挖的。還是搞清楚自己需要什么更重要,然后實現(xiàn)自己的需求即可。

          # 回答三

          作者:金雪鋒

          MindSpore首席架構(gòu)師

          來源鏈接:https://www.zhihu.com/question/440538267/answer/1699917805

          供參考:
          1、AI與科學(xué)計算結(jié)合
          AI技術(shù),特別是深度學(xué)習(xí)/強化學(xué)習(xí)/圖神經(jīng)網(wǎng)絡(luò)等方法,基于實驗或者計算產(chǎn)生的數(shù)據(jù)對所求解的問題進行可計算建模,從而得到復(fù)雜問題的有效解決方式,這對當(dāng)今科學(xué)的研究范式已經(jīng)產(chǎn)生了巨大影響。經(jīng)過近幾年的發(fā)展,通過AI建模/AI求解/框架加速等手段,已經(jīng)滲透到科學(xué)的各個領(lǐng)域,例如數(shù)學(xué),化學(xué),物理等,這里我列舉幾個AI+科學(xué)計算解決傳統(tǒng)問題的實例,拋磚引玉,歡迎大家討論。相信未來幾年,AI與科學(xué)計算交叉研究與應(yīng)用,會保持很高的熱度。
          2、通過Transformer堆疊的成大模型的思想,從NLP推廣到CV、多模
          這個就不用多講了(GPT-3、swith transformer、DALLE等),不過同時帶來的挑戰(zhàn)是這些超大模型怎么部署到邊和端。
          3、AI進入千行百業(yè),AI的可信可能是未來研究的熱點
          這里包括數(shù)據(jù)和模型的隱私、模型的魯棒性、模型的防竊取、數(shù)據(jù)防投毒、模型的可解釋性等等。

          推薦閱讀


          在做算法工程師的道路上,你掌握了什么概念或技術(shù)使你感覺自我提升突飛猛進?

          2021-03-13

          CVPR2021|超分性能不降低,計算量降低50%,董超等人提出加速圖像超分的ClassSR

          2021-03-10

          如何入門多視角人臉正面化生成?不得不看的超詳細最新綜述!

          2021-03-07



          # CV技術(shù)社群邀請函 #

          △長按添加極市小助手
          添加極市小助手微信(ID : cvmart2)

          備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標檢測-深圳)


          即可申請加入極市目標檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術(shù)交流群


          每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~


          △點擊卡片關(guān)注極市平臺,獲取最新CV干貨

          覺得有用麻煩給個在看啦~  


          瀏覽 32
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  天天肏天天肏天天 | 爱操逼逼| 全部免费毛片在线播放网站 | 一级毛片日韩 | 免费无码婬片AAAA片视频 |