<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          2021 年了,機器/深度學習還有哪些坑比較好挖?

          共 4040字,需瀏覽 9分鐘

           ·

          2021-03-19 13:27

          作者丨張趔趄、微調、金雪鋒
          來源丨知乎問答
          編輯丨極市平臺

          導讀

           

          深度學習以及機器學習發(fā)展至今,涌入了大量的人才和資源,有很多方向已經(jīng)達到了一個瓶頸,短時間內(nèi)有非常大的突破有些難以實現(xiàn)。那么對于有學術要求與指標的學生來說,還有哪些方向可以去深挖呢? 


          # 回答一

          作者:張趔趄

          康奈爾大學 電子與計算機博士在讀

          來源鏈接:https://www.zhihu.com/question/440538267/answer/1719126442

          凡是個坑,都不好挖,能挖一坑,便能雄霸一方,挖多挖大,方能一統(tǒng)江湖。若只求畢業(yè),hmmm....不需挖坑。
          做機器/深度學習相關的基礎方法研究,難度不小,在硬件資源和自身梳理基礎上有一定門檻。但是相關領域的應用卻未見得。比如個人所在的醫(yī)學圖像領域,和臨床應用息息相關,每天都會有新的問題產(chǎn)生,也會有新的數(shù)據(jù)產(chǎn)生。如何利用這些數(shù)據(jù),建立合適的模型去幫助醫(yī)生或者醫(yī)學科研工作者,其意義不言而喻。這些問題有小也有大,可以具體到一個非常垂直場景的應用,也可以泛化到一些基礎性的問題如下
          1. 例如MRI掃描加速。在紐約,在醫(yī)院掃一次MRI,大概要2k刀左右,具體跟你需要的sequence還可能有關系。如果你能在不損失圖像質量和信息的情況下對其進行加速,將具備巨大的經(jīng)濟價值。想當年的compressed sensing和衍生出來的sparse representation,dictionary learning等在deep learning era之前的火爆程度,這不就說明這里面解決到的是fundamental的問題,其原理不僅可以加速MRI掃描,也可以被泛化應用到其他地方,從而產(chǎn)生很大的影響力。

          2. 又例如medical image reconstruction, 大多數(shù)這樣的問題都是ill-posed,傳統(tǒng)解法是formulate成一個優(yōu)化問題,加上一些constraint/prior,從而求解。然而這些圖像每個人掃出來的雖細節(jié)不一樣,但是呢大體結構又類似,那么如何讓深度/機器學習能更好的學習到prior然后來更快更好的解這些優(yōu)化問題呢?如果這個問題能被解決,那是不是可以直接應用到其他類似需要領域呢,

          3. 在醫(yī)學圖像里有一類優(yōu)化問題,自身存在結構,雖然from scratch去優(yōu)化可以得到正確的結果,但是深度學習是不是可以更好的去approximate這些優(yōu)化問題,利用自身的提取特征的能力來助力這些優(yōu)化?讓模型學習到這些結構,然后在之后的優(yōu)化中就可以進一步提升速度。讓深度網(wǎng)絡變成一個優(yōu)化器。比如我的一個co-authro Mert Sabuncu提出的VoxelMorph,用來深度學習來實現(xiàn)image registration; 比如另一個co-author,Jinwei提出的用fidelity loss來對沒有見過的數(shù)據(jù)進行refine.

          4. 又比如做medical image analysis的第一步,往往是對ROI進行segmentation,如何真正的利用人體結構的相似性來更好的讓模型學習到一些結構,而不是直接遷移一些自然圖像里的方法呢?

          上面說的還是相對基礎的一些問題,在醫(yī)療數(shù)據(jù)中有很多應用場景,任何一個需要用計算機輔助人工甚至替代的地方都可以嘗試用深度/機器學習的辦法來解決。但是這些場景對于一個純研究算法的人來說,不一定接觸的到。所以本質上,現(xiàn)階段在沒有方法性的新坑的情況下,我們結合一些垂直場景的domain knowledge,把這個垂直結構做深入,才是生存之道。醫(yī)療數(shù)據(jù)這一塊個人認為這個行業(yè)雖然下限不低,但是如果解決的問題不是醫(yī)學的一些本質問題例如癌癥,阿爾茲海默等,是不會有那種大新聞的。但是隨著國內(nèi)醫(yī)療環(huán)境的改善,以及國家未來對醫(yī)療行業(yè)的加大投入,這里面機會很多。同樣對于其他的領域也是如此,比如遙感圖像,生物制藥等
          但說實話,求畢業(yè)的話,做應用,或者改改模型,應該很容易吧?

          # 回答二

          作者:微調

          CMU博士在讀

          來源鏈接:https://www.zhihu.com/question/440538267/answer/1717701231

          如果限制你的是研究能力,也的確可以用苦工來彌補研究上的不足,而順利畢業(yè)。
          既然題目里說是為了畢業(yè)不為其他,那就先說怎么畢業(yè)。這問題我很有經(jīng)驗,因為常常有網(wǎng)友問我要點子來畢業(yè),我無償?shù)奶峁┻^各種亂七八糟的方案,有很多成功案例。不過大家不必單獨聯(lián)系我了,我直接把策略寫出來了。
          1. 最容易的就是做交叉application,算法A在任務B上的表現(xiàn)等。如果發(fā)會議就能畢業(yè)的話,ccf的c類會議里有相當一部分都有>40%接受率(ICANN,IJCNN,ICPR等),你魔改一點網(wǎng)絡結構去嘗試解決一個沒人在乎的問題,只要寫的別太拉胯就碩士畢業(yè)了。我舉一些不存在的例子,如何使用「魔改的RCNN」(這個可以替換為任何經(jīng)典模型)解決「室內(nèi)建筑通風能力預測」的問題。再來一個,如何集成「多個自編碼器」提升「圖片中太陽花」的檢測率。再來一個,如何用「自監(jiān)督學習」來發(fā)現(xiàn)「海洋圖片中的污染情況評估」。怎么找應用看你有沒有啥合適的數(shù)據(jù),有的話多的是腦洞應用。不行的話,翻翻這個答案隨便找點數(shù)據(jù):機器學習需要的大量數(shù)據(jù)集從哪里找?(https://www.zhihu.com/question/342295029/answer/915272899其實這類沒啥意義的文章其實才是泛學術圈的主流,我們不鼓勵這類內(nèi)容,但也明白很多人只是為了畢業(yè),不丟人

          2. 或者現(xiàn)在很多人也喜歡大規(guī)模的比較和benchmark,比如討論20種聚類算法在100個數(shù)據(jù)上的一些表現(xiàn)啥的。然后有些“驚人”的發(fā)現(xiàn),比如原來某個領域20年來都沒啥新進展。比如mlsys20上這篇arxiv.org/pdf/2003.0303 ,研究了81篇文章里的pruning的方法。

          3. 再來,就是做數(shù)據(jù)集,你去UCI上看看各種各樣的數(shù)據(jù)集,能不能把它們改成其他任務的。比如把分類任務改成聚類的,把回歸改成檢測。很多會議也喜歡新的數(shù)據(jù)集,尤其是大數(shù)據(jù)集,或者多個數(shù)據(jù)集。

          如果不是為了著急畢業(yè),而是真的找一些別人還沒做的新坑,我覺得可以考慮一下scalability和machine learning (mlsys)。大概的問題定義是這樣的,隨著算法的不斷豐富,我們?nèi)绾卧谠絹碓酱蟮臄?shù)據(jù)上應用這些算法。比如大型網(wǎng)絡平臺需要每秒上千萬次的推薦,金融風控需要實時監(jiān)測欺詐交易等。細分的話內(nèi)容挺多的,比如并行訓練、機器學習模型編譯、自動機器學習、模型壓縮等等。大概就是從很多角度都可以增強系統(tǒng)的吞吐和處理能力,當然另一個極端就是怎么在低功耗的硬件上處理復雜的機器學習問題。
          算法在大規(guī)模上如何做到低并發(fā),很適合有系統(tǒng)啊、并行計算、高性能計算背景的同學,尤其是適合編程能力很強的同學,因為會涉及到很多開發(fā)的內(nèi)容。而且創(chuàng)新的方向很多,比如算法模擬上的(比如用locality sensitive hashing來計算不同樣本間的相似度),又比如計算精度上的(用half tensor的話會導致什么結果),也比如硬件上的(放到很多機器上分布怎么做等)。而且往往不同的方向都能疊起來一起用,這就導致了你可以有很多種排列組合解決不同的問題。也有很多理論上的坑,比如在模擬的同時如何確保正確性在  的概率是正確的。
          因為以前我們在ML領域主要是在意新算法,或許現(xiàn)在來做怎么把經(jīng)典算法變快、變得更有擴展性、更魯棒,也是很棒的坑。研究生三年,一年入門,一年做系統(tǒng),再爭取一年投出去,就能畢業(yè)啦。不僅進行了科研,還提高了編程能力,美滋滋。萬一一不小心做出個有用的系統(tǒng),還能有工業(yè)界影響力。
          所以回到問題本身,最容易畢業(yè)發(fā)文章的大概就是套application,發(fā)個會議就順利過關了。但如果想真的挖出有意義的坑的話,大概率是不“好”挖的。還是搞清楚自己需要什么更重要,然后實現(xiàn)自己的需求即可。

          # 回答三

          作者:金雪鋒

          MindSpore首席架構師

          來源鏈接:https://www.zhihu.com/question/440538267/answer/1699917805

          供參考:
          1、AI與科學計算結合
          AI技術,特別是深度學習/強化學習/圖神經(jīng)網(wǎng)絡等方法,基于實驗或者計算產(chǎn)生的數(shù)據(jù)對所求解的問題進行可計算建模,從而得到復雜問題的有效解決方式,這對當今科學的研究范式已經(jīng)產(chǎn)生了巨大影響。經(jīng)過近幾年的發(fā)展,通過AI建模/AI求解/框架加速等手段,已經(jīng)滲透到科學的各個領域,例如數(shù)學,化學,物理等,這里我列舉幾個AI+科學計算解決傳統(tǒng)問題的實例,拋磚引玉,歡迎大家討論。相信未來幾年,AI與科學計算交叉研究與應用,會保持很高的熱度。
          2、通過Transformer堆疊的成大模型的思想,從NLP推廣到CV、多模
          這個就不用多講了(GPT-3、swith transformer、DALLE等),不過同時帶來的挑戰(zhàn)是這些超大模型怎么部署到邊和端。
          3、AI進入千行百業(yè),AI的可信可能是未來研究的熱點
          這里包括數(shù)據(jù)和模型的隱私、模型的魯棒性、模型的防竊取、數(shù)據(jù)防投毒、模型的可解釋性等等。

          往期精彩:

          【原創(chuàng)首發(fā)】機器學習公式推導與代碼實現(xiàn)30講.pdf

          【原創(chuàng)首發(fā)】深度學習語義分割理論與實戰(zhàn)指南.pdf

           談中小企業(yè)算法崗面試

           算法工程師研發(fā)技能表

           真正想做算法的,不要害怕內(nèi)卷

           技術學習不能眼高手低

           技術人要學會自我營銷

           做人不能過擬合

          點個在看

          瀏覽 44
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲国产高清视频 | 亚洲AV无码无线在线观看护士 | 伊人久久爱 | 深爱激情五月婷婷 | 午夜成人网站在线观看 |