<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          靈魂拷問:機器學(xué)習(xí)、深度學(xué)習(xí)專業(yè)已經(jīng)淪為調(diào)包專業(yè)了嗎?

          共 3509字,需瀏覽 8分鐘

           ·

          2021-05-19 17:35

          有碩士同學(xué)問:小弟現(xiàn)在正在高校讀碩士,目前跟著導(dǎo)師做自然語言處理的研究,雖說聽起來高大上,但是做過的都知道,例如深度學(xué)習(xí)框架跑起來就是各種調(diào)包,運氣好湊個模型出來發(fā)發(fā)論文,技術(shù)含量就比較稀少了,感覺現(xiàn)在的工作隨便找個由點編程經(jīng)驗的培訓(xùn)一下就能上手了。

          所謂外練筋骨皮,內(nèi)練一口氣,想請教一下各位大佬:你認為計算機專業(yè)真正的價值在哪呢?把編程部分剔除之后,計算機真正該研究的是什么呢?它的氣又在哪兒?

          本文來源:知乎

          回答一

          作者:演奏代碼的程序媛
          鏈接:https://www.zhihu.com/question/327494084/answer/1641774776

          目前來看,起碼在計算機視覺自然語言處理領(lǐng)域確實是這樣。

          深度學(xué)習(xí)當前最主要的兩個應(yīng)用也就是計算機視覺和自然語言處理。

          其一,這兩個領(lǐng)域在專家們搞不清楚內(nèi)部原理的情況下,就用不斷堆疊的網(wǎng)絡(luò)層數(shù)已經(jīng)顛覆了傳統(tǒng)算法。

          對于論文作者來說,你又說不出個具體原理,大家憑什么相信你的這個結(jié)構(gòu)能達到自己論文說的精度?只能發(fā)論文的時候開源代碼,留給大眾檢驗。看當前深度學(xué)習(xí)論文有沒有用,先得看他敢不敢開源。

          所以,現(xiàn)在大多數(shù)好用的深度學(xué)習(xí)算法都開源,包括目標檢測的rcnn系列,yolo系列,ssd等。

          其二,也正因為說不出什么道理,真正深入研究各種深度學(xué)習(xí)算法和網(wǎng)絡(luò)結(jié)構(gòu)的大牛,要不通過實驗室里強大的計算資源來試湊各種有效的框架(非常燒錢)——比如谷歌提出的inception系列網(wǎng)絡(luò)結(jié)構(gòu)就是試出來的;

          要不就是憑借對深度學(xué)習(xí)的深刻理解和強大的創(chuàng)新能力,提出了新穎的深度學(xué)習(xí)算法——比如提出反向傳播和玻爾茲曼機的Hinton,以及提出卷積神經(jīng)網(wǎng)絡(luò)和將深度學(xué)習(xí)引入圖像識別的Yann LeCun(這里說的提出不是拍腦袋一想就瞎說的,人家是靠數(shù)學(xué)硬生生推導(dǎo)出來的),這種天才百年難遇。

          而工業(yè)界又需要借助人工智能的東風(fēng)提高自己公司的競爭力。但是大多數(shù)公司卻沒有能力自己設(shè)計好用的網(wǎng)絡(luò)結(jié)構(gòu)和算法,只能照著大牛的論文來包裝。不會改只會用,這樣就造成了算法少、需求多的局面?,F(xiàn)在大牛提出的很多著名的深度學(xué)習(xí)算法,基本都被實現(xiàn)遍了。

          其三,當前深度學(xué)習(xí)程序普遍用Python語言編寫,Python以包多、調(diào)包方便而聞名,在機器學(xué)習(xí)方面有著名的scikit-learn包,在數(shù)據(jù)處理方面有Pandas、圖像處理有skimage、pillow等,更別說主流的深度學(xué)習(xí)框架Tensorflow、Pytorch、keras等都主要運行在python下,copy別人的代碼復(fù)用簡單,只要你能找得到。

          所以。在以上三個原因結(jié)合之下,目前起碼在這兩個領(lǐng)域,整個工業(yè)界都是在調(diào)包、調(diào)參。

          做一個小的比喻:目前深度學(xué)習(xí)好比做中餐,師傅(論文作者)告訴你做包子要加入適當?shù)柠}、大料、味精。雖然你不明白這個適當?shù)降资嵌嗌?,但是他順帶給你把餡兒和皮兒都準備齊全了,你需要做的就是按照自己的喜好把包子形狀捏一下。

          再說說人才供求方面,目前做自然語言處理和圖像處理的,對應(yīng)于企業(yè)的崗位是「算法工程師」。通過前邊所述,目前這個聽起來高大上的「算法工程師」,其實技術(shù)含量并不比開發(fā)高多少(甚至只會更低),學(xué)學(xué)吳恩達的課,就自稱算法工程師的不在少數(shù)。

          但是目前大多數(shù)公司給的崗位工資比開發(fā)還高不少。

          長久來看,只會調(diào)包肯定是沒有競爭力的,當大量「調(diào)包俠」涌入這個行業(yè),擠掉行業(yè)泡沫的時候,算法工程師這個職位總會洗去鉛華,做一些更有難度和挑戰(zhàn)性的工作。

          對于有志于未來進入這個行業(yè)的學(xué)生來說,我的建議有兩條路:

          1. 對于以后想做語音識別和計算機視覺的同學(xué)來說:

          為了完成工作可以調(diào)包,但是趁著現(xiàn)在有大量的時間,最好可以自己親手實現(xiàn)一下主流的算法(雖然這個過程比較難),一來提高自己的動手編能力,二來深入理解算法設(shè)計思想,實在不行以后做開發(fā)也用的到編程能力。

          1. 對于以后沒有明確目標,只想從事人工智能的同學(xué)來說:

          建議了解一下強化學(xué)習(xí)相關(guān)內(nèi)容。強化學(xué)習(xí)算法才有可能制造出真正的人工智能,alpha go下圍棋那么厲害,起決定性作用的決策算法也是采用了強化學(xué)習(xí)的思想,更重要的是,強化學(xué)習(xí)算法對于數(shù)學(xué)要求更高,進入門檻也更高。

          回答二

          作者:霍華德
          鏈接:https://www.zhihu.com/question/327494084/answer/721135096
          來源:知乎
          著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。

          我想你可能做了虛假的AI,虛假的AI有以下特點:

          • 從不自己收集、處理、清洗、標注數(shù)據(jù),而是找一個現(xiàn)有的數(shù)據(jù)集,瘋狂 過擬合數(shù)據(jù)集。

          • 科研idea主要來自于各種模塊的花式排列組合,包含但不限于:各種CNN,各種RNN,各種attention,各種transformer,各種dropout,各種batchNorm,各種激活函數(shù),各種loss function

          • 而不是從實際問題和自然語言的現(xiàn)有挑戰(zhàn)出發(fā)來思考idea

          • 總是指望靠一個算法、一個模型可以解決所有問題

          想做好真實AI,必須:

          • 不斷反饋,分析,改進。據(jù)說谷歌的搜索質(zhì)量負責(zé)人Amit Singhal博士每天要看20個以上的不好搜索結(jié)果,然后持續(xù)不斷的迭代改進。

          • 面對真實環(huán)境中獲取數(shù)據(jù)難,數(shù)據(jù)標注成本高,數(shù)據(jù)臟難清洗等問題

          • 從實際問題和自然語言的現(xiàn)有挑戰(zhàn)出發(fā),設(shè)計針對問題最適合合理有效的模型

          • 從不指望一個算法和問題可以解決所有問題,所有遇到的問題會做出合理的分析和拆解,針對各個難點設(shè)計最優(yōu)解決算法,各個擊破。

          回答三

          作者:zibuyu9
          鏈接:https://www.zhihu.com/question/327494084/answer/723626230

          我當年讀博的時候,機器學(xué)習(xí)和自然語言處理的好用開源軟件很少,新發(fā)表論文也沒有開源代碼的習(xí)慣,復(fù)現(xiàn)別人工作總是最費時、費神、折磨人的環(huán)節(jié)。從那個時期過來的,我覺得現(xiàn)在開源之風(fēng)大盛,能讓大家方便地站在巨人肩膀上登高望遠,是多么幸福的事情。

          所以,在工具成熟之后,就給人更多選擇的可能性,有的人滿足于熟練使用現(xiàn)有工具,有的人致力于更好地做創(chuàng)新研究,各取所需而已。這就像微軟等軟件企業(yè),致力于研制改進各類軟件工具,而更多的人使用這些工具,整個生態(tài)就是這樣慢慢成熟起來。相信未來機器學(xué)習(xí)領(lǐng)域也會慢慢誕生微軟這樣的企業(yè),有人研制,有人使用。

          回答四

          作者:萬盛中路搖滾樂隊
          鏈接:https://www.zhihu.com/question/327494084/answer/702810200

          調(diào)參是 ML 這一領(lǐng)域不可避免的,但 ML 并不只是調(diào)參。

          學(xué)習(xí) ML 這一方向,最重要的,個人認為是搞懂基本數(shù)學(xué)原理。尤其是在當前各種包極大豐富的情況下。

          就比如線性回歸,你需要搞懂,數(shù)學(xué)公式當中,哪些部分是學(xué)習(xí)出來的,哪些部分是固定的,每一部分的“物理意義”是什么,一個公式里面,絕不會有無緣無故多出來的東西,每個東西都有其存在的意義。

          然后才是嘗試去寫代碼,比如要實現(xiàn)一個線性回歸,你會怎么實現(xiàn)(這個可以看現(xiàn)有包的源代碼)。進而可以推廣到其他的模型方法。

          你是做 NLP 的,那你應(yīng)該至少會看 ACL / EMNLP / NAACL / COLING 的文章吧。找到自己感興趣的文章,反復(fù)閱讀。

          看文章的重點在于,

          1. 搞清楚文章要解決什么問題。

          2. 當前這個問題存在的現(xiàn)狀是什么樣的,為什么會存在,現(xiàn)有的解決方法是什么。

          3. 現(xiàn)有解決方法的不足是什么。

          4. 作者提出的解決方法是基于什么思想,這一步非常重要。

          5. 作者的模型是怎么做的。

          從我的學(xué)習(xí)經(jīng)歷來看,這其中,5可能是最不重要的。而搞清楚 4 直接可以推出各種不同的5。我之前有實驗室的哥們,分析了某一篇文章的4,然后在那篇文章的5上加了不到20行代碼,效果提升了20%。

          如果你對機器學(xué)習(xí)還是很有熱情的,那你可以多專心思考一下機器學(xué)習(xí)當中一些脫離了編碼的本質(zhì)問題。多看論文,多寫代碼,寫一些脫離了現(xiàn)有包的代碼。這有助于你培養(yǎng)很好的問題分析 insight。

          如果你對機器學(xué)習(xí)感到絕望,請像我一樣,轉(zhuǎn)方向吧。之所以感到絕望,是因為窮,買不起顯卡

          參考

          鏈接:https://www.zhihu.com/question/327494084

           End 


          聲明:部分內(nèi)容來源于網(wǎng)絡(luò),僅供讀者學(xué)術(shù)交流之目的。文章版權(quán)歸原作者所有。如有不妥,請聯(lián)系刪除。


          點「在看」的人都變好看了哦!
          瀏覽 67
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  三级黄瓜视频 | 含羞草国产一区二区 | 啪啪啪视频免费看 | 骚视频在线观看 | 亚洲中文版字幕 |