<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          AI就業(yè)前景越來(lái)越嚴(yán)峻了,AI 開發(fā)者能怎樣提升個(gè)人競(jìng)爭(zhēng)優(yōu)勢(shì)?

          共 4752字,需瀏覽 10分鐘

           ·

          2020-07-31 23:00


          向AI轉(zhuǎn)型的程序員都關(guān)注了這個(gè)號(hào)???

          機(jī)器學(xué)習(xí)AI算法工程?? 公眾號(hào):datayx



          在人工智能領(lǐng)域的就業(yè)和發(fā)展的問題上,肯定有很多老師和前輩以各自的角度給出回答,我從本科畢業(yè)到現(xiàn)在,在機(jī)器學(xué)習(xí)、知識(shí)圖譜方面從事了六、七年時(shí)間,只有各種項(xiàng)目代碼寫得算多吧。我想純粹從工程實(shí)踐經(jīng)驗(yàn)中,為大家提供一些啟發(fā)。



          我認(rèn)為人工智能的發(fā)展,一直是一個(gè)追求統(tǒng)一理論的過程,這不僅僅是我們希望達(dá)到所謂“強(qiáng)人工智能”或“通用人工智能”( AGI ),這個(gè)目標(biāo)同時(shí)也是希望能將各種輔助與增強(qiáng)人類的功能,用一種更通用而優(yōu)美的方法解決。


          今天正在發(fā)展的各種深度學(xué)習(xí)算法,就是這樣通用的一種方法,可惜的是,它并不優(yōu)美。謝天謝地的是,它真的有用。


          即便有各種論文方法解讀深度學(xué)習(xí)模型,但是各種模型、方法為什么有效,以及如何更有效,依然是一個(gè)有待解決的問題。AI領(lǐng)域的繼續(xù)發(fā)展可能就會(huì)從火熱的理論爆發(fā),逐漸轉(zhuǎn)變?yōu)楦鱾€(gè)領(lǐng)域再次細(xì)致化,與實(shí)踐更好結(jié)合的穩(wěn)定發(fā)展階段。這可能是一次衰退,但是我相信它絕對(duì)不會(huì)像過去兩次人工智能寒冬 (AI Winter)那樣直接,它會(huì)以更平緩的方式到來(lái)。


          在學(xué)術(shù)成果爆發(fā)的階段,我們能觀察到,幾乎任何一個(gè)領(lǐng)域的問題,如果把它歸類到某個(gè)深度學(xué)習(xí)的模型方法上,都可以得到比過去更好的解答。而隨著研究領(lǐng)域逐漸進(jìn)入發(fā)展與落地階段,互聯(lián)網(wǎng)公司也從過高的市場(chǎng)熱度中逐漸恢復(fù)平靜。



          人工智能發(fā)展一直是波折前進(jìn)的,人工智能技術(shù)的目的是服務(wù)于人類,輔助于人類智能,而具體的技術(shù)是規(guī)則、統(tǒng)計(jì)還是深度學(xué)習(xí),其實(shí)本質(zhì)上是不重要的,在波折的過程中我們總會(huì)離目標(biāo)越來(lái)越近。


          現(xiàn)在,隨著深度學(xué)習(xí)的流行,我們已經(jīng)擁有 TensorFlow 等幾乎能夠解決所有問題的深度學(xué)習(xí)框架,站在已有的各種基于深度學(xué)習(xí)的模型之上,并在工程中進(jìn)一步發(fā)展,在這個(gè)過程中,我覺得企業(yè)的人才的需求會(huì)有下面幾種變化


          1. 從對(duì)AI算法專家的需求,到對(duì)AI工程師的需求

          作為算法專家、研究員,所面對(duì)的問題往往是在固化其他各種參數(shù)下,甚至可能不計(jì)算其他成本得失下,只需要追求結(jié)果(GPT3的訓(xùn)練花費(fèi)約1200萬(wàn)美元)。這種方式在研究領(lǐng)域上自然是應(yīng)該的,而在實(shí)際企業(yè)的工程工程落地中,我們更多需要考慮的是如何在各種限制條件下,合理完成任務(wù)。

          AI工程師,首先要是一個(gè)工程師。


          如何評(píng)估在何種條件制約下能達(dá)成任務(wù),就不僅僅是需要只會(huì)少數(shù)幾種算法實(shí)現(xiàn)能力,而需要對(duì)多種模型有深入了解、快速實(shí)現(xiàn)的能力、與評(píng)估其結(jié)果與成本的能力。


          例如,我們需要實(shí)現(xiàn)一個(gè)基于圖片表示的搜索引擎時(shí),該用什么圖片表示方法、如何計(jì)算相似度,這還算是算法問題。而用什么樣的搜索基礎(chǔ)設(shè)施,設(shè)備成本和可能的響應(yīng)速度如何,能用什么軟件或基礎(chǔ)設(shè)施快速實(shí)現(xiàn),整個(gè)工程的實(shí)施成本等等,這些是工程師更多需要考慮的。


          2. 從部分算法知識(shí),發(fā)展到對(duì)算法理論與業(yè)務(wù)建模方法的深入理解


          很多時(shí)候要解決一個(gè)業(yè)務(wù)問題有很多種方法,而建模就是根據(jù)實(shí)際業(yè)務(wù)問題,在各種限制下,利用各種資源選擇一種最合適的方法。

          比如,當(dāng)我們說文本分類算法的時(shí)候,大家會(huì)覺得這是一個(gè)很簡(jiǎn)單的事情,輸入的是文本,輸出的是相應(yīng)的分類,無(wú)論模型是一個(gè) TextCNN、LSTM 還是 Transformer 都可以。


          模型本身是這樣沒錯(cuò),但是其實(shí)以下問題,都可以算是一個(gè)文本分類問題:

          • 如何通過引入常識(shí),解決螞蟻和蜘蛛誰(shuí)的腿更多這樣的分類選擇?

          • 如何通過引入知識(shí)圖譜,提高分類效果?

          • 如何結(jié)合文章和問題進(jìn)行建模,對(duì)閱讀理解的問題進(jìn)行分類?哪些業(yè)務(wù)可以被歸類為閱讀理解模型上?

          • 記憶機(jī)制(Memory)是如何影響分類任務(wù)?外部記憶呢?

          • 多個(gè)兩分類,還是一個(gè)多分類?

          • 只有Softmax做分類嗎?softplus、sigmoid用在什么時(shí)候?你清楚你的模型輸出的概率分布是什么樣嗎?你的實(shí)際業(yè)務(wù)需要什么樣?

          • 如果沒有任何標(biāo)注數(shù)據(jù)你要怎么做?



          當(dāng)你僅僅想要完成一件事兒的時(shí)候,它可以很簡(jiǎn)單,但是當(dāng)要深入理解業(yè)務(wù),并深入其核心的時(shí)候,也可以很復(fù)雜。使用如 TensorFlow 這樣的技術(shù)“完成”一件基于深度學(xué)習(xí)的工作在今天已經(jīng)非常簡(jiǎn)單,“做好”一件面向人工智能的工程,還有太多值得思考的地方。


          對(duì)于一個(gè)實(shí)際業(yè)務(wù)場(chǎng)景,有些可能沒這么復(fù)雜,不過更多時(shí)候其實(shí)比這更復(fù)雜,而這就要求 AI 人去深入理解業(yè)務(wù)問題,需要能類比所有已知的各種建模方法與軟件工程上的各種軟件迭代方法,找到最終的解決方案。


          那么,企業(yè)需要一個(gè)什么樣的開發(fā)者?

          首先,企業(yè)利益一般都體現(xiàn)在某個(gè)業(yè)務(wù)場(chǎng)景中。能完全在某個(gè)業(yè)務(wù)場(chǎng)景上成為工程領(lǐng)導(dǎo)者,才是企業(yè)所需要的人才。與其需要一個(gè)能實(shí)現(xiàn)最好算法的人,不如說企業(yè)更需要一個(gè)能更好理解業(yè)務(wù)、理解產(chǎn)品的人,這種人需要在工程、算法的各個(gè)角度都有一定了解。只有業(yè)務(wù)場(chǎng)景能實(shí)際落地,這樣才對(duì)企業(yè)產(chǎn)生真正直接的利益。


          業(yè)務(wù)場(chǎng)景也包括某種技術(shù),例如搜索或推薦,它需要對(duì)業(yè)務(wù)本身需求、來(lái)源數(shù)據(jù)、處理結(jié)果、工程效率等很多方面都有一定了解,甚至需要對(duì)同業(yè)公司、競(jìng)爭(zhēng)對(duì)手都有所了解,這樣才能統(tǒng)籌安排開發(fā)節(jié)奏,控制成本成本,創(chuàng)造最大收益。


          而最終的結(jié)果是,往往這種人才也因自身能力而獲益。今年總是有人問,是不是程序員過了35歲就都失業(yè)了?我不能說完全沒有這樣的情況,不過至少要避免這種情況的一個(gè)做法是,要盡量不讓自己的能力過于單一,需要能全方面的發(fā)展。


          如果你還在擔(dān)心在 AI 領(lǐng)域內(nèi)的發(fā)展,可以考慮以下幾個(gè)努力方向:


          1. 掌握與重溫各種理論知識(shí)

          以各種入門書籍、視頻為主, TensorFlow 的初級(jí)入門代碼與跑通一些簡(jiǎn)單的項(xiàng)目與例子為輔。通過各種書籍與視頻積累基本的理論知識(shí),建議可以參考 TensorFlow 官方列出的精選課程、官網(wǎng)上的精選學(xué)習(xí)資源,也可以從周志華老師的《機(jī)器學(xué)習(xí)》開始讀。另外我認(rèn)為,即便從中文教材開始讀,也要在積累一定經(jīng)驗(yàn)后,閱讀英文相關(guān)資源。


          為什么要不斷學(xué)習(xí)理論知識(shí)?一方面理論知識(shí)也在持續(xù)改進(jìn),人工智能一直都是一個(gè)非常年輕的學(xué)科,它本身的基礎(chǔ)也在不斷的更新。另一方面,不斷的學(xué)習(xí)與重溫知識(shí),是自我夯實(shí)基礎(chǔ)與激發(fā)靈感的重要途徑。


          2. 持續(xù)積累工程代碼經(jīng)驗(yàn)

          首先,建議多看 TensorFlow 相關(guān)的入門代碼教程,或者將例如 OpenNMT-tf 這樣項(xiàng)目的示例代碼跑通,也可以嘗試各種自己不太熟悉的領(lǐng)域或模型。這樣不僅能積累一些實(shí)操經(jīng)驗(yàn),也有助于保持對(duì)深度學(xué)習(xí)的熱情。


          工程代碼的經(jīng)驗(yàn)要以參考其他項(xiàng)目代碼為主,例如 OpenNMT-tf 或 TensorFlow 各種官方模型,包括 TensorFlow Hub 、Model Garden 的實(shí)現(xiàn)代碼,從別人的模型實(shí)踐中學(xué)習(xí)經(jīng)驗(yàn),同時(shí)盡可能地從頭開始完整復(fù)現(xiàn)一些經(jīng)典模型,例如 VGG / ResNet / BERT 等,而不僅僅是要求自己跑通別人的項(xiàng)目。甚至,嘗試將一些模型代碼與實(shí)際工作結(jié)合,制作一些具體的項(xiàng)目或應(yīng)用,例如配合 TensorFlow.js 實(shí)現(xiàn)一些簡(jiǎn)單的網(wǎng)頁(yè)應(yīng)用。


          個(gè)人經(jīng)驗(yàn)來(lái)說,我的主要工作都集中在自然語(yǔ)言處理領(lǐng)域,不過自然語(yǔ)言處理的很多任務(wù)其實(shí)都很難可視化,很多時(shí)間都是在跟各種語(yǔ)料、標(biāo)注數(shù)據(jù)打交道,做多了未免枯燥。這個(gè)時(shí)候我經(jīng)常就會(huì)去看看別的領(lǐng)域的結(jié)果,比如機(jī)器視覺相關(guān)的研究,看看YOLO如何實(shí)現(xiàn),U-net是如何識(shí)別衛(wèi)星照片中的各種建筑的,并且自己復(fù)現(xiàn)它們的模型和結(jié)果。在這個(gè)過程中,一方面積累了工程經(jīng)驗(yàn),另一方面也可以通過跨領(lǐng)域的交叉激發(fā)自己的思考能力,同時(shí)在實(shí)現(xiàn)這些模型的過程中又可以分享這些模型,給自己新的滿足感與成就感。


          3. 緊隨最新的技術(shù)與研究成果

          機(jī)器學(xué)習(xí)的相關(guān)開發(fā)者,無(wú)論是傾向于研究還是工程落地,都需要對(duì)于最新的各種研究成果保持敏銳直覺。這個(gè)時(shí)候可以通過訂閱 GitHub 中感興趣的項(xiàng)目/開發(fā)者/ Topic ,也需要訂閱如 arXiv 的關(guān)鍵字,經(jīng)常獲取關(guān)注領(lǐng)域的最新進(jìn)展。對(duì)于自己感興趣的研究結(jié)果,應(yīng)考慮嘗試復(fù)現(xiàn),在這個(gè)過程中積累工程與研究經(jīng)驗(yàn)。


          可以進(jìn)入 TensorFlow GitHub 頁(yè)面搜索感興趣的內(nèi)容 ,也可以手機(jī)端閱讀和收藏 TensorFlow 官方微信的“前沿研究”合集。

          在學(xué)習(xí)的過程中,需要充分利用自己的業(yè)余時(shí)間,在互聯(lián)網(wǎng)與科技行業(yè),技術(shù)不斷發(fā)展,10年前、5年前用到的技術(shù)和今天都有巨大區(qū)別,人工智能相關(guān)行業(yè)發(fā)展則更快。在這種情況下,需要不斷學(xué)習(xí)進(jìn)階,才能緊跟行業(yè)的發(fā)展。對(duì)于在職人員,不僅要充分利用業(yè)余時(shí)間學(xué)習(xí),同時(shí)可以考慮加入 TFUG ,多參加 TensorFlow 官方或社區(qū)組織的活動(dòng),接觸更多志同道合的人,共同進(jìn)步。




          閱讀過本文的人還看了以下文章:


          TensorFlow 2.0深度學(xué)習(xí)案例實(shí)戰(zhàn)


          基于40萬(wàn)表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測(cè)


          《基于深度學(xué)習(xí)的自然語(yǔ)言處理》中/英PDF


          Deep Learning 中文版初版-周志華團(tuán)隊(duì)


          【全套視頻課】最全的目標(biāo)檢測(cè)算法系列講解,通俗易懂!


          《美團(tuán)機(jī)器學(xué)習(xí)實(shí)踐》_美團(tuán)算法團(tuán)隊(duì).pdf


          《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)》高清中文PDF+源碼


          特征提取與圖像處理(第二版).pdf


          python就業(yè)班學(xué)習(xí)視頻,從入門到實(shí)戰(zhàn)項(xiàng)目


          2019最新《PyTorch自然語(yǔ)言處理》英、中文版PDF+源碼


          《21個(gè)項(xiàng)目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實(shí)踐詳解》完整版PDF+附書代碼


          《深度學(xué)習(xí)之pytorch》pdf+附書源碼


          PyTorch深度學(xué)習(xí)快速實(shí)戰(zhàn)入門《pytorch-handbook》


          【下載】豆瓣評(píng)分8.1,《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》


          《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼


          汽車行業(yè)完整知識(shí)圖譜項(xiàng)目實(shí)戰(zhàn)視頻(全23課)


          李沐大神開源《動(dòng)手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材


          筆記、代碼清晰易懂!李航《統(tǒng)計(jì)學(xué)習(xí)方法》最新資源全套!


          《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼


          將機(jī)器學(xué)習(xí)模型部署為REST API


          FashionAI服裝屬性標(biāo)簽圖像識(shí)別Top1-5方案分享


          重要開源!CNN-RNN-CTC 實(shí)現(xiàn)手寫漢字識(shí)別


          yolo3 檢測(cè)出圖像中的不規(guī)則漢字


          同樣是機(jī)器學(xué)習(xí)算法工程師,你的面試為什么過不了?


          前海征信大數(shù)據(jù)算法:風(fēng)險(xiǎn)概率預(yù)測(cè)


          【Keras】完整實(shí)現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個(gè)項(xiàng)目,讓你掌握深度學(xué)習(xí)圖像分類


          VGG16遷移學(xué)習(xí),實(shí)現(xiàn)醫(yī)學(xué)圖像識(shí)別分類工程項(xiàng)目


          特征工程(一)


          特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊


          特征工程(三):特征縮放,從詞袋到 TF-IDF


          特征工程(四): 類別特征


          特征工程(五): PCA 降維


          特征工程(六): 非線性特征提取和模型堆疊


          特征工程(七):圖像特征提取和深度學(xué)習(xí)


          如何利用全新的決策樹集成級(jí)聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?


          Machine Learning Yearning 中文翻譯稿


          螞蟻金服2018秋招-算法工程師(共四面)通過


          全球AI挑戰(zhàn)-場(chǎng)景分類的比賽源碼(多模型融合)


          斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


          python+flask搭建CNN在線識(shí)別手寫中文網(wǎng)站


          中科院Kaggle全球文本匹配競(jìng)賽華人第1名團(tuán)隊(duì)-深度學(xué)習(xí)與特征工程



          不斷更新資源

          深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、python

          ?搜索公眾號(hào)添加:?datayx??



          機(jī)大數(shù)據(jù)技術(shù)與機(jī)器學(xué)習(xí)工程

          ?搜索公眾號(hào)添加:?datanlp

          長(zhǎng)按圖片,識(shí)別二維碼

          瀏覽 40
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  一级免费视频网站 | 无码在线高清 | 一级A片一区二区 | 久久婷婷综合激情 | 国产一区免费看 |