2021年,還能入坑NLP嗎?
最近有粉絲私信我,NLP很難學(xué),這條路能堅(jiān)持走嗎?有相同困惑的朋友可以一起探討一下:
大佬你好,我目前從事ERP運(yùn)維工作,想轉(zhuǎn)行NLP,開始是學(xué)數(shù)據(jù)結(jié)構(gòu)和c刷了些leetcode題,然后把cs224n和它的大作業(yè)都擼了一遍,做了點(diǎn)情感文本分類的小任務(wù)。
準(zhǔn)備去小公司找實(shí)習(xí)攢項(xiàng)目經(jīng)驗(yàn)時(shí)卻被同學(xué)勸退,說小公司學(xué)不到東西,然后有人建議趁早轉(zhuǎn)做開發(fā),nlp的路太難走了很難競(jìng)爭(zhēng)。
感覺自己實(shí)力很弱,也沒有人帶,去小公司怕淪為打雜工具人,大廠沒有項(xiàng)目經(jīng)歷又進(jìn)不去。
這種情況是應(yīng)該趁早自學(xué)轉(zhuǎn)一個(gè)新領(lǐng)域比如后端嗎?但總感覺這樣之前的都白學(xué)了,很焦慮也很糾結(jié)。希望大佬能幫助指點(diǎn)下方向。
這位朋友的問題,我從兩方面回答。
NLP學(xué)起來不容易
這是學(xué)習(xí)路徑不夠清晰的問題,深度學(xué)習(xí)既重理論又重實(shí)踐,一步登天不可取,學(xué)習(xí)應(yīng)該是循環(huán)且逐漸細(xì)化的。
先看一下學(xué)NLP的需要掌握的知識(shí)點(diǎn)全貌??

路徑大致為:基本原理→經(jīng)典模型→項(xiàng)目實(shí)踐
先閱讀機(jī)器學(xué)習(xí)和深度學(xué)習(xí)原理,其次了解經(jīng)典任務(wù)的baseline,動(dòng)手實(shí)踐,最后看懂代碼,在應(yīng)用程序場(chǎng)景中,嘗試修改模型,提高效果
清楚路徑后,逐個(gè)吃透:
基本原理部分有線性代數(shù)和概率論基礎(chǔ)就能看懂,統(tǒng)計(jì)機(jī)器學(xué)習(xí)部分,建議初學(xué)者先看懂線性分類、SVM、樹模型和圖模型。
有上述基礎(chǔ)后,就能看懂模型結(jié)構(gòu)和論文里的各種名詞公式。接下來就是了解NLP各個(gè)經(jīng)典任務(wù)的baseline,并看懂源碼。
對(duì)于TF和Pytorch的問題不用太糾結(jié),接口都差不多,找到什么就看什么,自己寫的話建議Pytorch。
上述任務(wù)都了解并且看了一些源碼后,就可以去煉丹了。
工作不好找
這個(gè)問題可以理解成,學(xué)到什么程度好找工作?
面試無非就是像面試官證明兩點(diǎn):①我知道怎么做②我做過
因此企業(yè)最看重的自然是項(xiàng)目經(jīng)歷,但初學(xué)者又很難接觸到工業(yè)界項(xiàng)目,怎么辦?
建議學(xué)好后去參加一次Kaggle、天池等平臺(tái)的比賽,享受優(yōu)化模型的摧殘。比賽項(xiàng)目和企業(yè)實(shí)操所需能力至少能匹配60%。
學(xué)習(xí)路線清楚了,那具體應(yīng)該學(xué)哪些內(nèi)容,以及怎么樣去coding實(shí)踐呢?
有沒有現(xiàn)成的資料供你系統(tǒng)性的學(xué)習(xí)NLP?我已經(jīng)給你準(zhǔn)備好了。
免費(fèi)工具一:《NLP入門視頻合集》限90份
它基于花書「Deep learning」、斯坦福CS224n自然語言處理、【論文】baseline基礎(chǔ)篇目——Word2Vec 詞向量扛鼎之作等經(jīng)典入門教程設(shè)計(jì),關(guān)于我學(xué)習(xí)路徑中提到的知識(shí)點(diǎn),它都有體現(xiàn)。
目前已經(jīng)有30000人通過這套課程學(xué)習(xí)NLP,普通理工科大學(xué)生大概三四個(gè)月可以掌握(學(xué)過C語言、線性代數(shù)、概率論)
掃碼回復(fù):NLP,免費(fèi)領(lǐng)
僅90份兌換碼,手慢無
課程學(xué)習(xí)包含四個(gè)模塊

章節(jié)導(dǎo)學(xué)視頻講解
(幫你梳理教程知識(shí)概要,并圈出重難點(diǎn))

手寫板詳細(xì)推導(dǎo)公式
(學(xué)科知識(shí)串聯(lián))

代碼復(fù)現(xiàn)
(作業(yè)代碼全部完成復(fù)現(xiàn),并進(jìn)行視頻完整講解)

免費(fèi)工具二:《算法工程師的就業(yè)指導(dǎo)課》
大廠資深算法工程師手把手教你做就業(yè)規(guī)劃
掃碼回復(fù):NLP
免費(fèi)領(lǐng)取
