面向深度學習研究人員的自然語言處理實例教程

向AI轉(zhuǎn)型的程序員都關注了這個號???
人工智能大數(shù)據(jù)與深度學習 ?公眾號:datayx
nlp-tutorial
nlp-tutorial是一個使用Pytorch/TensorFlow,學習自然語言處理的教程。大多數(shù)模型的代碼行數(shù)少于100行。
舊的TensorFlow v1代碼存檔在存檔文件夾中,適合初學者。
環(huán)境依賴:
Python 3.5+
Pytorch 1.0.0+
代碼和數(shù)據(jù)集 獲取方式
關注微信公眾號 datayx? 然后回復?NLP??即可獲取。
AI項目體驗地址?https://loveai.tech
1. Basic Embedding Model
1-1.?NNLM(Neural Network Language Model)?-?Predict Next Word
Paper -?A Neural Probabilistic Language Model(2003)
Colab -?NNLM.ipynb
1-2.?Word2Vec(Skip-gram)?-?Embedding Words and Show Graph
Paper -?Distributed Representations of Words and Phrases and their Compositionality(2013)
Colab -?Word2Vec.ipynb
1-3.?FastText(Application Level)?-?Sentence Classification
Paper -?Bag of Tricks for Efficient Text Classification(2016)
Colab -?FastText.ipynb
2. CNN(Convolutional Neural Network)
2-1.?TextCNN?-?Binary Sentiment Classification
Paper -?Convolutional Neural Networks for Sentence Classification(2014)
TextCNN.ipynb
3. RNN(Recurrent Neural Network)
3-1.?TextRNN?-?Predict Next Step
Paper -?Finding Structure in Time(1990)
Colab -?TextRNN.ipynb
3-2.?TextLSTM?-?Autocomplete
Paper -?LONG SHORT-TERM MEMORY(1997)
Colab -?TextLSTM.ipynb
3-3.?Bi-LSTM?-?Predict Next Word in Long Sentence
Colab -?Bi_LSTM.ipynb
4. Attention Mechanism
4-1.?Seq2Seq?-?Change Word
Paper -?Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation(2014)
Colab -?Seq2Seq.ipynb
4-2.?Seq2Seq with Attention?-?Translate
Paper -?Neural Machine Translation by Jointly Learning to Align and Translate(2014)
Colab -?Seq2Seq(Attention).ipynb
4-3.?Bi-LSTM with Attention?-?Binary Sentiment Classification
Colab -?Bi_LSTM(Attention).ipynb
5. Model based on Transformer
5-1.?The Transformer?-?Translate
Paper -?Attention Is All You Need(2017)
Colab -?Transformer.ipynb,?Transformer(Greedy_decoder).ipynb
5-2.?BERT?-?Classification Next Sentence & Predict Masked Tokens
Paper -?BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding(2018)
Colab -?BERT.ipynb
閱讀過本文的人還看了以下文章:
基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測
《深度學習入門:基于Python的理論與實現(xiàn)》高清中文PDF+源碼
python就業(yè)班學習視頻,從入門到實戰(zhàn)項目
2019最新《PyTorch自然語言處理》英、中文版PDF+源碼
《21個項目玩轉(zhuǎn)深度學習:基于TensorFlow的實踐詳解》完整版PDF+附書代碼
PyTorch深度學習快速實戰(zhàn)入門《pytorch-handbook》
【下載】豆瓣評分8.1,《機器學習實戰(zhàn):基于Scikit-Learn和TensorFlow》
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼
汽車行業(yè)完整知識圖譜項目實戰(zhàn)視頻(全23課)
李沐大神開源《動手學深度學習》,加州伯克利深度學習(2019春)教材
筆記、代碼清晰易懂!李航《統(tǒng)計學習方法》最新資源全套!
《神經(jīng)網(wǎng)絡與深度學習》最新2018版中英PDF+源碼
重要開源!CNN-RNN-CTC 實現(xiàn)手寫漢字識別
【Keras】完整實現(xiàn)‘交通標志’分類、‘票據(jù)’分類兩個項目,讓你掌握深度學習圖像分類
VGG16遷移學習,實現(xiàn)醫(yī)學圖像識別分類工程項目
特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊
如何利用全新的決策樹集成級聯(lián)結(jié)構gcForest做特征工程并打分?
Machine Learning Yearning 中文翻譯稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在線識別手寫中文網(wǎng)站
中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學習與特征工程
不斷更新資源
深度學習、機器學習、數(shù)據(jù)分析、python
?搜索公眾號添加:?datayx??
機大數(shù)據(jù)技術與機器學習工程
?搜索公眾號添加:?datanlp
長按圖片,識別二維碼
