短實體,長句實體抽取

向AI轉(zhuǎn)型的程序員都關(guān)注了這個號???
機器學(xué)習(xí)AI算法工程?? 公眾號:datayx
Entity-extractor-by-binary-tagging
“半指針-半標(biāo)注”方法實體的抽取器,基于蘇神的三元組抽取方法改造,這里取消了三元組抽取模型中對s的抽取,直接抽取實體并做分類(相當(dāng)于直接抽取p和o)。改造后的實體抽取方法不僅可以運用于短實體的抽取,也可以運用到長句實體的抽取。
代碼 以及運行教程??獲?。?/span>
關(guān)注微信公眾號 datayx ?然后回復(fù)??實體? 即可獲取。
AI項目體驗地址 https://loveai.tech
環(huán)境
python 3.6.7
transformers==3.0.2
torch==1.6.0
其他環(huán)境見requirements.txt
原理

運行
按照data中的格式整理好數(shù)據(jù)


運行main.py
結(jié)果
example_datasets1

這里的數(shù)據(jù)模式比較簡單,比較容易達到驗證集擬合狀態(tài)
example_datasets2

當(dāng)前模型這個人民日報的ner數(shù)據(jù)集效果不佳,需要近一步調(diào)參煉丹
測試
選擇測試模式,程序會讀取訓(xùn)練過程中最好的模型
交互測試結(jié)果如下
example_datasets1

example_datasets2

閱讀過本文的人還看了以下文章:
TensorFlow 2.0深度學(xué)習(xí)案例實戰(zhàn)
基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測
《基于深度學(xué)習(xí)的自然語言處理》中/英PDF
【全套視頻課】最全的目標(biāo)檢測算法系列講解,通俗易懂!
《美團機器學(xué)習(xí)實踐》_美團算法團隊.pdf
《深度學(xué)習(xí)入門:基于Python的理論與實現(xiàn)》高清中文PDF+源碼
python就業(yè)班學(xué)習(xí)視頻,從入門到實戰(zhàn)項目
2019最新《PyTorch自然語言處理》英、中文版PDF+源碼
《21個項目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實踐詳解》完整版PDF+附書代碼
《深度學(xué)習(xí)之pytorch》pdf+附書源碼
PyTorch深度學(xué)習(xí)快速實戰(zhàn)入門《pytorch-handbook》
【下載】豆瓣評分8.1,《機器學(xué)習(xí)實戰(zhàn):基于Scikit-Learn和TensorFlow》
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼
汽車行業(yè)完整知識圖譜項目實戰(zhàn)視頻(全23課)
李沐大神開源《動手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材
筆記、代碼清晰易懂!李航《統(tǒng)計學(xué)習(xí)方法》最新資源全套!
《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼
FashionAI服裝屬性標(biāo)簽圖像識別Top1-5方案分享
重要開源!CNN-RNN-CTC 實現(xiàn)手寫漢字識別
同樣是機器學(xué)習(xí)算法工程師,你的面試為什么過不了?
前海征信大數(shù)據(jù)算法:風(fēng)險概率預(yù)測
【Keras】完整實現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個項目,讓你掌握深度學(xué)習(xí)圖像分類
VGG16遷移學(xué)習(xí),實現(xiàn)醫(yī)學(xué)圖像識別分類工程項目
特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊
如何利用全新的決策樹集成級聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?
Machine Learning Yearning 中文翻譯稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在線識別手寫中文網(wǎng)站
中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學(xué)習(xí)與特征工程
不斷更新資源
深度學(xué)習(xí)、機器學(xué)習(xí)、數(shù)據(jù)分析、python
?搜索公眾號添加:?datayx??
機大數(shù)據(jù)技術(shù)與機器學(xué)習(xí)工程
?搜索公眾號添加:?datanlp
長按圖片,識別二維碼
