spaCyNLP 自然語言文本處理庫
spaCy 是一個 Python 和 CPython 的 NLP 自然語言文本處理庫。它建立在最新的研究基礎(chǔ)上,從設(shè)計的第一天起就被用于實際產(chǎn)品中。
spaCy 自帶預(yù)訓(xùn)練的管道,目前支持 60 多種語言的標(biāo)記化和訓(xùn)練。它具有最先進的速度和神經(jīng)網(wǎng)絡(luò)模型,可用于標(biāo)記、解析、命名實體識別、文本分類等,使用 BERT 等預(yù)訓(xùn)練的變換器進行多任務(wù)學(xué)習(xí),以及生產(chǎn)就緒的訓(xùn)練系統(tǒng)和簡單的模型打包、部署和工作流管理。
特性:
- 支持 60 多種語言
- 經(jīng)過訓(xùn)練的管道可以處理不同的語言和任務(wù)
- 使用像 BERT 這樣的預(yù)訓(xùn)練變壓器進行多任務(wù)學(xué)習(xí)
- 支持預(yù)訓(xùn)練的單詞向量和嵌入
- 最先進的速度
- 生產(chǎn)就緒培訓(xùn)系統(tǒng)
- 語言驅(qū)動的標(biāo)記化
- 用于命名實體識別、詞性標(biāo)記、依存關(guān)系分析、句子分段、文本分類、詞義化、形態(tài)分析、實體鏈接等的組件
- 使用自定義組件和屬性可輕松擴展
- 支持 PyTorch、TensorFlow 和其他框架中的自定義模型
- 內(nèi)置用于語法和 NER 的可視化工具
- 易于模型打包、部署和工作流管理
- 可靠的、經(jīng)過嚴格評估的精確度
評論
圖片
表情
