THUMT神經(jīng)機(jī)器翻譯工具包
THUMT 是由清華大學(xué)自然語言處理組開發(fā)的數(shù)據(jù)驅(qū)動(dòng)機(jī)器翻譯系統(tǒng)。
機(jī)器翻譯是一種自然語言處理任務(wù),其目的是使用計(jì)算機(jī)自動(dòng)翻譯自然語言。近幾年來,端到端的神經(jīng)機(jī)器翻譯發(fā)展迅速,已經(jīng)成為機(jī)器翻譯系統(tǒng)的新主流。
THUMT 是用于神經(jīng)機(jī)器翻譯的開源工具包,構(gòu)建于 Theano 之上,具有以下特點(diǎn):
基于 Attention 的翻譯模型。 THUMT 應(yīng)用了標(biāo)準(zhǔn)的 attention 編碼器-解碼器框架。
最低風(fēng)險(xiǎn)訓(xùn)練。除了標(biāo)準(zhǔn)最大似然估計(jì)(MLE)之外,THUMT 還支持最小風(fēng)險(xiǎn)訓(xùn)練(MRT),其目的是找到一組模型參數(shù),以最小化使用訓(xùn)練數(shù)據(jù)評估指標(biāo)(如 BLEU)計(jì)算的預(yù)期損失。
使用單一語言語料庫:THUMT 為 NMT 提供了半監(jiān)督訓(xùn)練(SST)能力,能夠利用豐富的單語語料庫資源來改善源-目標(biāo)和目標(biāo)-源 NMT 模型的學(xué)習(xí)。
可視化。為了更好地了解 NMT 的內(nèi)部工作,THUMT 提供了一個(gè)可視化工具來演示每個(gè)中間狀態(tài)與其相關(guān)語境之間的相關(guān)性。
評論
圖片
表情
