直播線上實(shí)時(shí)翻譯和流式字幕技術(shù)實(shí)踐與應(yīng)用
直播線上實(shí)時(shí)翻譯和流式字幕技術(shù),區(qū)別于傳統(tǒng)的線下翻譯+字幕疊加硬件設(shè)備,創(chuàng)新性的采用云線上實(shí)時(shí)翻譯+流式字幕疊加,通過API的方式實(shí)現(xiàn)直播視音頻分離、音頻轉(zhuǎn)碼、語音識(shí)別及轉(zhuǎn)文本、文本翻譯、自動(dòng)審核、字幕返回等功能,并最終將流式字幕疊加到直播源流中,語音識(shí)別、轉(zhuǎn)寫及翻譯準(zhǔn)確率預(yù)計(jì)可達(dá)90%以上,并擁有自動(dòng)校正功能,在保證字幕效果的情況下,極大的節(jié)省了使用成本,且系統(tǒng)支持動(dòng)態(tài)擴(kuò)縮容,便捷高效。
技術(shù)實(shí)現(xiàn)原理是將直播流進(jìn)行音頻流剝離,利用AI語音能力將直播流中的音頻流進(jìn)行實(shí)時(shí)識(shí)別、轉(zhuǎn)寫,同時(shí)進(jìn)行多語言翻譯及內(nèi)容審核,過濾敏感內(nèi)容,保障內(nèi)容的安全合規(guī),最終將識(shí)別的原語言和翻譯語言以實(shí)時(shí)字幕的方式疊加到直播流中,讓用戶可以在觀看直播畫面、聲音的同時(shí)可以獲取文字維度的信息,極大的提升用戶的觀看體驗(yàn)。

模塊組成:

業(yè)務(wù)實(shí)現(xiàn)流程:
技術(shù)優(yōu)勢(shì):
實(shí)踐過程中遇到的難點(diǎn):
技術(shù)應(yīng)用場(chǎng)景:
該技術(shù)可以廣泛的應(yīng)用于電商、會(huì)展、融媒、教育等領(lǐng)域,比如在電商領(lǐng)域,可以幫助企業(yè)聚焦直播帶貨出海業(yè)務(wù)場(chǎng)景,通過云端實(shí)時(shí)翻譯+多語言字幕的技術(shù)手段,降低海外地區(qū)用戶的觀看門檻,提升直播觀看量,從而提升商品購買轉(zhuǎn)化率和GMV;在會(huì)展行業(yè),可以完美替代同傳和線下硬件設(shè)備,大大降低會(huì)展直播成本。
技術(shù)實(shí)踐:
該技術(shù)在2021年相繼應(yīng)用于服貿(mào)會(huì)、亞歐商品貿(mào)易博覽會(huì)、商洽會(huì)等國際性展會(huì)項(xiàng)目中,具體效果通過下面的視頻來展示:
