<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          直播線上實(shí)時(shí)翻譯和流式字幕技術(shù)實(shí)踐與應(yīng)用

          共 1254字,需瀏覽 3分鐘

           ·

          2021-12-11 19:43

          直播線上實(shí)時(shí)翻譯和流式字幕技術(shù),區(qū)別于傳統(tǒng)的線下翻譯+字幕疊加硬件設(shè)備,創(chuàng)新性的采用云線上實(shí)時(shí)翻譯+流式字幕疊加,通過API的方式實(shí)現(xiàn)直播視音頻分離、音頻轉(zhuǎn)碼、語音識(shí)別及轉(zhuǎn)文本、文本翻譯、自動(dòng)審核、字幕返回等功能,并最終將流式字幕疊加到直播源流中,語音識(shí)別、轉(zhuǎn)寫及翻譯準(zhǔn)確率預(yù)計(jì)可達(dá)90%以上,并擁有自動(dòng)校正功能,在保證字幕效果的情況下,極大的節(jié)省了使用成本,且系統(tǒng)支持動(dòng)態(tài)擴(kuò)縮容,便捷高效。


          技術(shù)實(shí)現(xiàn)原理是將直播流進(jìn)行音頻流剝離,利用AI語音能力將直播流中的音頻流進(jìn)行實(shí)時(shí)識(shí)別、轉(zhuǎn)寫,同時(shí)進(jìn)行多語言翻譯及內(nèi)容審核,過濾敏感內(nèi)容,保障內(nèi)容的安全合規(guī),最終將識(shí)別的原語言和翻譯語言以實(shí)時(shí)字幕的方式疊加到直播流中,讓用戶可以在觀看直播畫面、聲音的同時(shí)可以獲取文字維度的信息,極大的提升用戶的觀看體驗(yàn)。


          技術(shù)方案架構(gòu)圖


          模塊組成:


          業(yè)務(wù)實(shí)現(xiàn)流程:

          ??業(yè)務(wù)層對(duì)接視頻云PaaS平臺(tái),開啟功能并配置翻譯模板;
          ??現(xiàn)場(chǎng)推流到CDN邊緣節(jié)點(diǎn);
          ??CDN轉(zhuǎn)推到視頻云PaaS平臺(tái);
          ??視頻云PaaS平臺(tái)進(jìn)行直播流調(diào)度及轉(zhuǎn)發(fā)、音頻流剝離并發(fā)送給AI語音服務(wù)平臺(tái);
          ??視頻云PaaS平臺(tái)獲取轉(zhuǎn)寫及翻譯音頻流接收,并進(jìn)行音視頻流合并;
          ??將合成字幕后的視頻云流進(jìn)行轉(zhuǎn)碼、源流及含字幕流切片、錄制等,支持時(shí)移回看、錄制文件回放等,然后將含字幕的直播流轉(zhuǎn)推給CDN;
          ??終端平臺(tái)播放器從CDN獲取轉(zhuǎn)碼流播放。


          技術(shù)優(yōu)勢(shì):

          ●?分析語音數(shù)據(jù)的處理速度,拿到字幕數(shù)據(jù)的延遲,在輸入層對(duì)視頻數(shù)據(jù)進(jìn)行延遲控制,最終可以控制在1s以內(nèi),實(shí)現(xiàn)直播聲音、畫面、字幕完美同步的良好體驗(yàn);
          字幕模板動(dòng)態(tài)靈活配置,支持自定義位置、字體大小、顏色、背景色等;
          支持靈活配置開啟或關(guān)閉字幕:比如中場(chǎng)休息、播放宣傳片或者其他廣告內(nèi)容時(shí),可以關(guān)閉字幕;
          ●?區(qū)別于傳統(tǒng)的線下翻譯+字幕疊加硬件設(shè)備,創(chuàng)新性的云線上實(shí)時(shí)翻譯+字幕疊加,通過API的方式實(shí)現(xiàn)全部流程,且只支持的并發(fā)路數(shù)可以動(dòng)態(tài)擴(kuò)縮容,提升使用和運(yùn)維效率;另外相比傳統(tǒng)的線下實(shí)現(xiàn)方式,綜合降本預(yù)計(jì)高達(dá)95%以上。

          實(shí)踐過程中遇到的難點(diǎn):

          ? 聽寫以及翻譯的準(zhǔn)確性,需要根據(jù)不同的場(chǎng)景進(jìn)行定制訓(xùn)練;
          ? 聲音、畫面、字幕的同步控制。

          技術(shù)應(yīng)用場(chǎng)景:

          該技術(shù)可以廣泛的應(yīng)用于電商、會(huì)展、融媒、教育等領(lǐng)域,比如在電商領(lǐng)域,可以幫助企業(yè)聚焦直播帶貨出海業(yè)務(wù)場(chǎng)景,通過云端實(shí)時(shí)翻譯+多語言字幕的技術(shù)手段,降低海外地區(qū)用戶的觀看門檻,提升直播觀看量,從而提升商品購買轉(zhuǎn)化率和GMV;在會(huì)展行業(yè),可以完美替代同傳和線下硬件設(shè)備,大大降低會(huì)展直播成本。


          技術(shù)實(shí)踐:

          該技術(shù)在2021年相繼應(yīng)用于服貿(mào)會(huì)、亞歐商品貿(mào)易博覽會(huì)、商洽會(huì)等國際性展會(huì)項(xiàng)目中,具體效果通過下面的視頻來展示:



          瀏覽 115
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  91中文字幕人妻在线 | 99热精品在线播放 | 能免费看的黄色电影 | 国产色情 免费 | 日韩精品电影 |