Live Transcribe Speech Engine實時語音轉(zhuǎn)錄引擎
Live Transcribe 是一款 Android 應用程序,可為失聰或有聽力障礙的人提供實時字幕。此存儲庫包含用于與 Live Transcribe 中使用的 Google Cloud Speech API 進行通信的 Android 客戶端庫。
自動語音識別(ASR)模塊具有以下功能:
- 無限流媒體
- 支持 70 多種語言
- 文字不會丟失,只會延遲
- 即使網(wǎng)絡已經(jīng)停電數(shù)小時,也會重新連接。當然,沒有連接就不能進行語音識別。
- 可以輕松啟用和配置 Opus、AMR-WB、FLAC 編碼
- 包含文本格式庫,用于可視化 ASR 置信度、發(fā)言人 ID 等
- 可離線模型擴展
- 內(nèi)置支持語音檢測器,可在延長靜音期間用于停止 ASR 以節(jié)省資金和數(shù)據(jù)(請注意,未提供語音檢測器實現(xiàn))
- 內(nèi)置支持揚聲器識別,可根據(jù)揚聲器編號標記或著色文本(請注意,未提供揚聲器識別實現(xiàn))
提供的庫幾乎與生產(chǎn)應用程序 Live Transcribe 中運行的庫相同。它們經(jīng)過了廣泛的現(xiàn)場測試和單元測試。但是,測試本身目前尚未開源。
評論
圖片
表情
