語音轉(zhuǎn)文字_魔方數(shù)據(jù)
共 307字,需瀏覽 1分鐘
·
2020-11-23 06:07
產(chǎn)品亮點
格式支持:pcm(不壓縮)、wav(不壓縮,pcm編碼)、amr(壓縮格式)。推薦pcm 采樣率 :16000 固定值。 編碼:16bit 位深的單聲道。
產(chǎn)品說明
將要識別的語音文件,base64轉(zhuǎn)碼上傳。格式支持:pcm(不壓縮)、wav(不壓縮,pcm編碼)、amr(壓縮格式)。推薦pcm 。
由于底層識別使用的是pcm,因此推薦直接上傳pcm文件。如果上傳其它格式,會在服務(wù)器端轉(zhuǎn)碼成pcm,調(diào)用接口的耗時會增加。
ffmpeg轉(zhuǎn)碼工具使用說明(后續(xù)會提供相應(yīng)的接口能力)
簡介
ffmpeg 的一個功能是轉(zhuǎn)換不同的音頻格式,其它簡介請至http://ffmpeg.org/
linux 版本:http://www.ffmpeg.org/download.html#build-linux linux 靜態(tài)編譯版本:https://www.johnvansickle.com/ffmpeg/ windows 版本 :http://ffmpeg.zeranoe.com/builds/
ffmpeg官方文檔地址:http://ffmpeg.org/ffmpeg.html
產(chǎn)品參數(shù)
| 交付方式 | API |
售后支持范圍
提供免費技術(shù)支持
評論
圖片
表情
