美團(tuán)開(kāi)源LongCat-Audio-Codec語(yǔ)音編解碼方案
2025-10-17 17:18
10月17日,美團(tuán)LongCat團(tuán)隊(duì)宣布開(kāi)源專用語(yǔ)音編解碼方案LongCat-Audio-Codec。該方案提供一站式Token生成器與Token還原器工具鏈,將原始音頻信號(hào)映射為語(yǔ)義與聲學(xué)并行的token序列,實(shí)現(xiàn)高效離散化,并通過(guò)解碼模塊重構(gòu)高質(zhì)量音頻,為Speech LLM提供全鏈路音頻處理支持。LongCat-Audio-Codec在語(yǔ)義建模、聲學(xué)重建、流式合成三大維度實(shí)現(xiàn)突破。
瀏覽
6評(píng)論
圖片
表情
