Ecoute實時轉(zhuǎn)錄工具
Ecoute 是一種實時轉(zhuǎn)錄工具,可在文本框中為用戶的麥克風輸入 (You) 和用戶的揚聲器輸出 (Speaker) 提供實時轉(zhuǎn)錄。它還使用 OpenAI 的 GPT-3.5 生成建議的響應,供用戶根據(jù)對話的實時轉(zhuǎn)錄說出。
Ecoute 旨在通過提供實時轉(zhuǎn)錄和生成上下文相關的響應來幫助用戶進行對話。通過利用 OpenAI 的 GPT-3.5 的強大功能,Ecoute 旨在使通信更加高效和愉快。
要求:
- Python 3.x
- 一個 OpenAI API key
- Windows OS (未在其他操作系統(tǒng)上測試)
- FFmpeg
雖然 Ecoute 提供實時轉(zhuǎn)錄和響應建議,但其功能還存在幾個已知限制:
- 默認麥克風和揚聲器: Ecoute 當前配置為僅收聽系統(tǒng)中設置的默認麥克風和揚聲器。它不會檢測來自其他設備或系統(tǒng)的聲音。如果你想使用不同的麥克風或揚聲器,需要在系統(tǒng)設置中將其設置為默認設備。
- Whisper 模型:使用 Whisper ASR 模型的“tiny”版本,因為它的資源消耗低且響應時間快。但是,此模型在轉(zhuǎn)錄某些類型的語音(包括口音或不常用詞)時可能不如較大的模型準確。
- 語言:Ecoute 中使用的 Whisper 模型設置為英語。因此,它可能無法準確轉(zhuǎn)錄非英語語言或方言。項目團隊正在積極努力為程序的未來版本添加多語言支持。
評論
圖片
表情
