智能座艙入門必備:一文讀懂車載語音系統(tǒng)
智能座艙有兩大人工智能交互系統(tǒng),一個(gè)基于視覺(計(jì)算機(jī)視覺)、一個(gè)基于語音。前者的應(yīng)用體現(xiàn)在IMS系統(tǒng),我之前的文章有過介紹;后者的應(yīng)用在艙內(nèi)的語音功能。這篇文章就系統(tǒng)地介紹智能座艙的語音系統(tǒng)(VOS)。
01 概述
02 總體架構(gòu)
在總體的架構(gòu)上,語音系統(tǒng)可分為四個(gè)模塊。即車端系統(tǒng)、云端系統(tǒng)、語音運(yùn)營管理平臺以及訓(xùn)練和分析統(tǒng)計(jì)模塊。
整體的語音系統(tǒng)和要求,包括車端到云端鏈接、數(shù)據(jù)到功能的構(gòu)建、Online的運(yùn)營平臺、線下線上的數(shù)據(jù)采集和標(biāo)注。

03 VOS車端模塊
車機(jī)端主要是對話系統(tǒng)(DS),也是用戶感受最直觀的,產(chǎn)品的重點(diǎn)側(cè)向交互設(shè)計(jì)。

-
音頻處理模塊:AEC /AGC/ANR/ BF... -
喚醒模塊/本地ASR -
語音控制器語 -
本地對話系統(tǒng) -
TTS模塊
3.1語音助手
3.2本地對話系統(tǒng)(本地DS)
3.3本地NLU
3.4本地TTS
04 VOS云端系統(tǒng)

4.1對話系統(tǒng)
-
在線ASR識別 對話服務(wù)模塊可以接受用戶發(fā)起的語音對話的音頻輸入,并給出識別結(jié)果。 -
對話 對話服務(wù)模塊可以接受用戶發(fā)起的語音對話的文本輸入,并給出相應(yīng)的對話結(jié)果,包括TTS文本、要車機(jī)進(jìn)行的操作、車機(jī)用來屏顯的內(nèi)容等。 -
其他功能 如向用戶進(jìn)行主動推送等。
4.2模型
4.3云端TTS
云端TTS有別于本地端TTS,基于強(qiáng)大的計(jì)算能力,云端使用更大的數(shù)據(jù)庫,技術(shù)上使用基于拼接的方案,相比于本地端基于參數(shù)合成的TTS,音質(zhì)更自然;
TTS的聲音可以進(jìn)行定制,需要經(jīng)過文本設(shè)計(jì)、發(fā)音人確認(rèn)、錄音場地和錄音、數(shù)據(jù)篩選、標(biāo)注、訓(xùn)練等過程。
05 運(yùn)營平臺
運(yùn)營平臺通過云端和線上對話系統(tǒng)聯(lián)通,負(fù)責(zé)以可視化的形式干預(yù)對話系統(tǒng)線上的數(shù)據(jù)和功能。其中主要包含兩大類功能:數(shù)據(jù)運(yùn)營、功能運(yùn)營。
5.1數(shù)據(jù)運(yùn)營
數(shù)據(jù)部分的運(yùn)營主要針對兩部分比較常用的可運(yùn)營數(shù)據(jù)
1. 針對系統(tǒng)接入的CP/SP的可運(yùn)營的內(nèi)容,比如喜馬拉雅的推薦數(shù)據(jù)、黃頁數(shù)據(jù)等等,可以在系統(tǒng)中以手動的方式調(diào)整數(shù)據(jù)的內(nèi)容、排序等;
2. 針對企業(yè)自有的數(shù)據(jù),比如主機(jī)廠獨(dú)有的充電樁數(shù)據(jù)、服務(wù)門店數(shù)據(jù),可以有機(jī)的結(jié)合到對話系統(tǒng)中來。
5.2功能運(yùn)營
功能運(yùn)營主要是在特定的時(shí)間點(diǎn),比如某些節(jié)日、或者有特殊意義的日子、或者臨時(shí)發(fā)生一些事件的時(shí)候,通過快速干預(yù)某些特定的說法的反饋,通過編輯特定說法的TTS回復(fù),來實(shí)現(xiàn)系統(tǒng)對特殊情況的特殊處理。
06 訓(xùn)練及分析
6.1用戶數(shù)據(jù)統(tǒng)計(jì)分析
用戶數(shù)據(jù)統(tǒng)計(jì)分析系統(tǒng),通過對所有實(shí)車用戶使用車載語音的情況進(jìn)行統(tǒng)計(jì)分析,能夠得出不同維度、不同粒度的分析報(bào)表。定期進(jìn)行報(bào)表的解讀和分析,可用得出的結(jié)論來指導(dǎo)系統(tǒng)功能的改進(jìn)。
6.2訓(xùn)練系統(tǒng)
針對音頻、文本、圖像的采集+標(biāo)注系統(tǒng),企業(yè)通過定期常規(guī)的對線上數(shù)據(jù)的回收、標(biāo)注和不定期的對特殊要求數(shù)據(jù)的采集、標(biāo)注,生產(chǎn)出各個(gè)AI模型需要的數(shù)據(jù),提供模型訓(xùn)練支持;每次模型訓(xùn)練完畢會有迭代上線,從而實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)系統(tǒng)和線上模型的一個(gè)閉環(huán)迭代,不斷的提升整體的語音產(chǎn)品的能力。
以上便是對智能座艙車載語音系統(tǒng)的完整介紹
如果你想更快入行智能汽車行業(yè),歡迎關(guān)注我們推出的《智能座艙產(chǎn)品特訓(xùn)營》課程,幫你鋪平產(chǎn)品之路。最新一期8月20號準(zhǔn)時(shí)開課。
1)在今天的就業(yè)形式下,泛泛而談/隔行授課的課程很難具備實(shí)際價(jià)值。前兩年招聘的敞口大,或許有點(diǎn)幫助,今天不行了。所以,我們是一種采用重交付,22節(jié)直播課,拿公司真實(shí)項(xiàng)目,帶著大家練,以練帶學(xué),讓大家上班就能上手干活;
2)還是基于現(xiàn)在的就業(yè)形勢,不太可能內(nèi)推很多人了(學(xué)員每個(gè)人都會內(nèi)推)。但10個(gè)人左右的小班的話,培訓(xùn)扎實(shí)一些,內(nèi)推過去成功率會高很多。
3)費(fèi)用和成本。人數(shù)多了對于學(xué)員意義不大,人數(shù)少了我們邊際成本很高。只能提高費(fèi)用(我的認(rèn)知里付費(fèi)是人生最低成本最捷徑的升級方式),我們能覆蓋時(shí)間成本,學(xué)員能提高效率和學(xué)習(xí)質(zhì)量。
4.我們彼此最寶貴的是時(shí)間??
基于以上幾點(diǎn)吧,所以有了以下的課程體系設(shè)計(jì)(內(nèi)含課程大綱和詳細(xì)的課表)大家感興趣的可以找我私聊:xuelaoban667
