AI外呼機器人技術(shù)及應用介紹
共 1641字,需瀏覽 4分鐘
·
2022-02-09 17:34
背景介紹
智能語音作為AI平臺性技術(shù),亦是AI重要入口,向下可實現(xiàn)AI底層運算能力調(diào)用,向上則與應用場景融合。當前智能語音已在個人用戶領(lǐng)域,以及金融、醫(yī)療、教育、智能家具等行業(yè)市場得到廣泛應用,可承擔在線客服、電子病歷轉(zhuǎn)錄、個人助理等功能,推動人機交互,顯著提升業(yè)務效率。
作為智能語音與電話平臺技術(shù)相結(jié)合的AI外呼機器人,亦在傳統(tǒng)外呼客服的相關(guān)行業(yè)中備受關(guān)注。隨著我國經(jīng)濟的高速發(fā)展,人力、場地設(shè)備等成本不斷上漲,傳統(tǒng)外呼客服的競爭壓力越來越大,大量重復且機械的工作占據(jù)了客服的絕大多數(shù)時間,復雜案例則變得無暇顧及。
AI外呼機器人因此應運而生,其可協(xié)助客服完成重復任務,提升外呼效率,從而解放出更多人力來處理更為復雜的案例,最終有效提升客戶滿意度。
技術(shù)介紹
1. 整體概述
AI外呼機器人的實現(xiàn),涉及多方面的技術(shù),既有傳統(tǒng)的電話平臺技術(shù)(PBX、IVR、VOIP),亦有智能語音技術(shù)(ASR、TTS),同時也包括了自然語言理解技術(shù)(NLU)和對話策略(DM),其大致關(guān)系如下:
客戶在接通AI外呼通話后,AI外呼機器人會根據(jù)對話策略選擇對應話術(shù),通過TTS技術(shù)轉(zhuǎn)化成語音播報給用戶,用戶進行回應后,通過ASR技術(shù)識別成文字,機器人對文字進行語義理解后,根據(jù)知識圖譜及對話策略,再選擇應對話術(shù)。最終在通話結(jié)束后,根據(jù)通話記錄對客戶進行意圖分析,得出呼叫結(jié)果。
2. ASR語音識別
ASR作為AI外呼機器人的入口,將用戶的回答由音頻信號轉(zhuǎn)換為文字,其準確度較大程度地影響著語義的理解。ASR目前已有較長發(fā)展歷史,其基本原理如下:
- 通過語音激活檢測后,截取有效片段,對音頻信號進行預處理后,提取語音特征
- 語音特征通過聲學模型獲取音素
- 音素,再通過語言模型,還原成符合語言規(guī)則的文本
得益于技術(shù)革新及神經(jīng)網(wǎng)絡模型的應用,其識別準確率已經(jīng)達到較高的程度,但專業(yè)領(lǐng)域、口音、環(huán)境雜音、斷句等因素仍影響著準確率的提升,未來還需要不斷地優(yōu)化與發(fā)展。
3. NLP語義理解
語義理解是AI外呼機器人中重要的組成部分,其主要功能是根據(jù)用戶的回答預測出用戶的意圖。語義理解的準確性直接影響AI外呼機器人的用戶體驗,其基本處理流程如下圖所示:
經(jīng)過語義處理后能夠得到用戶的意圖,對話策略利用該意圖返回正確話術(shù)。當然,本文只談到語義識別處理的過程,實際上,為了保證語義識別的準確性,在識別調(diào)用前后還需要大量的工作:
- 根據(jù)業(yè)務場景大量地收集并正確標注語料
- 根據(jù)語料進行模型訓練及持續(xù)調(diào)優(yōu)、驗證
- 業(yè)務場景上線后需要持續(xù)收集并標注語料迭代識別模型
此外,語義理解在實際應用中,也面臨著需要AI側(cè)與業(yè)務方持續(xù)地討論、溝通、調(diào)整才能解決的兩大難題:
- 意圖語料數(shù)量不足
- 意圖歧義問題,所謂意圖歧義是指相似語義的用戶回答卻屬于不同的意圖
4. DM對話策略
DM,是AI外呼機器人中比較重要的一環(huán),同時也是與業(yè)務結(jié)合最緊密的,可以等同于機器人的邏輯思維,幫助在分析語義后作出應答,引導著整個對話的流向。關(guān)于對話策略,我們根據(jù)對話場景進行了掃描,得出整個對話的大致結(jié)構(gòu):
5.TTS語音合成
TTS作為AI外呼機器人的輸出口,將應答文字轉(zhuǎn)換成語音,是用戶得到的直接結(jié)果。因此,自然、真實、符合業(yè)務場景的TTS,才能讓機器人更好地處理業(yè)務。
而一般來說,TTS轉(zhuǎn)換過程經(jīng)過前端系統(tǒng)和后端系統(tǒng),前端負責把輸入的文本轉(zhuǎn)化為一個中間結(jié)果,然后把這個中間結(jié)果送給后端,由后端生成聲音。
- 前端系統(tǒng):在經(jīng)過文本結(jié)構(gòu)分析、文本正則、文本轉(zhuǎn)音素、韻律預測的處理后,生成“語言學規(guī)格書”,以供后端發(fā)聲。
- 后端系統(tǒng):在拿到“語言學規(guī)格書”后,通過聲學模型提取音頻特征,盡量還原符合這個規(guī)格書里描述的聲音。
小結(jié)
AI外呼機器人涉及多種人工智能技術(shù),得益于AI理論及技術(shù)的日益發(fā)展,其逐漸能夠勝任部分業(yè)務電話場景的工作。但同時,AI外呼機器人如何更好地賦能金融及保險業(yè)務,這仍是壽險AI不懈探索的方向。
也許某一天,我們會在接電話時意識不到是機器人在為我們服務,而能夠與其流暢、自然地進行對話,未來可期。
