外呼機器人具有哪些挑戰(zhàn)和風(fēng)險呢?
共 819字,需瀏覽 2分鐘
·
2022-02-09 17:34
如今大家對于機器人都是很熟悉的,簡單一點來說機器人就是自動執(zhí)行工作的機器裝置。它既可以接受人類指揮,又可以運行預(yù)先編排的程序的。而大家對于外呼機器人都是否熟悉呢?其具有哪些挑戰(zhàn)和風(fēng)險呢?
首先是語音識別技術(shù)的挑戰(zhàn),前面說到實驗室環(huán)境下語音識別準(zhǔn)確率已經(jīng)從2013年的87%提高到了2017年的97%,而在實際環(huán)境中,這個數(shù)字會降低到85%左右,因為實際環(huán)境中有大量的噪音、口音、聲源遠(yuǎn)近等問題。在外呼機器人這個領(lǐng)域,短語音識別是一個難點,因為在缺少更多上下文信息的時候,語音識別很難確定你發(fā)的音和對應(yīng)的字之間的關(guān)系,中文更是如此,因為中文是一個同音不同字的語言,還有音調(diào)的變化,比如我發(fā)一個音“l(fā)ao shi” ,這在不同的語境下,可能代表這是一個教書育人的職業(yè),在另外的語境下,可能代表這個人的性格很老實。
來自于技術(shù)方面的第二個挑戰(zhàn)是多輪對話,人的自然語言從來都是含糊不清的,特別依賴上下文關(guān)系。比如說“我想訂一個房間”, “什么位置?”, “中關(guān)村附近”,“什么時間?”,“周六”… …這個例子里面,關(guān)于訂房間的信息是散落在多輪對話之間的。如何綜合全面考慮上下文信息一直是學(xué)術(shù)界的一項挑戰(zhàn)。
第三,人類的對話行為模型非常復(fù)雜。因為在外呼機器人場景下,人們期待的是和另一個人之間的交流而不是一臺機器。研究顯示,人們在和機器人對話的時候,會自然的放慢語速,發(fā)音會更清晰,也會用更加配合機器人的句式來交互。但是在和人溝通的場景中,人們的發(fā)音或更含糊,會在句子中省略很多字詞,也會在句子中突然修改前面的對話信息,這些都給語音識別,語義理解造成了極大的困難。
最后,我們目前的外呼機器人大部分都還是播放提前錄音,為了實現(xiàn)真正的人機語音對話系統(tǒng),我們需要讓機器能發(fā)出人的聲音,這就是語音合成技術(shù)。但是要合成出人自然對話中的抑揚頓挫,并且騙過人是一件非常困難的事情,人的耳朵對于音頻的敏感程度遠(yuǎn)超過人眼對圖像的敏感程度,這也讓語音合成這件事情的難度更高。
