獨(dú)家|語(yǔ)音AI在智慧家庭下的平臺(tái)化路徑可能

流媒體網(wǎng)(ID:iptvott)原創(chuàng)
作者|林起勁
最近,語(yǔ)音AI頻頻出現(xiàn)在筆者的視野中。11月25日上午,中國(guó)電信集團(tuán)與科大訊飛在京舉行戰(zhàn)略合作協(xié)議簽約儀式。雙方將在智慧家庭、智能客服、A.I.平臺(tái),產(chǎn)業(yè)數(shù)字化拓展、政企行業(yè)、天翼云等領(lǐng)域建立長(zhǎng)期戰(zhàn)略合作關(guān)系。實(shí)際上,作為中國(guó)移動(dòng)戰(zhàn)略參股的AI科技公司,科大訊飛本來(lái)就是中國(guó)移動(dòng)語(yǔ)音AI領(lǐng)域全線產(chǎn)品的戰(zhàn)略合作伙伴。而中國(guó)移動(dòng)不僅大量大規(guī)模推進(jìn)語(yǔ)音遙控器,此前還發(fā)布了面向智慧家庭的小荷音箱。此外在廣電領(lǐng)域,廣東廣電網(wǎng)絡(luò)公司、安徽海豚新媒體等機(jī)構(gòu)也都采用了語(yǔ)音AI技術(shù)。當(dāng)然,廣電機(jī)構(gòu)對(duì)語(yǔ)音AI的應(yīng)用主要是在家庭娛樂(lè)及智慧家庭范疇,而像中國(guó)電信這樣的電信運(yùn)營(yíng)商還要將其與視頻AI等結(jié)合起來(lái)并應(yīng)用到行業(yè)領(lǐng)域。
一、語(yǔ)音AI在海外大視頻市場(chǎng)成為事實(shí)潮流
不過(guò),更加吸引筆者關(guān)注的是,近年來(lái)語(yǔ)音AI在海外大視頻領(lǐng)域的密集應(yīng)用——包括Comcast、Verizon、BBC、Virgin Media、Sky等大視頻主流機(jī)構(gòu)都在規(guī)?;貞?yīng)用語(yǔ)音AI技術(shù)。

圖1:Sky Q機(jī)頂盒的語(yǔ)音遙控器
Comcast語(yǔ)音AI應(yīng)用:從有線電視到智慧家庭到OTT。Comcast最為最大的有線運(yùn)營(yíng)商和寬帶運(yùn)營(yíng)商,早在2013年就開始應(yīng)用該技術(shù),在2015年基于X1平臺(tái)推出語(yǔ)音遙控器,并在后續(xù)不斷進(jìn)行功能迭代,以推動(dòng)用戶“玩電視”消費(fèi)習(xí)慣。2017年12月,Comcast也開始探索把A.I.的應(yīng)用領(lǐng)域從上述電視領(lǐng)域拓展到其智能家居“Xfinity Home”系列產(chǎn)品之中,包括家庭監(jiān)控、物品查找等。截至2018年初,該產(chǎn)品已擁有約2000萬(wàn)家庭用戶,每個(gè)月收到的用戶語(yǔ)音指令高達(dá)約6億條,成為Comcast最受用戶歡迎的產(chǎn)品之一。由于Comcast在語(yǔ)音AI技術(shù)應(yīng)用方面的長(zhǎng)期積累,其在今年5月發(fā)布的流媒體服務(wù)Peacock,在8月就啟用;基于語(yǔ)音遙控器提供的交互式廣告(參考《Comcast的AI之路:從玩電視到智慧家庭及互動(dòng)廣告》)。
BBC:從依賴第三方到借勢(shì)第三方。在英倫,BBC感受到語(yǔ)音AI廣泛的應(yīng)用潮流,并在2017年10推出一款通用型軟件,并迅速集成到Amazon Echo、Google Home、蘋果HomePod、微軟Invoke等熱門智能音箱產(chǎn)品中。BBC通過(guò)這一借勢(shì)舉措,可以方便用戶通過(guò)這些智能音箱搜索發(fā)現(xiàn)BBC自身的節(jié)目?jī)?nèi)容,從而體現(xiàn)了“無(wú)處不在”的策略。2019年7月底,考慮到用戶隱私保護(hù)需求,以及提供BBC自身的個(gè)性化應(yīng)用,BBC宣布創(chuàng)建自己的新語(yǔ)音助手“Beeb(小蜜蜂)”。但BBC依然支持想要訪問(wèn)BBC內(nèi)容的第三方語(yǔ)音助手,如Amazon Alexa、Google Assistant等。因?yàn)?,BBC發(fā)現(xiàn)很多用戶都期望能通過(guò)Amazon Echo這樣的第三方設(shè)備查找BBC節(jié)目。當(dāng)然,BBC發(fā)布自身的Beeb應(yīng)用目標(biāo)之一是,其在與第三方平臺(tái)進(jìn)行協(xié)作的同時(shí),確保用戶UI包含一致性元素(參考《獨(dú)家|BBC如何玩轉(zhuǎn)AI語(yǔ)音技術(shù)?》)。
此外,Sky的核心終端平臺(tái)SkyQ從2019年開始就全面應(yīng)用語(yǔ)音AI服務(wù)。而Verizon和Virgin Media最新發(fā)布的終端中都具備語(yǔ)音AI支持。其中,Virgin Media的TV360平臺(tái)將新的語(yǔ)音遙控器作為重要賣點(diǎn),Verizon的語(yǔ)音遙控器則由Google Assistant支持(參考《勁語(yǔ)快評(píng)|在線直播監(jiān)管進(jìn)入2.0階段,終端平臺(tái)成海外大視頻PK關(guān)鍵》)。
二、語(yǔ)音AI的核心吸引力是什么?
語(yǔ)音AI的核心吸引力是什么?它是否僅僅只是一種技術(shù)?對(duì)于這一問(wèn)題,可以將語(yǔ)音AI與視頻AI/計(jì)算機(jī)視覺(jué)進(jìn)行對(duì)比。兩者都憑借深度學(xué)習(xí)取得重大突破,并在識(shí)別準(zhǔn)確率上達(dá)到人類水平。但是,計(jì)算機(jī)視覺(jué)通過(guò)人臉識(shí)別這一大技術(shù)分支便高完成度地解決1:1或1:N比對(duì)問(wèn)題,快速滲透到了各行各業(yè)。
而智能語(yǔ)音技術(shù)要解決的卻遠(yuǎn)遠(yuǎn)不是1:1或1:N的比對(duì)這樣的單一性技術(shù)問(wèn)題。在語(yǔ)音AI場(chǎng)景中,完成語(yǔ)音識(shí)別之后的關(guān)鍵是對(duì)用戶指令的理解并維持良好的人-機(jī)對(duì)話狀態(tài)(如圖2所示),這背后隱藏了高密度信息。以具備全雙方語(yǔ)音AI能力的“微軟小冰”為例,它的目標(biāo)是邊聽邊思考,并學(xué)會(huì)在傾訴和傾聽中控制節(jié)奏,還要通過(guò)上下文理解和關(guān)鍵記憶以努力識(shí)別對(duì)話場(chǎng)景并學(xué)會(huì)引導(dǎo),顯得更加“懂事”(如圖2所示)。

圖2:人機(jī)對(duì)話的實(shí)現(xiàn)流程

圖3:全雙工語(yǔ)音AI的智能之處——以微軟小冰為例
簡(jiǎn)而言之,人們面對(duì)語(yǔ)音AI時(shí)希望得到的自然、類人、甚至高信息密度的交互體驗(yàn),這是一個(gè)宏偉的開放性課題,背后涉及的各學(xué)科技術(shù)之間的融合創(chuàng)新,處于持續(xù)推進(jìn)階段。
筆者以為,語(yǔ)音AI區(qū)別于視覺(jué)識(shí)別等方面智能技術(shù)的核心吸引力在于其人-機(jī)自然交互的親和力、需求直達(dá)性與開放性。當(dāng)然,語(yǔ)音AI最關(guān)鍵是對(duì)用戶需求的理解及對(duì)應(yīng)的場(chǎng)景識(shí)別,其在用戶語(yǔ)音命令之后將生成的一系列可能由多個(gè)設(shè)備共同執(zhí)行完成以滿足用戶需求的命令。比如,一個(gè)用戶回家后說(shuō)“我要看《我是歌手》”,拾音設(shè)備在接到該命令并識(shí)別之后會(huì)將智能電視機(jī)接上電源,將客廳燈光適度調(diào)整,并在電視機(jī)打開后從廣播平臺(tái)和OTT平臺(tái)尋找最新的《我是歌手》節(jié)目,如果廣播的直播頻道有就切換到播放質(zhì)量最有保證的頻道,否則就在OTT平臺(tái)尋找提供該節(jié)目的APP并將之打開。甚至,后臺(tái)可以根據(jù)該用戶以往的收看情況或最新社交話題,與用戶進(jìn)行對(duì)話,獲得用戶進(jìn)一步的期望并給出針對(duì)性節(jié)目推薦。
三、未來(lái)智慧家庭發(fā)展模式研判:“X-1-N”
從上面的分析來(lái)說(shuō),語(yǔ)音AI就是一個(gè)關(guān)鍵的入口或重要的連接節(jié)點(diǎn),在智慧家庭環(huán)境中存在很多可能。具體將是如何呢?這需要結(jié)合智慧家庭生態(tài)與業(yè)務(wù)模式進(jìn)行分析。考慮到:(1)類似Echo Show這種帶屏音箱的流行,(2)過(guò)去一年多時(shí)間以來(lái)所謂“智慧屏”帶動(dòng)的跨屏連接潮流,以及(2)智慧家電的逐步推進(jìn),筆者認(rèn)為未來(lái)智慧家庭場(chǎng)景或是“X-1-N”模式。
