智能客服的一些內(nèi)容
主要介紹一些智能客服領(lǐng)域的內(nèi)容,智能客服算是 NLP + 知識(shí)圖譜 + 深度學(xué)習(xí)落地比較成熟的行業(yè)了。主要介紹智能客服領(lǐng)域的一些術(shù)語(yǔ)、 3 種機(jī)器人的應(yīng)用場(chǎng)景和實(shí)體識(shí)別在多輪對(duì)話的運(yùn)用。
智能客服領(lǐng)域一些術(shù)語(yǔ)
Intent:意圖,用戶通過(guò)自然語(yǔ)言表達(dá)方式來(lái)提出某種問(wèn)題或達(dá)到某種目的。不同的人在意圖層面會(huì)有極大的共性,同一個(gè)人在不同品類的商品購(gòu)物時(shí),也有類似的共性。機(jī)器人要解決用戶的需求,首先需要識(shí)別用戶的意圖。例如,買(mǎi)家發(fā)送“給我推薦一款紙尿褲”,機(jī)器人會(huì)針對(duì)這句話切詞,變成“給\我\推薦\一款\紙尿褲”,然后綜合考慮 詞特征、交叉特征、上文意圖等因素,給出預(yù)測(cè)的意圖。
實(shí)體:意圖識(shí)別過(guò)程中需要進(jìn)行實(shí)體抽取,主要抽取的是文本中的原子信息元素,如人名、組織/機(jī)構(gòu)名、地理位置、事件/日期、字符值、金額值等。實(shí)體抽取可分為基于規(guī)則的方法抽取和基于模型的方法抽取。
實(shí)體面臨的挑戰(zhàn):
上下文相關(guān):同一個(gè)表達(dá)在不同的上下文中通常有不同的意義,比如“13”可以是“13 斤”,也可以是“13 厘米”,具體取值跟對(duì)話場(chǎng)景相關(guān)。 歧義:自然語(yǔ)言存在多樣性,也就是一個(gè)意思可以以不同的說(shuō)法進(jìn)行表達(dá)。例如說(shuō)“空調(diào)”時(shí),可以是電器里面的空調(diào),也可以是某個(gè)紙尿褲系列“空調(diào)系列紙尿褲”。
分類:
被動(dòng)意圖:用戶觸發(fā),機(jī)器人進(jìn)行響應(yīng); 對(duì)比意圖:屬于被動(dòng)意圖,但實(shí)體會(huì)保留多值;而其他意圖的多個(gè)實(shí)體會(huì)隨機(jī)給出一個(gè); 主動(dòng)意圖:機(jī)器人主動(dòng)觸發(fā),按設(shè)定好的策略引導(dǎo)用戶完成某項(xiàng)任務(wù)。需要結(jié)合被動(dòng)意圖使用; Slot:槽位,對(duì)意圖的補(bǔ)充,意圖的屬性。如,詢問(wèn){Time}天氣,槽位{Time}代表咨詢哪天的天氣; Dialogue State:對(duì)話狀態(tài),含 0 時(shí)刻到 t 時(shí)刻的對(duì)話歷史、用戶目標(biāo)、意圖和槽值對(duì)的數(shù)據(jù)結(jié)構(gòu)。對(duì)話管理中的一部分,記錄整通對(duì)話的各種信息。例如,是一通對(duì)話的第幾句,第幾個(gè)意圖;或者記錄,當(dāng)前意圖有每個(gè)槽位是否填充; Dialogue Policy:對(duì)話策略,依據(jù)給定上下文及當(dāng)前 Query,如何進(jìn)行下一步操作; Session:一通對(duì)話,通常一天內(nèi)的對(duì)話由多通對(duì)話組成; Turn:對(duì)話中的每一句都可以稱之為一輪。包括用戶請(qǐng)求、響應(yīng)的答案、當(dāng)前識(shí)別的意圖ID。
3 種機(jī)器人的應(yīng)用場(chǎng)景
問(wèn)答型機(jī)器人
問(wèn)答型在特定領(lǐng)域的知識(shí)庫(kù)中,找到和用戶出的問(wèn)題語(yǔ)義匹配的知識(shí)點(diǎn),給出合理的答案。有明確的任務(wù)目標(biāo),但這類型的對(duì)話不需要把用戶問(wèn)話中的信息參數(shù)化,是針對(duì)一定固定規(guī)則的提問(wèn),都有固定、明確的答案。這類場(chǎng)景最簡(jiǎn)單。部分實(shí)現(xiàn)方式通過(guò)關(guān)鍵字識(shí)別都可以做。優(yōu)勢(shì)是配置簡(jiǎn)單,立即生效,缺點(diǎn)是時(shí)效性較強(qiáng),維護(hù)成本高。
比如用戶詢問(wèn)“發(fā)貨用什么快遞?” 機(jī)器人回答:“我們家快遞都是韻達(dá)快遞哦”
任務(wù)型機(jī)器人
定義:有明確的任務(wù)目標(biāo),這個(gè)目標(biāo)其實(shí)就是用戶的意圖,同時(shí)也會(huì)有一些關(guān)鍵信息需要參數(shù)化,通過(guò)與用戶多輪交互,達(dá)到任務(wù)目標(biāo)。多輪交互,更接近人類的對(duì)話習(xí)慣,但是需要設(shè)計(jì)大量交互過(guò)程。
需要和用戶詢問(wèn)更多信息的意圖,例如尺碼咨詢問(wèn)題。比如:用戶給定身高、體重,希望了解自己適合的尺碼。任務(wù)型對(duì)話的難點(diǎn),如何準(zhǔn)確識(shí)別用戶的意圖?比如:
如何在意圖無(wú)法識(shí)別的時(shí)候給出合理的推薦? 如何抽取對(duì)話過(guò)程中的實(shí)體? 如何感知用戶的情緒? 如何解決用戶的追問(wèn)? 如何對(duì)用戶的狀態(tài)進(jìn)行追蹤? 如何在主動(dòng)和被動(dòng)之間進(jìn)行切換? 如何做數(shù)據(jù)管理? 如何根據(jù)具體意圖執(zhí)行某個(gè)動(dòng)作?
推薦型機(jī)器人
定義:根據(jù)多維度的信息(用戶畫(huà)像、用戶歷史購(gòu)買(mǎi)行為、用戶對(duì)話中提供的信息等),給用戶推薦合適的商品,提高用戶尋找商品的效率,升購(gòu)買(mǎi)轉(zhuǎn)化率。比如:用戶給定一些屬性(如純棉、修身),希望推薦合適的上衣。
精準(zhǔn)的推薦能給用戶帶來(lái)價(jià)值,且用戶行為也會(huì)反向提升推薦效果。但需要用戶畫(huà)像、購(gòu)買(mǎi)行為、購(gòu)買(mǎi)興趣等信息作為支撐,信息不足時(shí)會(huì)導(dǎo)致推薦不精準(zhǔn)。
實(shí)體識(shí)別在多輪對(duì)話中的運(yùn)用
命名實(shí)體的定義:命名實(shí)體是具有類型的對(duì)象詞。比如 “北京市”是一個(gè)命名實(shí)體,它的類型是 “地名”, 類似的還有 “李三” 是一個(gè)“人名”。
命名實(shí)體在多輪對(duì)話中的作用:對(duì)用戶的輸入的問(wèn)題, 我們可以用下面的方式生成回答:
首先確定用戶這句話是什么意圖; 對(duì)于用戶的話抽取實(shí)體; 走流程,返回一個(gè)答案。
例如,對(duì)于輸入“我家寶寶17斤,可以穿多大碼紙尿褲?”
意圖是 “根據(jù)體重查尺碼” 實(shí)體:體重:17斤, 品類:紙尿褲
根據(jù)上面這個(gè)例子,可以看出,命名實(shí)體現(xiàn)了用戶的目標(biāo)。對(duì)于用戶的輸入,如果不抽取實(shí)體,后臺(tái)僅僅知道用戶的意圖是 "根據(jù)體重查尺碼", 顯然這個(gè)是不足以生成一個(gè)回答。如果抽取實(shí)體,可以知道用戶想要的是 “根據(jù)體重查[紙尿褲]尺碼, [體重]是[17斤]”, 這樣可以精準(zhǔn)的返回 “[17斤] 的寶寶適合 [M碼] 的 [紙尿褲]”。
希望通過(guò)意圖和實(shí)體來(lái)表示用戶的問(wèn)題是什么,用戶問(wèn)這個(gè)問(wèn)題具體是想要什么。
命名實(shí)體識(shí)別方法概述:可以把目前碰到的命名實(shí)體分為兩類:
不管這個(gè)詞出現(xiàn)在什么語(yǔ)境里面,都很有可能是實(shí)體,比如紙尿褲,拉拉褲。那么可以簡(jiǎn)單認(rèn)為只要這個(gè)詞出現(xiàn)在用戶的輸入里面,那么這個(gè)詞就是命名實(shí)體。可以稱這類實(shí)體為垂直的行業(yè)相關(guān)的實(shí)體。對(duì)于這類實(shí)體,可以簡(jiǎn)單定義一個(gè)包含所有垂直實(shí)體字典,用查字典的方式識(shí)別。 這類實(shí)體的識(shí)別需要依據(jù)上下文, 比如 28 號(hào), 可以是一個(gè)日期,門(mén)牌號(hào),人的 id 等,需要根據(jù)語(yǔ)境去區(qū)分;再如 101 號(hào),不可能是一個(gè)日期。我們知道日期還有很多其他的很細(xì)的復(fù)雜的模式,而且出現(xiàn)的規(guī)則比較復(fù)雜,所以需要用模型從訓(xùn)練數(shù)據(jù)里面去學(xué)習(xí)這些規(guī)則。這類實(shí)體一般都是可以跨行業(yè)共享的,通常稱其為普通實(shí)體。
