機(jī)器學(xué)習(xí)學(xué)語(yǔ)言「太笨」?跟爸爸媽媽們多學(xué)學(xué)!

新智元報(bào)道
新智元報(bào)道
來(lái)源:外媒
編輯:Priscilla
【新智元導(dǎo)讀】芝加哥大學(xué)與卡內(nèi)基·梅隆大學(xué)的研究人員設(shè)計(jì)了一個(gè)游戲,了解父母是如何根據(jù)孩子習(xí)得的語(yǔ)言知識(shí),準(zhǔn)確地調(diào)整與孩子交流時(shí)使用的語(yǔ)言。該研究結(jié)果也有助于機(jī)器學(xué)習(xí)的發(fā)展。

還記得自己牙牙學(xué)語(yǔ)的時(shí)候,父母是怎么教我們說(shuō)話的嗎?
「叫媽媽,媽——媽——」「吃飯飯」
這種拖長(zhǎng)發(fā)音,重復(fù)單詞的方式,是每個(gè)小孩學(xué)會(huì)說(shuō)一個(gè)單詞的最基本方式。
而這種父母與孩童之間的交談方式與成年人之間的交談方式,在很多方面都不一樣。除了上面這種拖長(zhǎng)發(fā)音、重復(fù)單詞的方式,父母還會(huì)根據(jù)我們已經(jīng)學(xué)會(huì)的詞語(yǔ),繼續(xù)教我們別的內(nèi)容。
那么,機(jī)器又是如何學(xué)習(xí)語(yǔ)言呢?
來(lái)自芝加哥大學(xué)與卡內(nèi)基·梅隆大學(xué)的研究人員發(fā)現(xiàn)了一種新方法,用實(shí)驗(yàn)評(píng)估父母在與孩子談話時(shí),根據(jù)孩子已經(jīng)掌握的語(yǔ)言,改變自己的語(yǔ)言方式。而這種教育孩子說(shuō)話的方式也適用于機(jī)器學(xué)習(xí)。
這是首個(gè)該類型的語(yǔ)言模式研究,相關(guān)論文已經(jīng)發(fā)布在Psychological Science上。
為孩子選擇合適的語(yǔ)言模式
「一直以來(lái)我們都知道,父母和孩子說(shuō)話的方式與其他成年人說(shuō)話的方式有很多不同的地方,比方說(shuō),簡(jiǎn)化語(yǔ)言、重復(fù)單詞,或者拖長(zhǎng)發(fā)音,這能讓孩子更好地掌握語(yǔ)言。」
「但是,我們并不知道父母是否在孩子學(xué)習(xí)語(yǔ)言的過(guò)程中,改變自己說(shuō)話的方式,從而讓孩子能夠“恰到好處地”學(xué)習(xí)下一內(nèi)容。」卡內(nèi)基·梅隆大學(xué)心理學(xué)副教授Daniel Yurovsky說(shuō)道。

Daniel Yurovsky
研究人員發(fā)現(xiàn),成年人會(huì)放慢語(yǔ)速,用更高的音調(diào)和孩子說(shuō)話。他們還會(huì)用夸張的發(fā)音,重復(fù)或者簡(jiǎn)化自己的語(yǔ)言。除此之外,成年人還會(huì)問(wèn)孩子問(wèn)題,以確認(rèn)孩子的理解能力。整個(gè)交流模型會(huì)隨著孩子語(yǔ)言流利程度的提高而不斷變化。
Yurovsky教授表示,這就像學(xué)生在學(xué)校學(xué)習(xí)數(shù)學(xué)的方式。
學(xué)生先從代數(shù)開始學(xué)習(xí),然后是平面幾何,之后是微積分。Yurovsky教授說(shuō),「人們不假思索地使用相同的結(jié)構(gòu)和孩子交流,以便掌握孩子對(duì)語(yǔ)言的了解程度,并修改他們的說(shuō)話方式,讓孩子能夠更好地理解他們。」
如何調(diào)整語(yǔ)言模式?
如何調(diào)整語(yǔ)言模式?
隨著孩子慢慢長(zhǎng)大,父母也會(huì)改變與他們的互動(dòng)方式。為更好了解這一過(guò)程,研究團(tuán)隊(duì)設(shè)計(jì)了一款游戲,讓父母協(xié)助孩子在三只動(dòng)物中選出一只正確動(dòng)物。在這些選項(xiàng)中,有一半的動(dòng)物是孩子在2歲前就已經(jīng)認(rèn)識(shí)的,而剩下的則是2歲后才認(rèn)識(shí)的動(dòng)物。
41對(duì)親子受邀參與該研究,研究人員則測(cè)量父母認(rèn)為孩子應(yīng)該認(rèn)識(shí)某些動(dòng)物時(shí)的交流方式。

父母描述動(dòng)物來(lái)指導(dǎo)孩子選擇正確的圖案
研究結(jié)果發(fā)現(xiàn),父母非常了解孩子的語(yǔ)言,因?yàn)樗麄円恢币娮C著孩子的成長(zhǎng)和學(xué)習(xí)。這表明,父母利用他們對(duì)孩子語(yǔ)言發(fā)展的了解來(lái)調(diào)整他們的語(yǔ)言。

用更長(zhǎng)的表述來(lái)形容孩子不認(rèn)識(shí)的動(dòng)物
研究還發(fā)現(xiàn),父母在向孩子表達(dá)「未知」的動(dòng)物時(shí)用了各種方法,比如在描述動(dòng)物的時(shí)候,使用孩子熟悉的其它詞語(yǔ)來(lái)形容動(dòng)物。

在機(jī)器學(xué)習(xí)領(lǐng)域中的應(yīng)用
在機(jī)器學(xué)習(xí)領(lǐng)域中的應(yīng)用
自然語(yǔ)言處理(NLP)是一種專業(yè)分析人類語(yǔ)言的人工智能。現(xiàn)代NLP是一門融合了語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)和機(jī)器學(xué)習(xí)的混合學(xué)科。
語(yǔ)音助手大家都很熟悉了,而各種語(yǔ)音助手上線前,必須要經(jīng)過(guò)訓(xùn)練。而訓(xùn)練的第一步就是文本預(yù)處理。簡(jiǎn)單地說(shuō),就是輸入文本,以便于后續(xù)分析。
而語(yǔ)言模型能夠從無(wú)限制的大規(guī)模單語(yǔ)語(yǔ)料中學(xué)習(xí)到豐富的語(yǔ)義知識(shí),這也是我們?nèi)缃裼?xùn)練機(jī)器學(xué)習(xí)語(yǔ)言的方式:提供我們所有的全部語(yǔ)言數(shù)據(jù)。
Yurovsky教授認(rèn)為,他們的研究結(jié)果能夠幫助人們理解機(jī)器學(xué)習(xí)的語(yǔ)言系統(tǒng)。
也就是說(shuō),如果人們不再一次性將所有語(yǔ)言數(shù)據(jù)「填鴨式」地進(jìn)行訓(xùn)練,而是在適當(dāng)?shù)臅r(shí)候向機(jī)器輸入適當(dāng)?shù)恼Z(yǔ)言數(shù)據(jù),就能讓機(jī)器在適當(dāng)?shù)膹?fù)雜程度學(xué)習(xí)語(yǔ)言。
機(jī)器之于研究人員,如同孩子之于父母。后者都十分清楚地掌握著前者的學(xué)習(xí)過(guò)程與學(xué)習(xí)能力。
如果研究人員能夠像父母一樣,調(diào)節(jié)機(jī)器學(xué)習(xí)語(yǔ)言的進(jìn)度和方式,能否更好地幫助機(jī)器學(xué)習(xí)就見仁見智了。
參考資料:
https://www.unite.ai/new-research-into-how-children-learn-language-can-help-machine-learning-field/
-往期精彩-



