<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          2021年AI Labs報告發(fā)布!創(chuàng)辦17年,這家「不專心」做語音的研究院入選

          共 4181字,需瀏覽 9分鐘

           ·

          2022-01-09 17:41



          ??新智元報道??

          編輯:桃子?好困

          【新智元導(dǎo)讀】2021人工智能創(chuàng)新研究院揭曉了,看看都有誰?


          22年前,十幾位工科生在中科大校園租下了一間三室一廳,擼起袖子準(zhǔn)備大干一場。

          ?

          創(chuàng)業(yè)之初,他們的想法很純粹:研究一個像人一樣能聽會說的機(jī)器。

          ?

          帶著這樣的憧憬,26歲的劉慶峰帶隊便以一項(xiàng)技術(shù)為主開啟了創(chuàng)業(yè)歷程。



          然而,創(chuàng)業(yè)并非易事。更重要的是,他們選擇以一項(xiàng)在當(dāng)時不被看好的技術(shù)——語音合成起家。

          ?

          說干就干,可是忙了一年多,幾乎不見任何成果。

          ?

          創(chuàng)業(yè)前那些豪言壯語瞬間成了一眼浮云,軍心動搖。許多人甚至開始懷疑,智能語音是未來正確的發(fā)展方向嗎?

          ?

          殘酷的是,這家剛剛成立的公司在當(dāng)時面臨兩個抉擇:要么繼續(xù)做語音,要么改行做其他的,比如房地產(chǎn)。

          ?

          一場會議,他們最終決定了自己的命運(yùn):還是要做最喜歡的事情——智能語音。

          ?

          就這樣,劉慶峰和團(tuán)隊明確了未來的發(fā)展發(fā)向,將語音交互技術(shù)的自主研發(fā)作為公司核心戰(zhàn)略方向。

          ?

          ?

          一切證明,當(dāng)初的選擇終不負(fù)所愿。這個以源頭技術(shù)創(chuàng)新為核心的AI王國——科大訊飛20多年來持續(xù)推動智能語音與人工智能走在世界前列。

          ?

          這背后便是,訊飛研究團(tuán)隊22年來始終堅持「頂天立地」的理念和追求,通過不懈努力取得的成果。

          ?

          做研究是訊飛的基因,尤其是對源頭技術(shù)的研發(fā)。所以,從科大訊飛創(chuàng)立開始,訊飛研究院就相伴而生。

          ?

          近日,MIT科技評論中國發(fā)布了2021人工智能創(chuàng)新研究院(AI Labs)報告。

          ?

          訊飛研究院憑借著在智能語音、計算機(jī)視覺、自然語言處理等多個領(lǐng)域的杰出成就,成功入選。


          ?

          始于語音,不止語音

          ??

          早在2008年之前,科大訊飛在語音合成、語音評測和語音識別上,已經(jīng)到了全球語音技術(shù)領(lǐng)域內(nèi)全面領(lǐng)先的地位。

          ?

          隨著技術(shù)的不斷發(fā)展和積累,時間來到了2020年1月。在韓國釜山舉行的ISO/IEC JTC 1/SC 35全會上,由科大訊飛主導(dǎo),聯(lián)合中國電子技術(shù)標(biāo)準(zhǔn)化研究院和中科院自動化所,提出的全雙工語音交互國際標(biāo)準(zhǔn)正式獲批立項(xiàng)。

          ?

          這也是在人機(jī)交互領(lǐng)域中,首個由中國牽頭制定的智能語音交互國際標(biāo)準(zhǔn)。

          ?


          此外,科大訊飛還主導(dǎo)承建了語音及語言信息處理國家工程實(shí)驗(yàn)室、認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室等國家級平臺。

          ?

          而在最擅長的語音方面,科大訊飛也連續(xù)多次獲得CHiME、Blizzard Challenge、IWSLT等國際評測冠軍,并在業(yè)界率先實(shí)現(xiàn)口語自動評測達(dá)到人工專家水平。


          「俗話」說得好,再強(qiáng)的SOTA終究是會被刷掉的。于是我們就看看2021年,科大訊飛都有哪些不俗的表現(xiàn)。

          ?

          在低資源多語種語音識別方面,由世界語音學(xué)術(shù)領(lǐng)域的權(quán)威組織美國國家標(biāo)準(zhǔn)與技術(shù)研究院NIST(National Institute of Standards and Technology)舉辦的OpenASR (Open Automatic Speech Recognition) 比賽就非常具有代表性。


          ?

          2021年11月,科大訊飛-中科大語音及語言信息處理國家工程實(shí)驗(yàn)室(USTC-NELSLIP)聯(lián)合團(tuán)隊參加了所有15個語種受限賽道和7個語種非受限賽道,并全部取得第一名的成績。



          說到這里,其實(shí)不難發(fā)現(xiàn),科大訊飛能做的已經(jīng)遠(yuǎn)遠(yuǎn)不止有語音這一個點(diǎn)了。

          ?

          畢竟,想要理解這15種語言的對話都在說什么,除了要準(zhǔn)確地識別出來以外,還得能「聽懂」才行。

          ?

          這個時候,就要祭出人工智能最常用到的自然語言處理了,而且,還得是多語種的才行。

          ?

          正好,谷歌舉辦的XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)多語種自然語言理解評測,就涵蓋了12個語系的40種語言,并包括對不同層次的語法或語義進(jìn)行推理的4大類9個任務(wù)。

          ?

          2021年10月,哈工大訊飛聯(lián)合實(shí)驗(yàn)室(HFL)團(tuán)隊以總平均分84.1分位列榜首,刷新了微軟9月份才剛剛達(dá)到的世界紀(jì)錄。


          ??

          除了最新的這次屠榜以外,科大訊飛近5年在NLP領(lǐng)域共獲得20余項(xiàng)國際評測冠軍,并于2021年獲吳文俊人工智能科技進(jìn)步獎一等獎。

          ?

          當(dāng)然了,CV領(lǐng)域也不例外,科大訊飛近幾年在圖文分析、虛擬形象等方向提出十余項(xiàng)原創(chuàng)成果。

          ?

          等下,道理我都懂,但一個搞語音的是怎么和計算機(jī)視覺扯上關(guān)系的?

          ?

          這,就要從2014年說起了。

          ?

          當(dāng)時,研究院發(fā)現(xiàn)人工智能在教育里非常富有潛力,而OCR技術(shù)可以稱得上是進(jìn)入這個領(lǐng)域的必由之路。

          ?

          然而,擺在科大訊飛面前的問題有兩個:

          1.?文本行大段的手寫連筆讓字符很難被切分

          2.?公式的識別需要處理上下左右以及嵌套等各種順序


          ?

          對此,研究院的小伙伴們發(fā)現(xiàn),在語音識別中,需要將連續(xù)的波形轉(zhuǎn)化出分離的字符,而波形和手寫字類似,也是無法拆分的。

          ?

          很快,語音識別到計算機(jī)視覺之間的算法框架遷移和借鑒就完成了。通過將語音識別中的HMM模型框架引入到文本行中,識別精度得到了大幅提升。

          ?

          既然語音的成果能夠借鑒,那NLP的是不是也可以?

          ?

          沒錯,研究院的小伙伴們又一次發(fā)現(xiàn),公式識別和機(jī)器翻譯任務(wù)很像。

          ?

          于是,團(tuán)隊便引入基于注意力機(jī)制的Encoder-Decoder模型并構(gòu)建了新的無切分公式識別算法,成功地將識別率拉到了96%。

          ?

          2020年6月,科大訊飛AI研究院聯(lián)合中科大語音及語言信息處理國家工程實(shí)驗(yàn)室,以顯著優(yōu)勢獲得ICFHR 2020 OffRaSHME數(shù)學(xué)公式識別挑戰(zhàn)賽冠軍。

          ?

          此外,還在ICDAR ReCTS評測任務(wù)中刷新了單字識別、文本行識別、文本行檢測和端到端識別全部四項(xiàng)榜單世界紀(jì)錄。



          當(dāng)然了,科大訊飛的計算機(jī)視覺也不止能識別公式。

          ?

          2021年8月,科大訊飛在智能駕駛的道路目標(biāo)檢測領(lǐng)域,刷新了Cityscapes 3D目標(biāo)檢測任務(wù)的全球最好成績,得到檢測分?jǐn)?shù)(DS)42.9,取得了該項(xiàng)評測的第一名。



          就這樣,科大訊飛的計算機(jī)視覺在語音識別技術(shù)+自然語言處理的基礎(chǔ)上構(gòu)建了起來。


          一股注入血里的基因

          ?

          可以看到,不論是語音、還是NLP、CV都是單點(diǎn)技術(shù)上取得的突破。

          ?

          不得不承認(rèn),得益于源頭技術(shù)創(chuàng)新,訊飛在人工智能發(fā)展史上樹立了語音合成、語音識別、認(rèn)知智能等多個里程碑。



          源頭技術(shù)創(chuàng)新是訊飛從創(chuàng)立初始注入血里的基因。

          ?

          但是,單點(diǎn)應(yīng)用還只是窄人工智能,而現(xiàn)實(shí)并不是只有加法運(yùn)算,加減乘除都得會,就需要AI系統(tǒng)性創(chuàng)新。

          ?

          同樣,科大訊飛董事長劉慶峰在2021第五屆全球1024開發(fā)者節(jié)上提出,「為了讓人工智能更好地切實(shí)解決社會重大命題,就必須要從單點(diǎn)應(yīng)用突破到系統(tǒng)性創(chuàng)新。」

          ?

          那么,何為系統(tǒng)性創(chuàng)新?他給出了系統(tǒng)性創(chuàng)新的三個關(guān)鍵要素:

          ?

          第一是重大系統(tǒng)性命題到科學(xué)問題的轉(zhuǎn)化能力;

          第二是從單點(diǎn)的核心技術(shù)效果上要取得突破,跨過應(yīng)用門檻;

          第三是把創(chuàng)新鏈條上各個關(guān)鍵技術(shù)深度融合,實(shí)現(xiàn)真正意義上的系統(tǒng)性創(chuàng)新。

          ?

          ?

          如何去實(shí)現(xiàn)系統(tǒng)性創(chuàng)新?

          ?

          科大訊飛堅持在人工智能的技術(shù)層面進(jìn)行源頭技術(shù)的突破和多技術(shù)的融合,來推動實(shí)現(xiàn)系統(tǒng)性創(chuàng)新。

          ?

          就比如,訊飛在去年全球1024開發(fā)者節(jié)上推出的虛擬人交互平臺1.0便是很好的印證。

          ?

          虛擬人的交互需要集成語音識別、對話理解、對話生成、語音合成、虛擬人形象生成等多項(xiàng)的人工智能單點(diǎn)技術(shù),需要實(shí)現(xiàn)多項(xiàng)技術(shù)貫穿,才能實(shí)現(xiàn)更一致更和諧的虛擬人交互系統(tǒng)。



          以情感維度為例,虛擬人的微表情是最難實(shí)現(xiàn)的,也是業(yè)界令人頭痛的問題。

          ?

          目前,訊飛實(shí)現(xiàn)了基于多模態(tài)信息的情緒感知,基于情緒的回復(fù)對話文本生成,以及可展現(xiàn)對應(yīng)情緒的虛擬人的表情和語音合成。

          ?

          基于全局的系統(tǒng)性的規(guī)劃設(shè)計,以及全鏈條單點(diǎn)技術(shù)的有效配合,造就愛加有情感、有個性的多模態(tài)虛擬人。



          此外,還有其他用到系統(tǒng)性創(chuàng)新的案例,比如訊飛AI學(xué)習(xí)機(jī),就融合了圖像、語音、機(jī)器閱讀理解、知識圖譜等技術(shù),可以做到學(xué)生作業(yè)批改,以及基于學(xué)情的個性化學(xué)習(xí)。

          ?

          不論是源頭技術(shù)創(chuàng)新,還是系統(tǒng)性創(chuàng)新,都面向社會剛需,推動真正問題的解決。


          AI花開,不負(fù)22年堅守

          ?

          如今,科大訊飛在「平臺+賽道」齊開花。

          ?

          通系統(tǒng)性技術(shù)創(chuàng)新解決社會重大命題,同時推動人工智能規(guī)?;涞?,實(shí)現(xiàn)「科技為民」的價值追求。

          ?

          回看過往,2010年,訊飛首次推出了人工智能開放平臺,那時能提供的能力還只有3項(xiàng)。

          ?

          2021年科大訊飛全球1024開發(fā)者節(jié)正式發(fā)布了訊飛開放平臺2.0戰(zhàn)略,從二維升級到三維,聯(lián)合各行業(yè)中資源充沛、平臺能力強(qiáng)的龍頭,共同搭建行業(yè)的基線底座,同時匯聚開發(fā)者的創(chuàng)造力。


          現(xiàn)在,訊飛開放平臺提供了449多項(xiàng)人工智能能力,給293萬的開發(fā)者團(tuán)隊,總應(yīng)用數(shù)超137萬,覆蓋終端設(shè)備數(shù)33億+。


          ?

          此外,訊飛也積極布局「賽道」,通過系統(tǒng)性創(chuàng)新,推動人工智能在教育、醫(yī)療、城市、消費(fèi)品、工業(yè)等場景的規(guī)?;瘧?yīng)用。

          ?

          從教育領(lǐng)域看,訊飛推出「因材施教」解決方案,促進(jìn)師生減負(fù)增效,實(shí)現(xiàn)覆蓋全國32個省級行政單位五萬多所學(xué)校超1億師生的規(guī)模化應(yīng)用;

          ?

          比如,2021年剛剛發(fā)布的AI學(xué)習(xí)機(jī)T10,將「因材施教」夢想照進(jìn)現(xiàn)實(shí)。


          ?

          ?

          從醫(yī)療看,面向基層醫(yī)療構(gòu)建人工智能輔助診療系統(tǒng),覆蓋全國200余個區(qū)縣5萬名基層醫(yī)生,累計提供超過3億次輔助診斷服務(wù);

          ?

          從消費(fèi)者領(lǐng)域看,以AI技術(shù)引領(lǐng)電子消費(fèi)品類升級,開創(chuàng)性推出訊飛輸入法、學(xué)習(xí)機(jī)、辦公本、錄音筆、翻譯機(jī)等標(biāo)桿產(chǎn)品。

          ?

          比如2021年5月份發(fā)布的雙屏翻譯機(jī),除了做到精準(zhǔn)實(shí)時的翻譯、多語言多語種翻譯外,也創(chuàng)新了產(chǎn)品外觀,雙屏的形式也更符合后疫情下的交往方式。

          ?


          不止于此,未來訊飛要持續(xù)做到核心技術(shù)的引領(lǐng),這才是其最基礎(chǔ)的和最底層的目標(biāo)。

          ?

          訊飛AI研究院的發(fā)展,很大程度解決了技術(shù)從科研到商業(yè)落地的轉(zhuǎn)化難題,把新技術(shù)轉(zhuǎn)化成現(xiàn)實(shí)生產(chǎn)力,最終完成商業(yè)化閉環(huán)。

          ?

          科大訊飛研究院執(zhí)行院長劉聰談道,「十七年來,有幸經(jīng)歷了從幾個人到1000多人的發(fā)展歷程,親自見證了訊飛研究院的探索、成長、突破、重構(gòu)、革新等不同時期的關(guān)鍵階段。

          ?

          新的一年,新的時代,訊飛研究院將責(zé)無旁貸繼續(xù)前行,用系統(tǒng)性創(chuàng)新解決重大社會剛需,立志于代表中國成為世界一流的研究院?!?/span>

          ?

          未來,訊飛研究院依然會堅持深耕,繼續(xù)推動推動智能語音及人工智能走在世界前列。



          瀏覽 44
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美男女网站 | 黄片视频在线播放 | 免费看日本黄色电影 | 九色自拍视频 | se久久久 |