每日AI資訊
點(diǎn)擊 “藍(lán)色字體”??即可關(guān)注「阿切是個(gè)巨人」
一、《自然》雜志刊登 IBM“AI 模擬芯片”研究成果,效能可達(dá)傳統(tǒng)芯片 14 倍
8 月 24 日消息,《自然》期刊雜志 8 月 23 日刊登了 IBM 研究實(shí)驗(yàn)室的最新研究成果:一種能效為傳統(tǒng)數(shù)字計(jì)算機(jī)芯片 14 倍的 AI 模擬芯片。據(jù)稱(chēng),該芯片在語(yǔ)音識(shí)別上的效率超過(guò)了通用處理器,有望突破當(dāng)前 AI 開(kāi)發(fā)因?yàn)樗懔π阅懿蛔?、效率不高而?dǎo)致的瓶頸。該文章摘要中表示,當(dāng)前擁有數(shù)十億個(gè)參數(shù)的 AI 模型可在一系列任務(wù)中實(shí)現(xiàn)較高精度,但也凸顯出傳統(tǒng)通用處理器(包含圖形處理器、中央處理器等)效能低下的問(wèn)題。
二、AI 化身“陳婉嫣”助力“2023 香港小姐”決賽,為“史上首位虛擬港姐司儀
8 月 24 日消息,“2023 香港小姐競(jìng)選”將于 8 月 27 日晚進(jìn)行決賽,據(jù) TVB 官方微博消息,今年“港姐決賽”將打破傳統(tǒng),將 AI 元素融入選美,從而誕生了“史上首位 AI 港姐司儀”。
據(jù)悉,大賽官方通過(guò) AI 綜合“過(guò)往 50 年港姐冠軍的參賽片段”,合成了最接近完美的“香港小姐”形象作為司儀,其得名“陳婉嫣”(Evelyn),據(jù)稱(chēng),這一名字由來(lái),也是 AI 根據(jù)歷屆冠軍的中英文名資料生成,意思是“聰明及迷人”。

三、中國(guó)知網(wǎng)發(fā)布 AI 智能寫(xiě)作平臺(tái)等“大模型 + AIGC”產(chǎn)品
8 月 24 日消息,據(jù) CNKI 知網(wǎng)官方公眾號(hào)表示,在由中核集團(tuán)(內(nèi)蒙古)市場(chǎng)開(kāi)發(fā)部、中國(guó)知網(wǎng)聯(lián)合清華大學(xué)技術(shù)創(chuàng)新研究中心等多家單位共同舉辦的“2023 年創(chuàng)新與大數(shù)據(jù)知識(shí)管理研討會(huì)”上,中國(guó)知網(wǎng)正式發(fā)布基于“大模型 + AIGC”的大數(shù)據(jù)知識(shí)管理系列產(chǎn)品。

四、Gartner:2023 年全球 AI 芯片收入將達(dá) 530 億美元,2027 年達(dá) 1194 億美元
8 月 24 日消息,根據(jù)市場(chǎng)研究公司 Gartner 的最新預(yù)測(cè),2023 年全球用于 AI 的硬件銷(xiāo)售收入預(yù)計(jì)將同比增長(zhǎng) 20.9%,達(dá)到 534 億美元(當(dāng)前約 3887.52 億元人民幣)。
Gartner 表示,生成式 AI 的發(fā)展和各種基于 AI 的應(yīng)用在數(shù)據(jù)中心、邊緣基礎(chǔ)設(shè)施和端點(diǎn)設(shè)備中的廣泛使用,需要部署 GPU 和“優(yōu)化的半導(dǎo)體設(shè)備”,這將推動(dòng) AI 芯片的生產(chǎn)和部署。

五、好未來(lái)推出自研千億級(jí)數(shù)學(xué)大模型 MathGPT ,即日起開(kāi)放內(nèi)測(cè)
8 月 24 日消息,在好未來(lái) 20 周年直播活動(dòng)中,CTO 田密宣布好未來(lái)自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型 MathGPT 開(kāi)啟內(nèi)測(cè)。即日起,用戶(hù)可通過(guò)官網(wǎng)(www.mathgpt.com)申請(qǐng)注冊(cè)賬號(hào)免費(fèi)試用體驗(yàn)。今年 5 月,好未來(lái)曾公布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),命名為 MathGPT。MathGPT 是面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),以解題和講題算法為核心的數(shù)學(xué)垂直領(lǐng)域的大模型,也號(hào)稱(chēng)是國(guó)內(nèi)首個(gè)專(zhuān)為數(shù)學(xué)打造的大模型。

六、文本轉(zhuǎn)語(yǔ)音 AI 工具 ElevenLabs 完成測(cè)試階段,支持中文等 28 種語(yǔ)言
8 月 24 日消息,爆火的 AI 文本轉(zhuǎn)語(yǔ)音公司 ElevenLabs 近日宣布擴(kuò)展其平臺(tái),推出支持 28 種語(yǔ)言的新的文本轉(zhuǎn)語(yǔ)音模型“Eleven Multilingual v2”,可自動(dòng)識(shí)別 28 種語(yǔ)言,并將文本轉(zhuǎn)換為語(yǔ)音。此次擴(kuò)展標(biāo)志著該平臺(tái)正式完成測(cè)試階段,使其可以為企業(yè)和個(gè)人使用。
該平臺(tái)使用了自主開(kāi)發(fā)的新型 AI 模型,可以自動(dòng)識(shí)別包括中文在內(nèi)的多種語(yǔ)言,并生成具有“豐富情感”的語(yǔ)音。用戶(hù)可以利用平臺(tái)的聲音克隆工具,無(wú)需輸入文本,就可以用近 30 種語(yǔ)言說(shuō)話(huà)。

七、革命性的配對(duì)軟件?Buzr AI讓相親對(duì)象頂著你偶像的臉和你語(yǔ)音交流
8月24日 消息:AI Headshot Generator是一款利用人工智能技術(shù)創(chuàng)建自然且個(gè)性化頭像的工具。它提供了無(wú)限的場(chǎng)景、發(fā)型、服裝等選擇,幫助用戶(hù)輕松打造個(gè)性化的頭像。該工具由來(lái)自 MIT 和 Google Brain 的優(yōu)秀研究人員團(tuán)隊(duì)開(kāi)發(fā),旨在節(jié)省用戶(hù)的時(shí)間、金錢(qián)和精力,并展現(xiàn)他們最佳的狀態(tài)。
體驗(yàn)地址:https://buzr.org/

八、美圖上線(xiàn)AILogo設(shè)計(jì)功能
8月23日,美圖公司旗下美圖設(shè)計(jì)室正式上線(xiàn)AILogo設(shè)計(jì)功能,用戶(hù)只需輸入品牌名和一句描述,AI即可生成不同風(fēng)格的Logo。
AILogo設(shè)計(jì)依托美圖AI技術(shù),可以快速生成多種風(fēng)格和排版的創(chuàng)意Logo。
生成的Logo支持修改和應(yīng)用到多種場(chǎng)景,并可下載源文件二次設(shè)計(jì)。
當(dāng)前AILogo包括高端簡(jiǎn)約風(fēng)、趣味卡通風(fēng)、扁平插畫(huà)風(fēng)等多種風(fēng)格。

九、中風(fēng)癱瘓18年,AI讓她再次「開(kāi)口說(shuō)話(huà)」!腦機(jī)接口模擬表情,數(shù)字化身當(dāng)嘴替|Nature
癱瘓的Ann失語(yǔ)了18年。就在最近,腦機(jī)接口和數(shù)字化身,竟讓她能用面部表情「說(shuō)話(huà)」了。幸運(yùn)地是,來(lái)自加州大學(xué)的團(tuán)隊(duì)開(kāi)發(fā)了全新腦機(jī)接口(BCI),讓Ann控制「數(shù)字化身」再次開(kāi)始說(shuō)話(huà)了。BCI便會(huì)攔截大腦信號(hào),將其轉(zhuǎn)化為單詞、語(yǔ)音。這里,AI不是去解碼整個(gè)單詞,而是解碼音素。
在這項(xiàng)研究中,由加州大學(xué)舊金山分校神經(jīng)外科主任Edward Chang博士領(lǐng)導(dǎo)的研究團(tuán)隊(duì)將253針電極陣列植入了Ann的大腦語(yǔ)言控制區(qū)。這些探頭監(jiān)測(cè)并捕獲了神經(jīng)信號(hào),并通過(guò)頭骨中的電纜端口將它們傳輸?shù)揭唤M處理器中,在這個(gè)計(jì)算堆棧( computing stack)中有一個(gè)機(jī)器學(xué)習(xí)AI。

十、好用AI工具推薦: AI繪畫(huà)利器條件生圖(ControlNet)
controlnet直接翻譯過(guò)來(lái)就是「控制網(wǎng)」,也可以說(shuō)是Stable difussion的一個(gè)插件.有必要介紹一下作者之一是在美國(guó)讀博的中國(guó)人張呂敏,還是個(gè)學(xué)生發(fā)表了諸多與繪畫(huà)有關(guān)的論文.這里先放下最近研究的ControlNet的論文:
地址:https://arxiv.org/abs/2302.05543v1

SD有兩個(gè)最重要的兩個(gè)功能是:Lora和ControlNet,一個(gè)控制風(fēng)格,一個(gè)控制構(gòu)圖.這次簡(jiǎn)要講最重要的構(gòu)圖神器ControlNet. 一般我們直接文生圖其實(shí)差異性特別大,如圖:

如果我們利用ControlNet去控制圖片人物的動(dòng)作,按照一個(gè)維度訓(xùn)練就能很好控制繪圖的走向了.簡(jiǎn)單的概述ControlNet的類(lèi)型主要有以下幾類(lèi):
線(xiàn)稿:
1)Canny:據(jù)說(shuō)最常用,繪制成線(xiàn)稿.官方github說(shuō)是most important and perhaps the most frequently used model
2)MLSD:線(xiàn)稿里面的特殊類(lèi),是直線(xiàn)檢測(cè),適合建筑設(shè)計(jì)、室內(nèi)設(shè)計(jì)
3)lineart :也是線(xiàn)條提取,在1.0版本中我沒(méi)記錯(cuò)的話(huà)可能是fake_scribble
4)lineart_anime:官方說(shuō)這個(gè)要配合anything_v3的大模型使用比較合適,也是ControlNet里面唯一一個(gè)可能需要復(fù)雜提示詞的模型
5)SoftEdge:里面又分了好幾種預(yù)處理器,官方建議綜合效果選擇SoftEdge_PIDI
6)Scribble:scribble翻譯就是涂鴉,所以自己隨便涂幾筆,剩下交給AI去發(fā)揮,效果真的蠻驚艷
結(jié)構(gòu):
1)depth:景深圖。根據(jù)深度和輪廓,然后模型去出圖
2)seg:圖像的語(yǔ)義分割圖。譬如粉色是建筑物、綠色是植物等等,然后再交給模型去對(duì)應(yīng)出圖
3)normalbae:法線(xiàn)貼圖, 然后同樣,再把這個(gè)帶著構(gòu)圖信息的圖交給后面的normalbae模型去參考出圖
其他:
1)OpenPose:骨骼捕捉
2)inpaint:局部修圖,初步實(shí)驗(yàn)下來(lái)也還不錯(cuò)
3)shuffle:風(fēng)格遷移,非常好用&好玩
4)ip2p:指令式修圖,動(dòng)動(dòng)嘴皮子就可以魔法改圖片(不過(guò)目前指令識(shí)別還有點(diǎn)局限性)
5)tile:用于超清修復(fù)的。不是一般的上采樣高清,而是會(huì)增加原圖沒(méi)有的細(xì)節(jié)
暫時(shí)說(shuō)這么多,下期整理一篇完整的ControlNet有關(guān)學(xué)習(xí)過(guò)程的內(nèi)容,需要上述張呂敏關(guān)于ControlNet論文pdf版本可以扣「1」獲取??
