點(diǎn)擊 “藍(lán)色字體”??即可關(guān)注「阿切是個(gè)巨人」

2023年8月25日,一秒看今天AI發(fā)生的大事,命運(yùn)的齒輪開(kāi)始轉(zhuǎn)動(dòng)~

一、《自然》雜志刊登 IBM“AI 模擬芯片”研究成果，效能可達(dá)傳統(tǒng)芯片 14 倍

8 月 24 日消息，《自然》期刊雜志 8 月 23 日刊登了 IBM 研究實(shí)驗(yàn)室的最新研究成果：一種能效為傳統(tǒng)數(shù)字計(jì)算機(jī)芯片 14 倍的 AI 模擬芯片。據(jù)稱(chēng)，該芯片在語(yǔ)音識(shí)別上的效率超過(guò)了通用處理器，有望突破當(dāng)前 AI 開(kāi)發(fā)因?yàn)樗懔π阅懿蛔?、效率不高而?dǎo)致的瓶頸。該文章摘要中表示，當(dāng)前擁有數(shù)十億個(gè)參數(shù)的 AI 模型可在一系列任務(wù)中實(shí)現(xiàn)較高精度，但也凸顯出傳統(tǒng)通用處理器（包含圖形處理器、中央處理器等）效能低下的問(wèn)題。

二、AI 化身“陳婉嫣”助力“2023 香港小姐”決賽，為“史上首位虛擬港姐司儀

8 月 24 日消息，“2023 香港小姐競(jìng)選”將于 8 月 27 日晚進(jìn)行決賽，據(jù) TVB 官方微博消息，今年“港姐決賽”將打破傳統(tǒng)，將 AI 元素融入選美，從而誕生了“史上首位 AI 港姐司儀”。

據(jù)悉，大賽官方通過(guò) AI 綜合“過(guò)往 50 年港姐冠軍的參賽片段”，合成了最接近完美的“香港小姐”形象作為司儀，其得名“陳婉嫣”（Evelyn），據(jù)稱(chēng)，這一名字由來(lái)，也是 AI 根據(jù)歷屆冠軍的中英文名資料生成，意思是“聰明及迷人”。

三、中國(guó)知網(wǎng)發(fā)布 AI 智能寫(xiě)作平臺(tái)等“大模型 + AIGC”產(chǎn)品

8 月 24 日消息，據(jù) CNKI 知網(wǎng)官方公眾號(hào)表示，在由中核集團(tuán)（內(nèi)蒙古）市場(chǎng)開(kāi)發(fā)部、中國(guó)知網(wǎng)聯(lián)合清華大學(xué)技術(shù)創(chuàng)新研究中心等多家單位共同舉辦的“2023 年創(chuàng)新與大數(shù)據(jù)知識(shí)管理研討會(huì)”上，中國(guó)知網(wǎng)正式發(fā)布基于“大模型 + AIGC”的大數(shù)據(jù)知識(shí)管理系列產(chǎn)品。

四、Gartner：2023 年全球 AI 芯片收入將達(dá) 530 億美元，2027 年達(dá) 1194 億美元

8 月 24 日消息，根據(jù)市場(chǎng)研究公司 Gartner 的最新預(yù)測(cè)，2023 年全球用于 AI 的硬件銷(xiāo)售收入預(yù)計(jì)將同比增長(zhǎng) 20.9%，達(dá)到 534 億美元（當(dāng)前約 3887.52 億元人民幣）。

Gartner 表示，生成式 AI 的發(fā)展和各種基于 AI 的應(yīng)用在數(shù)據(jù)中心、邊緣基礎(chǔ)設(shè)施和端點(diǎn)設(shè)備中的廣泛使用，需要部署 GPU 和“優(yōu)化的半導(dǎo)體設(shè)備”，這將推動(dòng) AI 芯片的生產(chǎn)和部署。

Gartner：2023 年全球 AI 芯片收入將達(dá) 530 億美元，2027 年達(dá) 1194 億美元

五、好未來(lái)推出自研千億級(jí)數(shù)學(xué)大模型 MathGPT ，即日起開(kāi)放內(nèi)測(cè)

8 月 24 日消息，在好未來(lái) 20 周年直播活動(dòng)中，CTO 田密宣布好未來(lái)自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型 MathGPT 開(kāi)啟內(nèi)測(cè)。即日起，用戶(hù)可通過(guò)官網(wǎng)（www.mathgpt.com）申請(qǐng)注冊(cè)賬號(hào)免費(fèi)試用體驗(yàn)。今年 5 月，好未來(lái)曾公布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā)，命名為 MathGPT。MathGPT 是面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)，以解題和講題算法為核心的數(shù)學(xué)垂直領(lǐng)域的大模型，也號(hào)稱(chēng)是國(guó)內(nèi)首個(gè)專(zhuān)為數(shù)學(xué)打造的大模型。

六、文本轉(zhuǎn)語(yǔ)音 AI 工具 ElevenLabs 完成測(cè)試階段，支持中文等 28 種語(yǔ)言

8 月 24 日消息，爆火的 AI 文本轉(zhuǎn)語(yǔ)音公司 ElevenLabs 近日宣布擴(kuò)展其平臺(tái)，推出支持 28 種語(yǔ)言的新的文本轉(zhuǎn)語(yǔ)音模型“Eleven Multilingual v2”，可自動(dòng)識(shí)別 28 種語(yǔ)言，并將文本轉(zhuǎn)換為語(yǔ)音。此次擴(kuò)展標(biāo)志著該平臺(tái)正式完成測(cè)試階段，使其可以為企業(yè)和個(gè)人使用。

該平臺(tái)使用了自主開(kāi)發(fā)的新型 AI 模型，可以自動(dòng)識(shí)別包括中文在內(nèi)的多種語(yǔ)言，并生成具有“豐富情感”的語(yǔ)音。用戶(hù)可以利用平臺(tái)的聲音克隆工具，無(wú)需輸入文本，就可以用近 30 種語(yǔ)言說(shuō)話(huà)。

七、革命性的配對(duì)軟件？Buzr AI讓相親對(duì)象頂著你偶像的臉和你語(yǔ)音交流

8月24日消息:AI Headshot Generator是一款利用人工智能技術(shù)創(chuàng)建自然且個(gè)性化頭像的工具。它提供了無(wú)限的場(chǎng)景、發(fā)型、服裝等選擇，幫助用戶(hù)輕松打造個(gè)性化的頭像。該工具由來(lái)自 MIT 和 Google Brain 的優(yōu)秀研究人員團(tuán)隊(duì)開(kāi)發(fā)，旨在節(jié)省用戶(hù)的時(shí)間、金錢(qián)和精力，并展現(xiàn)他們最佳的狀態(tài)。

體驗(yàn)地址：https://buzr.org/

八、美圖上線(xiàn)AILogo設(shè)計(jì)功能

8月23日，美圖公司旗下美圖設(shè)計(jì)室正式上線(xiàn)AILogo設(shè)計(jì)功能，用戶(hù)只需輸入品牌名和一句描述，AI即可生成不同風(fēng)格的Logo。

AILogo設(shè)計(jì)依托美圖AI技術(shù)，可以快速生成多種風(fēng)格和排版的創(chuàng)意Logo。
生成的Logo支持修改和應(yīng)用到多種場(chǎng)景，并可下載源文件二次設(shè)計(jì)。
當(dāng)前AILogo包括高端簡(jiǎn)約風(fēng)、趣味卡通風(fēng)、扁平插畫(huà)風(fēng)等多種風(fēng)格。

九、中風(fēng)癱瘓18年，AI讓她再次「開(kāi)口說(shuō)話(huà)」！腦機(jī)接口模擬表情，數(shù)字化身當(dāng)嘴替｜Nature

癱瘓的Ann失語(yǔ)了18年。就在最近，腦機(jī)接口和數(shù)字化身，竟讓她能用面部表情「說(shuō)話(huà)」了。幸運(yùn)地是，來(lái)自加州大學(xué)的團(tuán)隊(duì)開(kāi)發(fā)了全新腦機(jī)接口（BCI），讓Ann控制「數(shù)字化身」再次開(kāi)始說(shuō)話(huà)了。BCI便會(huì)攔截大腦信號(hào)，將其轉(zhuǎn)化為單詞、語(yǔ)音。這里，AI不是去解碼整個(gè)單詞，而是解碼音素。

在這項(xiàng)研究中，由加州大學(xué)舊金山分校神經(jīng)外科主任Edward Chang博士領(lǐng)導(dǎo)的研究團(tuán)隊(duì)將253針電極陣列植入了Ann的大腦語(yǔ)言控制區(qū)。這些探頭監(jiān)測(cè)并捕獲了神經(jīng)信號(hào)，并通過(guò)頭骨中的電纜端口將它們傳輸?shù)揭唤M處理器中，在這個(gè)計(jì)算堆棧（ computing stack）中有一個(gè)機(jī)器學(xué)習(xí)AI。

十、好用AI工具推薦: AI繪畫(huà)利器條件生圖(ControlNet)

controlnet直接翻譯過(guò)來(lái)就是「控制網(wǎng)」,也可以說(shuō)是Stable difussion的一個(gè)插件.有必要介紹一下作者之一是在美國(guó)讀博的中國(guó)人張呂敏,還是個(gè)學(xué)生發(fā)表了諸多與繪畫(huà)有關(guān)的論文.這里先放下最近研究的ControlNet的論文:

地址:https://arxiv.org/abs/2302.05543v1

SD有兩個(gè)最重要的兩個(gè)功能是：Lora和ControlNet,一個(gè)控制風(fēng)格,一個(gè)控制構(gòu)圖.這次簡(jiǎn)要講最重要的構(gòu)圖神器ControlNet. 一般我們直接文生圖其實(shí)差異性特別大,如圖:

如果我們利用ControlNet去控制圖片人物的動(dòng)作,按照一個(gè)維度訓(xùn)練就能很好控制繪圖的走向了.簡(jiǎn)單的概述ControlNet的類(lèi)型主要有以下幾類(lèi):

線(xiàn)稿:

1）Canny：據(jù)說(shuō)最常用，繪制成線(xiàn)稿.官方github說(shuō)是most important and perhaps the most frequently used model
2）MLSD：線(xiàn)稿里面的特殊類(lèi)，是直線(xiàn)檢測(cè)，適合建筑設(shè)計(jì)、室內(nèi)設(shè)計(jì)
3）lineart ：也是線(xiàn)條提取，在1.0版本中我沒(méi)記錯(cuò)的話(huà)可能是fake_scribble
4）lineart_anime：官方說(shuō)這個(gè)要配合anything_v3的大模型使用比較合適,也是ControlNet里面唯一一個(gè)可能需要復(fù)雜提示詞的模型
5）SoftEdge：里面又分了好幾種預(yù)處理器，官方建議綜合效果選擇SoftEdge_PIDI
6）Scribble：scribble翻譯就是涂鴉，所以自己隨便涂幾筆，剩下交給AI去發(fā)揮，效果真的蠻驚艷

結(jié)構(gòu):

1）depth：景深圖。根據(jù)深度和輪廓，然后模型去出圖
2）seg：圖像的語(yǔ)義分割圖。譬如粉色是建筑物、綠色是植物等等，然后再交給模型去對(duì)應(yīng)出圖
3）normalbae：法線(xiàn)貼圖, 然后同樣，再把這個(gè)帶著構(gòu)圖信息的圖交給后面的normalbae模型去參考出圖

其他:

1）OpenPose：骨骼捕捉
2）inpaint：局部修圖，初步實(shí)驗(yàn)下來(lái)也還不錯(cuò)
3）shuffle：風(fēng)格遷移，非常好用&好玩
4）ip2p：指令式修圖，動(dòng)動(dòng)嘴皮子就可以魔法改圖片（不過(guò)目前指令識(shí)別還有點(diǎn)局限性）
5）tile：用于超清修復(fù)的。不是一般的上采樣高清，而是會(huì)增加原圖沒(méi)有的細(xì)節(jié)

暫時(shí)說(shuō)這么多,下期整理一篇完整的ControlNet有關(guān)學(xué)習(xí)過(guò)程的內(nèi)容,需要上述張呂敏關(guān)于ControlNet論文pdf版本可以扣「1」獲取??

每日AI資訊

二、AI 化身“陳婉嫣”助力“2023 香港小姐”決賽，為“史上首位虛擬港姐司儀

五、好未來(lái)推出自研千億級(jí)數(shù)學(xué)大模型 MathGPT ，即日起開(kāi)放內(nèi)測(cè)

八、美圖上線(xiàn)AILogo設(shè)計(jì)功能

8月23日，美圖公司旗下美圖設(shè)計(jì)室正式上線(xiàn)AILogo設(shè)計(jì)功能，用戶(hù)只需輸入品牌名和一句描述，AI即可生成不同風(fēng)格的Logo。

九、中風(fēng)癱瘓18年，AI讓她再次「開(kāi)口說(shuō)話(huà)」！腦機(jī)接口模擬表情，數(shù)字化身當(dāng)嘴替｜Nature

二、AI 化身“陳婉嫣”助力“2023 香港小姐”決賽，為“史上首位虛擬港姐司儀

五、好未來(lái)推出自研千億級(jí)數(shù)學(xué)大模型 MathGPT ，即日起開(kāi)放內(nèi)測(cè)

8月23日，美圖公司旗下美圖設(shè)計(jì)室正式上線(xiàn)AILogo設(shè)計(jì)功能，用戶(hù)只需輸入品牌名和一句描述，AI即可生成不同風(fēng)格的Logo。

九、中風(fēng)癱瘓18年，AI讓她再次「開(kāi)口說(shuō)話(huà)」！腦機(jī)接口模擬表情，數(shù)字化身當(dāng)嘴替｜Nature