體驗了一把「訊飛星火V2.0」,真的驚艷到我了!
自ChatGPT爆火后,我開始關(guān)注國內(nèi)國外的AI技術(shù)突破、應(yīng)用落地。起初我還抱著獵奇心理半夜翻墻搶占waitlist,后面看到了越來越多優(yōu)秀的開源項目,更是見證了國內(nèi)大模型的迅速崛起。慢慢地,這些都點(diǎn)燃了我對AI的熱情。
前幾天,《麻省理工科技評論》對國內(nèi)的訊飛星火、百度文心一言、商湯商量和阿里通義千問四款主流大模型進(jìn)行了深度評測,結(jié)果顯示:「訊飛星火」以總分第一(81.5分)的成績登頂,榮獲“最聰明”的國產(chǎn)大模型稱號。

2023年科大訊飛的關(guān)鍵里程碑已完成大半,它的成長有目共睹,一步一個腳印:
科大訊飛正式發(fā)布「訊飛星火認(rèn)知大模型」。
“訊飛星火認(rèn)知大模型”迭代升級:突破開放式問答,實現(xiàn)多輪對話能力再升級、數(shù)學(xué)能力再升級,發(fā)布「訊飛星火認(rèn)知大模型V1.5」,“星火”App及小程序。
“訊飛星火認(rèn)知大模型”迭代升級:突破代碼能力、實現(xiàn)多模態(tài)交互再升級,發(fā)布「訊飛星火認(rèn)知大模型V2.0」,兩款應(yīng)用產(chǎn)品:智能編程助手 iFlyCode 1.0和訊飛智作2,星火助手。
通用大模型要對標(biāo)ChatGPT能力,實現(xiàn)中文能力超越、英文能力相當(dāng)?shù)哪繕?biāo)。
8月15日,科大訊飛舉辦「訊飛星火認(rèn)知大模型V2.0」升級發(fā)布會,星火大模型迎來代碼能力和多模態(tài)能力升級。
我們具體來看下:
「訊飛星火V2.0」對代碼能力進(jìn)行5個維度的升級,包括:代碼生成、代碼補(bǔ)齊、代碼糾錯、代碼解釋、單元測試生成。
我嘗試讓「訊飛星火2.0」用Python畫紅色的心形線、畫出馬鞍面方程三維立體圖并設(shè)置漸變色、用Python生成貪吃蛇小游戲,都是小case。
我覺得貪吃蛇這款游戲,大模型應(yīng)該爛熟于心了,基本不會出錯的。但是對于其他經(jīng)典的小游戲比如飛機(jī)大戰(zhàn),24點(diǎn),掃雷等,并不能一次輸出正確的代碼,可能需要你多次調(diào)試,會有不少bug比如缺失背景圖片、少定義變量、沒有加載庫、字符格式錯誤等。以下是一個簡單的24點(diǎn)小游戲的開發(fā):

圖注:輸入:請用Python生成一個通過加減乘除操作的24點(diǎn)棋牌數(shù)學(xué)小游戲,可以使用pygame庫
根據(jù)OpenAI構(gòu)建的代碼能力公開測試集HumanEval,「訊飛星火V1.5」 Python語言的效果只有41分,「訊飛星火V2.0」已經(jīng)到了61分,接近ChatGPT。另外,根據(jù)認(rèn)知智能國家重點(diǎn)實驗室構(gòu)建的代碼真實的場景使用測試集,「訊飛星火V2.0」在代碼生成和補(bǔ)齊維度上已經(jīng)超過了ChatGPT。
科大訊飛還發(fā)布了訊飛星火的應(yīng)用級產(chǎn)品——智能編程助手iFlyCode1.0。對于“零編程基礎(chǔ)”的小白,也能輕松定制開發(fā)。

在多模態(tài)能力上,訊飛星火在圖像描述、圖像問答、識圖創(chuàng)作、文圖生成、虛擬人合成等方面全新升級。
在圖生文上,我分別測試了「訊飛星火V2.0」對人、物、景、二次元方面的識圖能力,效果還是很不錯的,底下還有一鍵文字轉(zhuǎn)語音功能,可以直接聽小姐姐介紹圖片內(nèi)容。
不過對于文生圖,當(dāng)然也不是硬與SDXL和Midjourney去比較,「訊飛星火V2.0」生成的圖片能夠完整表現(xiàn)文字,甚至一些抽象的形容詞如“精雕細(xì)琢”、“巧奪天工”把握的也很精準(zhǔn)呢,未來在構(gòu)圖、細(xì)節(jié)、美感、色彩等方面還可以更精進(jìn)。
除了強(qiáng)大的多模態(tài)功能以外,訊飛星火還上線了3種實用的插件:文檔問答、PPT生成、簡歷生成。

我也申請了「訊飛星火V2.0」的API內(nèi)測,在訊飛開放平臺申請一個應(yīng)用ID:智能人群分析。參照《人臉識別-人臉特征分析》開發(fā)文檔,簡單的配置,就能做基礎(chǔ)人臉信息的解析。
小試牛刀,我嘗試了表情識別,上傳人像圖片后就能輸出如下所示的表情識別結(jié)果。調(diào)用API響應(yīng)很快,過程流暢,個別小問題參照錯誤碼查詢庫能馬上解決。

「訊飛星火V2.0」的更新不止于此,還有適應(yīng)生活與工作場景剛需的「星火助手」,據(jù)官方介紹目前已開放2000+個智能助手,覆蓋了創(chuàng)作、營銷、編程、學(xué)習(xí)與旅行等十余個核心場景。
太多了,我也只能挑選一些自己感興趣的“小助手”去體驗。從幾天里對「訊飛星火V2.0」的使用和測試,我談不上全面,但值得肯定的是訊飛星火團(tuán)隊真的很用心地去做模型、去研發(fā)產(chǎn)品。
雖與GPT-4還有差距,但在國內(nèi)「訊飛星火V2.0」絕對是一個不可替代的中文大模型,性能抗打,有著絕對的優(yōu)勢。
第一,訊飛星火的注冊過程超簡單,不到1分鐘就申請好了。
第二,訊飛星火的響應(yīng)速度超快,每條內(nèi)容平均生成時間不超過5秒,非常絲滑!相比ChatGPT和一些國內(nèi)產(chǎn)品,體驗時經(jīng)常會因網(wǎng)絡(luò)卡頓等原因不得不刷新頁面重新提問。
第三,訊飛星火免費(fèi)內(nèi)測,包括星火APP、星火API、星火助手、星火插件等全線應(yīng)用,誠意滿滿啊。
新人福利!我還向在訊飛星火的朋友申請了一個專屬鏈接(二維碼):
https://xinghuo.xfyun.cn/?ch=bl_WiBixO
通過這個專屬鏈接申請內(nèi)測體驗的,審核更快,秒通過哦!!!
長按內(nèi)測二維碼,點(diǎn)擊“申請注冊”即可。
還沒有體驗過「訊飛星火V2.0」的小伙伴,強(qiáng)烈建議通過專屬鏈接(二維碼)來申請。
想要進(jìn)一步探索訊飛星火的大模型能力的開發(fā)者,特別是智能語音方面的小伙伴,一定不能錯過訊飛開放平臺的新手大禮包了!個人用戶就有5萬次的免費(fèi)語音聽寫交互使用量,企業(yè)用戶則有50萬次的免費(fèi)使用量。

