李飛飛團(tuán)隊(duì)“50美元”復(fù)刻DeepSeek的R1真相:基座為阿里云Qwen模型
2025-02-06 20:28
2月6日,有媒體報(bào)道稱李飛飛等斯坦福大學(xué)和華盛頓大學(xué)的研究人員以不到50美元的云計(jì)算費(fèi)用,成功訓(xùn)練出了一個(gè)名為s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn),據(jù)稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。s1模型的訓(xùn)練并非從零開(kāi)始,其基座模型為阿里通義千問(wèn)(Qwen)模型。s1用50美元訓(xùn)練出新的具有推理能力的模型,實(shí)際上只是用從谷歌模型中提煉出來(lái)的1000個(gè)樣本,然后對(duì)千問(wèn)模型進(jìn)行微調(diào)而成。
瀏覽
10評(píng)論
圖片
表情
