<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

李飛飛團(tuán)隊(duì)“50美元”復(fù)刻DeepSeek的R1真相：基座為阿里云Qwen模型

輕識(shí)快訊

2025-02-06 20:28

2月6日，有媒體報(bào)道稱李飛飛等斯坦福大學(xué)和華盛頓大學(xué)的研究人員以不到50美元的云計(jì)算費(fèi)用，成功訓(xùn)練出了一個(gè)名為s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)，據(jù)稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。s1模型的訓(xùn)練并非從零開(kāi)始，其基座模型為阿里通義千問(wèn)（Qwen）模型。s1用50美元訓(xùn)練出新的具有推理能力的模型，實(shí)際上只是用從谷歌模型中提煉出來(lái)的1000個(gè)樣本，然后對(duì)千問(wèn)模型進(jìn)行微調(diào)而成。

瀏覽 10

點(diǎn)贊

收藏

分享

舉報(bào)

評(píng)論

圖片

表情

阿里Qwen團(tuán)隊(duì)發(fā)布新推模型QwQ，會(huì)展示完整的思維鏈

2月25日，阿里Qwen團(tuán)隊(duì)在社交媒體宣布發(fā)布新推理模型——深度思考 (QwQ) 。這是在QWQ-MAX-PREVIEW支持下，一個(gè)基于Qwen2.5-Max的推理模型。據(jù)悉，這是類似DeepSeek R1和kimi的推理模型，QwQ可同時(shí)支持深度思考和聯(lián)網(wǎng)搜索，并會(huì)展示完整的思維鏈。

DeepSeek R1服務(wù)恢復(fù)正常

3月20日午間，DeepSeek服務(wù)狀態(tài)頁(yè)面顯示，DeepSeek R1網(wǎng)頁(yè)/API不可用。隨后，DeepSeek更新?tīng)顟B(tài)顯示，問(wèn)題已被解決。

DeepSeek正式登陸蘇州，用戶可免費(fèi)體驗(yàn)R1、V3模型

2月9日，從蘇州數(shù)智科技集團(tuán)獲悉，國(guó)內(nèi)領(lǐng)先的人工智能大模型DeepSeek正式登陸蘇州，在蘇州市公共算力服務(wù)平臺(tái)上架了基于英偉達(dá)算力部署的DeepSeek-R1模型和基于華為昇騰算力部署的DeepSeek-V3模型。同時(shí)，提供基于DeepSeek模型的一體機(jī)，針對(duì)有本地化部署需求的用戶提供開(kāi)箱即用的軟硬件一體服務(wù)。

最新全球模型榜單：阿里 Qwen2.5-Max超DeepSeek V3

2月4日，三方基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena公布了最新的大模型盲測(cè)榜單，剛剛發(fā)布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型，以1332分位列全球第七名，也是非推理類的中國(guó)大模型冠軍。同時(shí)，Qwen2.5-Max在數(shù)學(xué)和編程等單項(xiàng)能力上排名第一，在硬提示（Hard prompts）方面排名第二。

阿里萬(wàn)相大模型反超DeepSeek登榜首

3月3日，據(jù)開(kāi)源社區(qū)Hugging Face最新榜單顯示，開(kāi)源僅6天的阿里萬(wàn)相大模型已反超DeepSeek—R1，登頂模型熱榜、模型空間榜兩大榜單，成為近期全球開(kāi)源社區(qū)最受歡迎的大模型。根據(jù)最新數(shù)據(jù)，萬(wàn)相2.1在Hugging Face及魔搭社區(qū)的總下載量已超百萬(wàn)，在Github的Star數(shù)據(jù)超6K。

谷歌CEO：Gemini 2.0 Flash模型在效率上可與DeepSeek的R1媲美

2月5日，谷歌母公司Alphabet首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)在業(yè)績(jī)電話會(huì)議上贊揚(yáng)DeepSeek，認(rèn)為降低AI成本將對(duì)科技巨擘及整體AI需求產(chǎn)生積極影響。皮查伊稱，DeepSeek是一支了不起的團(tuán)隊(duì)，工作非常出色。隨著AI推理成本持續(xù)下降，更多的AI應(yīng)用將變得可行，認(rèn)為谷歌的Gemini 2.0 Flash模型及2.0 Flash Thinking模型在效率上可與De

微軟：DeepSeek R1現(xiàn)已在GitHub等平臺(tái)上線

1月30日，微軟稱，DeepSeek R1現(xiàn)已在AZURE AI FOUNDRY平臺(tái)和GitHub上線。

阿里人士否認(rèn)投資DeepSeek傳聞

2月7日，阿里方面否認(rèn)了投資DeepSeek的傳聞。相關(guān)人士表示，同為中國(guó)杭州企業(yè)，我們?yōu)镈eepSeek鼓掌，但是外界流傳阿里投資DeepSeek的信息是假消息。

阿里云通義開(kāi)源視覺(jué)模型Qwen2.5-VL

1月28日，阿里云通義開(kāi)源視覺(jué)模型Qwen2.5-VL，共推出3B、7B和72B三個(gè)尺寸版本。據(jù)介紹，Qwen2.5-VL不僅擅長(zhǎng)識(shí)別常見(jiàn)物體，如花、鳥(niǎo)、魚(yú)和昆蟲(chóng)，還能夠分析圖像中的文本、圖表、圖標(biāo)、圖形和布局。旗艦版Qwen2.5-VL-72B在13項(xiàng)權(quán)威評(píng)測(cè)中奪得視覺(jué)理解冠軍，全面超越GPT-4o與Claude3.5。

經(jīng)營(yíng)范圍經(jīng)營(yíng)電信業(yè)務(wù)；服務(wù)：計(jì)算機(jī)軟硬件、電子產(chǎn)品、數(shù)碼產(chǎn)品的技術(shù)開(kāi)發(fā)、技術(shù)服務(wù)，企業(yè)管理咨詢與計(jì)算機(jī)信息技術(shù)咨詢；設(shè)計(jì)、制作、代理、發(fā)布國(guó)內(nèi)廣告，成年人的非文化教育培訓(xùn)、成年人的非證書(shū)勞動(dòng)職業(yè)技能培

點(diǎn)贊

收藏

分享

舉報(bào)

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

岛国不卡| 免费播放婬乱视频 | 色婷婷久久综合中文久久蜜桃Av | 人人妻人人澡人人爽久久av | 特污的免费网站中文字幕 |