DeepSeek-R1發(fā)布,性能對標(biāo)OpenAI o1正式版
2025-01-20 20:24
1月20日,DeepSeek宣布正式發(fā)布DeepSeek-R1,并同步開源模型權(quán)重。DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。
瀏覽
18評論
圖片
表情
