GPT迭代成本「近乎荒謬」,Karpathy 300行代碼帶你玩轉(zhuǎn)迷你版

??新智元報(bào)道??
??新智元報(bào)道??
來(lái)源:reddit
編輯:小智
【新智元導(dǎo)讀】最近,特斯拉AI總監(jiān)Karpathy開源了一個(gè)名為minGPT的項(xiàng)目,用300行代碼實(shí)現(xiàn)了GPT的訓(xùn)練。沒(méi)有OpenAI的超級(jí)算力,該如何調(diào)整GPT這類語(yǔ)言模型的各種超參數(shù)?
? ? ? ?
? ? ? ?
? ? ? ?
? ? ?
? ? ? ?
? ? ??
評(píng)論
圖片
表情
