人工智能與算法學(xué)習(xí)
1獲贊0關(guān)注0粉絲
小模型已成趨勢(shì)?
來(lái)源:機(jī)器之心上周,OpenAI 上線小模型 GPT-4o-mini,小模型賽道正式開(kāi)卷。近期加入這一賽道的還有蘋果。最近,蘋果公司作為 DataComp-LM(DCLM)項(xiàng)目的研究機(jī)構(gòu)之一,在 Hugging Face 上發(fā)布了 DCLM-7B 開(kāi)源模型。該模型性能已經(jīng)超越了
人工智能與算法學(xué)習(xí)
0
吳恩達(dá)團(tuán)隊(duì)新作!
來(lái)源:機(jī)器之心本研究評(píng)估了先進(jìn)多模態(tài)基礎(chǔ)模型在 10 個(gè)數(shù)據(jù)集上的多樣本上下文學(xué)習(xí),揭示了持續(xù)的性能提升。批量查詢顯著降低了每個(gè)示例的延遲和推理成本而不犧牲性能。這些發(fā)現(xiàn)表明:利用大量演示示例可以快速適應(yīng)新任務(wù)和新領(lǐng)域,而無(wú)需傳統(tǒng)的微調(diào)。論文地址:https://arxiv.org/abs/2405
人工智能與算法學(xué)習(xí)
0
中國(guó)版Sora震撼登場(chǎng),原生16秒直出超清視頻!國(guó)產(chǎn)黑馬火了,世界模型簽約多個(gè)大客戶
來(lái)源:新智元【導(dǎo)讀】近來(lái),國(guó)產(chǎn)AI視頻模型強(qiáng)大生成能力震驚了國(guó)外網(wǎng)友。剛剛,中國(guó)首個(gè)超長(zhǎng)時(shí)長(zhǎng)、高性價(jià)比、端側(cè)可用的Sora級(jí)視頻模型誕生了,由國(guó)產(chǎn)黑馬聯(lián)手清華打造。與別家出發(fā)點(diǎn)不同之處在于,這是為了實(shí)現(xiàn)世界模型而創(chuàng)建的AI視頻模型。Sora爆火之后,視頻生成領(lǐng)域不斷迎來(lái)新的進(jìn)展,視頻的時(shí)代正在開(kāi)啟!
人工智能與算法學(xué)習(xí)
0
終于不用為GPU算力發(fā)愁了,請(qǐng)低調(diào)使用!
眾所周知,想要跑 AI,必須要有英偉達(dá) GPU。但是搭建一臺(tái)配備足夠 GPU 算力的電腦,一萬(wàn)起步的預(yù)算又讓很多人望而卻步。想要初期低成本,快速測(cè)試各種 AI 算法,租用云服務(wù)器平臺(tái)的 GPU 是一個(gè)非常不錯(cuò)的選擇。今天繼續(xù)給大家推薦一個(gè) GPU 云服務(wù)器平臺(tái):趨動(dòng)云,正好趕上官方有新用戶活動(dòng)。大家
人工智能與算法學(xué)習(xí)
0
萬(wàn)字長(zhǎng)文總結(jié)大模型微調(diào)技能圖譜
隨著大模型的飛速發(fā)展,在短短一年間就有了大幅度的技術(shù)迭代更新,從LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸餾技術(shù)到模型增量學(xué)習(xí)、數(shù)據(jù)處理、開(kāi)源模型的理解等,幾乎每天都有新的發(fā)展。我們總結(jié)了算法工程師需要掌握的大模型微調(diào)技能,并
人工智能與算法學(xué)習(xí)
0
全面解析LoRA、QLoRA、RLHF,PPO,DPO,F(xiàn)lash Attention、增量學(xué)習(xí)等大模型算法
隨著大模型的飛速發(fā)展,在短短一年間就有了大幅度的技術(shù)迭代更新,從LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸餾技術(shù)到模型增量學(xué)習(xí)、數(shù)據(jù)處理、開(kāi)源模型的理解等,幾乎每天都有新的發(fā)展。作為算...
人工智能與算法學(xué)習(xí)
0
CVPR 2024審稿結(jié)果出爐!總數(shù)近2萬(wàn)篇,網(wǎng)友吐槽審稿人又是本科生
來(lái)源:新智元 【導(dǎo)讀】一年一度的CVPR 2024審稿結(jié)果公布了!收到審稿結(jié)果的小伙伴們,已經(jīng)開(kāi)始下一步rebuttal了,截止日期到1月30日。 CVPR 2024審稿結(jié)果出來(lái)了。 收到review的小伙伴們,可以正式開(kāi)啟rebuttal,提交...
人工智能與算法學(xué)習(xí)
0
