大廠們在大模型上都快要卷成麻花了
共 3470字,需瀏覽 7分鐘
·
2024-04-16 13:01
清華團隊推出 MiniCPM:利用可擴展的訓練策略挖掘小模型潛力;
蘋果MM1大模型:30B參數(shù),多模態(tài),在預訓練指標上達到SOTA;
亞馬遜提出大規(guī)模視頻語言對齊方法VidLA;
英偉達參與,高效視頻擴散模型CMD發(fā)布;
谷歌、Stability AI新研究:由文本引導生成紋理3D服裝;
港大、阿里新研究:只需一張圖,輕松即時定制個性化照片;
上海 AI Lab 新研究:將 LVLM 分辨率提升到 4K HD。
大模型正在重構一個新的人工智能,技術的更迭也是日新月異,這次我整理了近3個月的包含谷歌/蘋果/亞馬遜/阿里等最新大模型研究102篇大模型論文,給大家做學習參考。
掃碼回復“大模型”
領最新100+篇大模型論文合集
AI大模型,正在改變世界,為了更好的入局AI大模型,這次我特意復盤和整理大模型學習脈絡,開了30節(jié)大模型的課程,包含大模型理論、大模型論文帶讀以及大模型企業(yè)項目實戰(zhàn),還附贈500+大模型論文。
0.01元解鎖30節(jié)“AI大模型系列課程”
領500+篇大模型論文合集
以下是《AI大模型系列課》課程目錄
第一課:NLP大模型:基礎、前沿與學習路徑
第二課:基于模型量化的大模型壓縮的進展
?? 壓縮技術中,為什么量化要優(yōu)于剪枝、蒸餾?
?? 如何搜索裁剪閾值用于裁剪outlier?
?? 包含有異常值outlier的特征如何量化?
第三課:基于模型剪枝的大模型高效計算和應用
?? 模型剪枝的技術背景
?? 模型剪枝具體方法
?? 模型剪枝前沿方法
?? 語言模型剪枝實例
第四課:講解擴散模型的基礎知識及拓展應用
?? AI作畫--以文生圖
?? 擴散模型是什么
?? 擴散模型工作拓展
?? 擴散模型帶來的機遇
第五課:大語言模型的RLHF
?? RLHF的優(yōu)點和挑戰(zhàn)
?? RLHF如何改善大模型性能
?? RLHF的實際應用案例
?? RLHF在大模型的未來趨勢
第六課:[LLM + 微調(diào)]大模型的高效微調(diào)
?? 01 介紹
?? 02 常用的高效微調(diào)方法介紹
?? 03 如何針對領域數(shù)據(jù)集根據(jù)高效微調(diào)方法創(chuàng)造大語言模型
?? 04 未來挑戰(zhàn)與研究方向
第七課:大模型醫(yī)療
?? 醫(yī)療領域的數(shù)據(jù)特點、挑戰(zhàn)和機遇
?? 大模型的定義和特點,如預訓練、微調(diào)、指令學習等
?? 針對ChatGLM大模型,介紹ChatGLM模型微調(diào)
?? 代碼實踐以及模型微調(diào)
第八課:大模型基本概念以及應用場景
?? 發(fā)展線路與技術手段
?? 應用場景
?? 缺點與局限
?? 未來展望
第九課:LLAMA2中文大模型
?? 理論介紹
?? 代碼實踐
第十課:大模型前沿論文帶讀訓練營(NLP方向)
?? 01 LLaMA訓練營
?? 02 LLaMA訓練營——精讀
?? 03 LLaMA訓練營——代碼講解
?? 04 GLM-130B訓練營——論文泛讀
?? 05 GLM-130B訓練營——論文精讀
?? 06 GLM-130B訓練營——代碼講解
?? 07 Alpaca訓練營——論文泛讀
?? 08 Alpaca訓練營——論文精讀
?? 09 Alpaca訓練營——代碼講解
第十一課:掌握大模型領域前沿,跑通三套企業(yè)級項目代碼
?? 01 開發(fā)基于大模型的聊天機器人
?? 02 實戰(zhàn)基于大模型的對話系統(tǒng)(實戰(zhàn)一)
?? 03 大模型模型原理及綜述
?? 04 大語言模型(LLM)原理及綜述
?? 05 精讀大模型-3論文、Instruct論文
?? 06 精讀谷歌PaLM論文、臉書LLaMA論文
?? 07 實戰(zhàn)基于大模型的對話系統(tǒng)(實戰(zhàn)二)
?? 08 實戰(zhàn)微調(diào)LLaMA模型
掃碼回復“大模型”
領500+篇大模型論文合集
在大模型的構建之下,AI自動化交互,將會決定世界的未來,誰的大模型更強大,將決定在遙遠的未來的話語權,同時,大模型會成為AI基礎設施。
2024年也必將是大模型繼續(xù)活躍的一年,不想錯過大模型機遇的同學,趕緊0.01元掃碼獲取30節(jié)《AI大模型系列課程》!
0.01元解鎖30節(jié)“AI大模型系列課程”
領500+篇大模型論文合集
