<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

[LLM推理優(yōu)化] 100+篇: 大模型推理各方向新發(fā)展整理

共 1113字，需瀏覽 3分鐘

·

2024-05-30 20:10

作者丨DefTruth

來源丨h(huán)ttps://zhuanlan.zhihu.com/p/693680304

編輯丨GiantPandaCV

0x01 前言

從事大模型推理的工作有段時間了，業(yè)余有空的時候也會關(guān)注一下LLM近期發(fā)展的方向，以及一些新的paper。說實話，這些論文沒法一一看完，大部分都只是看了摘要和結(jié)論，了解一下相關(guān)的技術(shù)對自己當前所做的業(yè)務(wù)是否有助益。整理和歸納是自己長期以來的習慣，對于LLM推理的發(fā)展也是如此，雖然無法一一深入到所有細節(jié)，但至少讓自己保持一下對業(yè)界發(fā)展的敏感度應(yīng)該還是可以的。

0x02 目錄

半年多時間，大概收錄了100多篇LLM推理相關(guān)的論文（paper with codes），既包括了常用的Attention優(yōu)化、權(quán)重量化、KV Cache優(yōu)化等技術(shù)，也涵蓋了一些新方向，比如Early Exit、Long Context/Prompt KV Cache優(yōu)化、Parallel Decoding/Sampling等。

0x03 內(nèi)容

整理的內(nèi)容都放在了GitHub:

https://github.com/DefTruth/Awesome-LLM-Inference

這里不打算重復(fù)粘貼了，感興趣的歡迎來GitHub閱讀。

0x04 總結(jié)

TIPS: 歡迎大家提交PR增加LLM推理最新動向~

- The End -

GiantPandaCV

長按二維碼關(guān)注我們

本公眾號專注：

1. 技術(shù)分享；

2. 學術(shù)交流；

3. 資料共享。

歡迎關(guān)注我們，一起成長！

瀏覽 158

2點贊

收藏

分享

舉報

評論

圖片

表情

大模型LLM論文整理

LLMs 論文研讀社作者：楊夕介紹：該倉庫主要記錄 LLMs 算法工程師相關(guān)的頂會論文研讀筆記（多模態(tài)、PEFT、小樣本QA問答、RAG、LMMs可解釋性、Agents、CoT）LLMs 九層妖塔地址：https://github.com/km1994/LLMsNineStoryDemonTowe

大模型LLM論文整理

LLMs 論文研讀社作者：楊夕介紹：該倉庫主要記錄 LLMs 算法工程師相關(guān)的頂會論文研讀筆記（多模態(tài)、PEFT、小樣本QA問答、RAG、LMMs可解釋性、Agents、CoT）LLMs 九層妖塔地址：https://github.com/km1994/LLMsNineStoryDemonTowe

K8S, AI 大模型推理優(yōu)化的新選擇!

▼ 最近直播超級多，預(yù)約保你有收獲今晚直播：《大模型Agent應(yīng)用落地實戰(zhàn) 》 — 1 — AI 大模型訓(xùn)練和推理 Docker 容器和 Kubernetes 已經(jīng)成為越來越多 AI 應(yīng)用首選的運行環(huán)境和平臺。一方面，Kubernetes 幫助用戶...

fastllm高性能大模型推理庫

fastllm是純C++實現(xiàn)的全平臺llm加速庫。支持Python調(diào)用，chatglm-6B級模型單卡可達10000+token/s，支持glm、llama、moss基座，手機端流暢運行。功能概述純C

fastllm高性能大模型推理庫

fastllm 是純 C++ 實現(xiàn)的全平臺 llm 加速庫。支持 Python 調(diào)用，chatglm

大模型推理再提速！英偉達推出TensorRT-LLM，專為提升大模型推理速度優(yōu)化的全新框架

由臺灣林白出版社發(fā)行人林佛兒於1984年11月創(chuàng)刊，刊載了大批日本和歐美的短篇推理佳作，也培養(yǎng)了衆(zhòng)多

2點贊

收藏

分享

舉報

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

豆花视频官方网站入口在线观看 | 99国精产品自偷自偷综合 | 日韩一级AV片 | 欧美成人一区二区三区片免费 | 伊人888 |