人工智能周刊#20:主流 llm 性能、速度和價(jià)格一覽
共 7249字,需瀏覽 15分鐘
·
2024-05-27 14:41
本期目錄:
大模型
大模型
Google 發(fā)布生成式 AI 視頻模型 Veo[1]
Google 在 I/O 開發(fā)者大會(huì)上宣布了它的生成式 AI 視頻模型 Veo,能以不同視覺和電影風(fēng)格生成長(zhǎng)度超過 1 分鐘的 1080p 分辨率視頻。
Google 稱,Veo 具有自然語(yǔ)言的高級(jí)理解能力,能理解“延時(shí)拍攝(timelapse)”或“空中鏡頭(aerial shots of a landscape)”等電影術(shù)語(yǔ),用戶可用文本、圖像或基于視頻的提示導(dǎo)向他們想要的輸出。
Veo 的視頻輸出更一致和連貫,能展現(xiàn)人和物的更真實(shí)運(yùn)動(dòng)。類似 OpenAI 的 Sora,Veo 將首先提供給電影制作人和內(nèi)容創(chuàng)作者試用。
![[veo_example_014_jellyfish 1.mp4]]
Prompt: A lone cowboy rides his horse across an open plain at beautiful sunset, soft light, warm colors
一覽主流 llm 性能、速度和價(jià)格的對(duì)比網(wǎng)站[2]
分享一個(gè)可以一覽主流 llm 性能、速度和價(jià)格的對(duì)比網(wǎng)站,方便大家選擇適合自己的模型
性能最好:gpt-4o 速度最快:gemini 1.5 flash 價(jià)格最低:llama 3-8b,主要 deepseek 沒做評(píng)測(cè)。
國(guó)內(nèi)外 AI 大語(yǔ)言模型 API 價(jià)格對(duì)比[3]
AIGCRank 大語(yǔ)言模型 API 價(jià)格對(duì)比是一個(gè)專門匯總和比較全球主要 AI 模型提供商的價(jià)格信息的工具??梢暂p松查找和比較 OpenAI、Claude、Mixtral、Kimi、星火大模型、通義千問、文心一語(yǔ)、Llama 3、GPT-4、AWS 和 Google 等國(guó)內(nèi)外主要 API 提供商的最新價(jià)格,確保找到最適合您項(xiàng)目的模型定價(jià)。
工具
開源的 AI 導(dǎo)航站模板[4]
Tap4 AI Web UI 是一款開源的 AI 導(dǎo)航站模板,項(xiàng)目非常輕量級(jí),維護(hù)簡(jiǎn)單,可一鍵部署到 Vercel!
功能
-
國(guó)際化 -
SEO 友好(支持 i18n) -
動(dòng)態(tài) sitemap.xml(支持 i18n) -
快速發(fā)布 -
使用 NEXT 14 和 app 路由(react 服務(wù)器組件) -
Supabase serverless 數(shù)據(jù)庫(kù)
這兩年 AI 導(dǎo)航站的流量非常大,大家如果也想做 AI 導(dǎo)航站,不妨拿去白嫖吧!
2024 GitHub 加速器:開源 AI 11 個(gè)項(xiàng)目[5]
GitHub 加速器宣布了 2024 年入選的 11 個(gè)開源 AI 項(xiàng)目,它們代表了全球開源 AI 領(lǐng)域的創(chuàng)新和加速發(fā)展。項(xiàng)目包括機(jī)器學(xué)習(xí)和 AI 框架、生物學(xué)和疾病發(fā)現(xiàn)、模型訓(xùn)練和微調(diào)工具、仿真、部署和全生產(chǎn)化系統(tǒng)、多模態(tài)和 3D AI 能力,以及從可穿戴設(shè)備到 AI 驅(qū)動(dòng)機(jī)器人的新興接口和設(shè)備。
11 個(gè)入選的開源 AI 項(xiàng)目:
-
Unsloth AI@UnslothAI 由 Daniel Han 和 Michael Han 創(chuàng)立,旨在使自定義 AI 模型更易訪問。Unsloth 通過新興技術(shù)和能力,使其比競(jìng)爭(zhēng)對(duì)手快 2-5 倍,內(nèi)存使用減少 70%,同時(shí)保持模型的性能和準(zhǔn)確性。
-
Giskard@giskard_ai 由 Alex Combessie 和 Weixuan XIAO 創(chuàng)立,是一個(gè)用于測(cè)試和評(píng)估 LLMs 的開源庫(kù)。Giskard 旨在提高開源 AI 模型的質(zhì)量,推動(dòng)整體采用、研究、透明度和問責(zé)性。
-
A-Frame@aframevr 由 Diego Marcos 共同創(chuàng)建和維護(hù),是一個(gè)框架,旨在使任何人在網(wǎng)絡(luò)瀏覽器中都能輕松開發(fā) AR/VR 和 3D 內(nèi)容。A-Frame 專注于集成 AI 工作流程,例如 3D 高斯濺射和生成性 AI,以創(chuàng)建圖像和環(huán)境。
-
Nav2 由機(jī)器人專家 Steve Macenski 創(chuàng)立,是 Robot Operating System (ROS) 導(dǎo)航框架的先驅(qū)。Nav2 是全球部署最廣泛的自主移動(dòng)機(jī)器人(AMR)導(dǎo)航解決方案,被 100 多家公司信賴。
-
OpenWebUI@OpenWebUI 由 Tim Baek 創(chuàng)立,旨在為 AI 和 LLMs 構(gòu)建最佳用戶界面,為那些互聯(lián)網(wǎng)訪問受限的人提供利用 AI 技術(shù)的機(jī)會(huì)。OpenWebUI 通過 Web 界面本地運(yùn)行 LLMs,使 AI 和 LLMs 更安全、更私密。
-
LLMware AI 由 Namee Oberst 創(chuàng)立,她與 CEO Darren Oberst 和 Stefan Bachhofner 一起,旨在為金融和法律機(jī)構(gòu)構(gòu)建安全和敏感的 LLM AI Agent 和 RAG 模型。
-
LangDrive 由 Michael Vandi 和 Spmatika 創(chuàng)立,他們?cè)?CMU 攻讀碩士學(xué)位期間構(gòu)建了一個(gè) LLM 電子郵件代理。LangDrive 是一個(gè)簡(jiǎn)單的框架,通過 API 和配置文件訓(xùn)練和部署生產(chǎn)級(jí)別的微調(diào)語(yǔ)言模型。
-
HackingBuddyGPT 由 Andreas Happe 和 Jurgen Cito 創(chuàng)立,旨在幫助道德黑客和安全專業(yè)人員利用 LLMs 使世界更安全。HackingBuddyGPT 是一個(gè)自主的黑客伙伴,具有人在環(huán)路中的基礎(chǔ)設(shè)施。
-
Web-Check 由 Alicia Sykes 創(chuàng)立,她是一位開源倡導(dǎo)者,旨在通過基于任何網(wǎng)站或服務(wù)器的開放數(shù)據(jù)提供 AI 驅(qū)動(dòng)的安全洞察,使互聯(lián)網(wǎng)更安全。
-
Marimo@marimo_io 由 Akshay Agrawal 和 Myles Scolnick 共同創(chuàng)立,旨在解決數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí) Notebook 使用中的所有問題。Marimo 是一個(gè)下一代 Python Notebook,為 AI/ML 開發(fā)者提供可復(fù)現(xiàn)、可維護(hù)和可生產(chǎn)的 Notebook。
-
Talkd AI @talkd_ai 由 Vinicious Mesel 創(chuàng)立,他開始兼職開發(fā) Talkd AI,以構(gòu)建一個(gè)統(tǒng)一的 LLM 聊天 API,為多個(gè) LLMs 和上下文提供抽象層。Talkd AI 旨在促進(jìn)和傳播 LLMs 中 RAG 技術(shù)的使用方法。
一個(gè)幫助你思考的集合工具&框架:[6]
一個(gè)只做漸變色的 CSS 庫(kù)[7]
Ulgradients 是一個(gè)主打漸變風(fēng)網(wǎng)站,設(shè)計(jì)師可根據(jù)自己風(fēng)格來選擇搭配,直接獲得對(duì)應(yīng)漸變配色的 CSS 代碼,相當(dāng)方便對(duì)于大大提高了前端開發(fā)的效率。
一款專為英語(yǔ)學(xué)習(xí)打造的視頻播放器[8]
為英語(yǔ)學(xué)習(xí)者量身打造的視頻播放器,助你通過觀看視頻、沉浸真實(shí)語(yǔ)境,輕松提升英語(yǔ)水平。
知識(shí)庫(kù)
Phi-3 CookBook[9]
Phi-3 是微軟開發(fā)的一系列開放 AI 模型,是目前功能最強(qiáng)大、性價(jià)比最高的小型語(yǔ)言模型,分為 mini、small、vision 和 medium 等版本。
關(guān)于 Phi-3 入門的 Phi-3 CookBook,主要內(nèi)容:· Phi-3 介紹和快速上手 · Phi-3 推理、微調(diào)和評(píng)測(cè)
生成式人工智能常識(shí)科普?qǐng)D[10]
https://cartography-of-generative-ai.net/genai_cartography.pdf
這張圖非常有意思!
把生成式人工智能 GenAI 的核心內(nèi)容 & 高頻議題,繪制在了一張可視化圖里。通過這張圖,你可以感受到整個(gè) GenAI 世界的運(yùn)轉(zhuǎn)邏輯,也會(huì)大致明白大模型是如何生成文字和圖片的~
LaTeX 入門與進(jìn)階[11]
前端開發(fā)的知識(shí)總結(jié)[12]
手把手帶你從頭實(shí)現(xiàn) LLaMa 3[13]
llama3 implemented from scratch 最近在 GitHub 社區(qū)非常出圈,Star 狂飆!
這個(gè)項(xiàng)目用 圖示 + 代碼 的方式,從頭演示了如何理解和實(shí)現(xiàn) LLaMa 3 的完整過程,非常生動(dòng)、詳細(xì)且硬核 ??
什么是 GPT?工作原理動(dòng)畫展示[14]
3Blue1Brown 是一個(gè)專注于數(shù)學(xué)教育的 YouTube 頻道,視頻制作精良且非常擅用直觀的動(dòng)畫和圖表,講清楚復(fù)雜抽象的數(shù)學(xué)話題,以及由此拓展的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等等。
3Blue1Brown 在 B 站也有官方賬號(hào),而且有 200 多萬(wàn)粉絲啦!最近更新的視頻都與大模型有關(guān),整個(gè)系列還在持續(xù)更新中。
如果你想直觀地搞清楚 GPT 原理,那 3Blue1Brown 這個(gè)系列的視頻,應(yīng)該是全球最好的學(xué)習(xí)資料了,甚至沒有之一。
@arthurchiao 做了另一件非常有意義的工作 —— 將視頻整理成了「動(dòng)圖 + 文字」的可視化版本,而且還是中文!!相當(dāng)于一份學(xué)霸的要點(diǎn)筆記,幫助你能更清晰地 get 到原視頻的要點(diǎn),徹底搞清楚 Transformer 內(nèi)部工作原理。
OpenAI 前首席科學(xué)家分享 30 篇頂級(jí) AI 論文[15]
OpenAI 前首席科學(xué)家 Ilya sutskever 大佬分享的約 30 篇頂級(jí) AI 研究論文清單爆火????,據(jù)說看完可以掌握當(dāng)前人工智能最為關(guān)鍵的 90% 的知識(shí)!
包括 Transformer 架構(gòu)、RNN、LSTM、神經(jīng)網(wǎng)絡(luò)復(fù)雜度、計(jì)算機(jī)視覺等領(lǐng)域
輕閱讀
公開寫作的好處和堅(jiān)持不懈[16]
近期學(xué)到的一個(gè)技能:相信別人已經(jīng)做過。很多問題的解決方案,這個(gè)世界上已經(jīng)存在過。一定有這個(gè)世界上某個(gè)團(tuán)隊(duì)某個(gè)人已經(jīng)思考的非常透徹,可能在書籍里,在歷史里,在故事里,或者藏在互聯(lián)網(wǎng)深處。如果找信息帶來的價(jià)值遠(yuǎn)大于自己思考實(shí)踐才能驗(yàn)證,那就先思考我應(yīng)該在哪里找到這個(gè)解決方案。By Nin19536@X
12 億人沒有護(hù)照、10 億人沒做過飛機(jī)、但有近 11 億人可以上網(wǎng)。大學(xué)文化水平人數(shù) 2.18 億,包含本科大專高職。理解這些數(shù)據(jù),可以避免很多無意義的爭(zhēng)吵。今天把上面數(shù)據(jù)都溯源了一下,都是官方發(fā)布的數(shù)據(jù)。截止 19 年底中國(guó)普通護(hù)照人數(shù)有 2 億左右,也就是 12 億人沒有護(hù)照。23 年 9 月民航局公布的粗略數(shù)據(jù)表示中國(guó)乘坐過飛機(jī)的人僅為 3 億多,也就是 10 億多人沒有坐過飛機(jī)。截止 23 年底,中國(guó)網(wǎng)民數(shù)量是 10.92 億。2020 年人口普查,大學(xué)文化程度的人口為 21836 萬(wàn)人,包含高職、大專、本科及以上。By 熊貓學(xué)經(jīng)濟(jì)@weibo
Google 發(fā)布生成式 AI 視頻模型 Veo: https://deepmind.google/technologies/veo/
[2]一覽主流 llm 性能、速度和價(jià)格的對(duì)比網(wǎng)站: http://artificialanalysis.ai
[3]國(guó)內(nèi)外 AI 大語(yǔ)言模型 API 價(jià)格對(duì)比: https://aigcrank.cn/llmprice/
[4]開源的 AI 導(dǎo)航站模板: https://github.com/6677-ai/tap4-ai-webui
[5]2024 GitHub 加速器:開源 AI 11 個(gè)項(xiàng)目: https://github.blog/2024-05-23-2024-github-accelerator-meet-the-11-projects-shaping-open-source-ai/
[6]一個(gè)幫助你思考的集合工具&框架:: https://untools.co/
[7]一個(gè)只做漸變色的 CSS 庫(kù): https://uigradients.com/#RainbowBlue
[8]一款專為英語(yǔ)學(xué)習(xí)打造的視頻播放器: https://github.com/solidSpoon/DashPlayer?tab=readme-ov-file
[9]Phi-3 CookBook: https://github.com/microsoft/Phi-3CookBook
[10]生成式人工智能常識(shí)科普?qǐng)D: https://cartography-of-generative-ai.net/
[11]LaTeX 入門與進(jìn)階: https://latex.lierhua.top/zh/
[12]前端開發(fā)的知識(shí)總結(jié): https://spacexcode.com/
[13]手把手帶你從頭實(shí)現(xiàn) LLaMa 3: https://github.com/naklecha/llama3-from-scratch
[14]什么是 GPT?工作原理動(dòng)畫展示: https://arthurchiao.art/blog/visual-intro-to-transformers-zh/
[15]OpenAI 前首席科學(xué)家分享 30 篇頂級(jí) AI 論文: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
[16]公開寫作的好處和堅(jiān)持不懈: https://www.usmacd.com/cn/public_writing/
知識(shí)管理王者,我的第二大腦,Obsidian配置指南
本地運(yùn)行“小型”大模型,配合筆記應(yīng)用王者Obsidian做知識(shí)管理
116頁(yè)P(yáng)DF小冊(cè)子:機(jī)器學(xué)習(xí)中的概率論、統(tǒng)計(jì)學(xué)、線性代數(shù)
可能是全網(wǎng)最全的速查表:Python Numpy Pandas Matplotlib 機(jī)器學(xué)習(xí) ChatGPT
