極市平臺
1獲贊0關(guān)注1粉絲
實踐教程 | 輕松入門模型轉(zhuǎn)換和可視化
↑ 點擊藍字 關(guān)注極市平臺作者 | 愛做菜的煉丹師來源 | CV研習(xí)社編輯 | 極市平臺極市導(dǎo)讀 本文給大家介紹一個模型轉(zhuǎn)換格式ONNX和可視化工具Netron。ONNX是微軟設(shè)計的一種多平臺的通用文件格式,幫助算法人員進行模型部署和框架之間相互轉(zhuǎn)換。而Netron是一款老牌的輕
極市平臺
0
英偉達也對 Mamba下手了 ,視覺 Transformer 與 Mamba 的完美融合 !
↑ 點擊藍字 關(guān)注極市平臺作者丨AI視界引擎來源丨AI視界引擎編輯丨極市平臺極市導(dǎo)讀 在ImageNet-1K數(shù)據(jù)集上的圖像分類中,MambaVision模型變體在Top-1準確率和圖像吞吐量方面達到了新的最先進(SOTA)性能。在MS COCO和ADE20K數(shù)據(jù)集上的下游任務(wù),
極市平臺
0
MoE也有Scaling Law,「百萬專家」利用率近100%!DeepMind華人挑戰(zhàn)MoE極限
↑ 點擊藍字 關(guān)注極市平臺來源丨新智元極市導(dǎo)讀 MoE已然成為AI界的主流架構(gòu),不論是開源Grok,還是閉源GPT-4,皆是其擁躉。然而,這些模型的專家,最大數(shù)量僅有32個。最近,谷歌DeepMind提出了全新的策略PEER,可將MoE擴展到百萬個專家,還不會增加計算成本。>
極市平臺
0
近一年,多模態(tài)視覺&語言大模型架構(gòu)演進匯總梳理
↑ 點擊藍字 關(guān)注極市平臺作者丨Dreamweaver來源丨吃果凍不吐果凍皮編輯丨極市平臺極市導(dǎo)讀 本文回顧了多模態(tài)LLM (視覺-語言模型) 近一年來的模型架構(gòu)演進,對其中有代表性的工作進行了精煉總結(jié),截止2024.06。 >>加入極市CV技術(shù)交流群,走在
極市平臺
0
CV什么時候能迎來ChatGPT時刻?
↑ 點擊藍字 關(guān)注極市平臺作者丨rumor來源丨李rumor編輯丨極市平臺極市導(dǎo)讀 一統(tǒng)CV的想法什么時候回成真?一起來看看三篇在統(tǒng)一模型上的嘗試。 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿卷友們好,我是rumor。最近看了幾篇CV的工作,肉眼就感
極市平臺
1
ECCV 2024|騰訊優(yōu)圖實驗室14篇論文入選,含工業(yè)缺陷異常檢測、圖文引導(dǎo)圖像編輯、多模態(tài)標簽等研究方向
↑ 點擊藍字 關(guān)注極市平臺來源丨騰訊優(yōu)圖實驗室編輯丨極市平臺極市導(dǎo)讀 今年,騰訊優(yōu)圖實驗室共有14篇論文被錄用,內(nèi)容涵蓋工業(yè)缺陷異常檢測、圖文引導(dǎo)圖像編輯、多模態(tài)標簽等研究方向,展示了騰訊優(yōu)圖實驗室在人工智能領(lǐng)域的技術(shù)能力和研究成果。 >>加入極市CV技術(shù)交
極市平臺
0
真實雨景/圖像去雨相關(guān)開源數(shù)據(jù)集資源匯總
↑ 點擊藍字 關(guān)注極市平臺編輯丨極市平臺真實雨景數(shù)據(jù)集下載鏈接:https://www.cvmart.net/dataSets/detail/1123一個由~29.5K的雨/無雨影像對組成的大型數(shù)據(jù)集,涵蓋了廣泛的自然雨景。合成降雨數(shù)據(jù)集下載鏈接:https://www.cvmart.ne
極市平臺
0
6700萬參數(shù)比肩萬億巨獸GPT-4!微軟MIT等聯(lián)手破解Transformer推理密碼
↑ 點擊藍字 關(guān)注極市平臺來源丨新智元極市導(dǎo)讀 來自微軟、MIT等機構(gòu)的學(xué)者提出了一種創(chuàng)新的訓(xùn)練范式,攻破了大模型的推理缺陷。他們通過因果模型構(gòu)建數(shù)據(jù)集,直接教模型學(xué)習(xí)公理,結(jié)果只有67M參數(shù)的微型Transformer竟能媲美GPT-4的推理能力。>>加入極市CV技
極市平臺
0
Mamba真比Transformer更優(yōu)嗎?Mamba原作者:兩個都要!混合架構(gòu)才是最優(yōu)解
↑ 點擊藍字 關(guān)注極市平臺作者丨新智元來源丨新智元編輯丨極市平臺極市導(dǎo)讀 Mamba模型由于匹敵Transformer的巨大潛力,在推出半年多的時間內(nèi)引起了巨大關(guān)注。但在大規(guī)模預(yù)訓(xùn)練的場景下,這兩個架構(gòu)還未有「一較高低」的機會。最近,英偉達、CMU、普林斯頓等機構(gòu)聯(lián)合發(fā)表的實證研
極市平臺
0
實踐教程|無需nms,onnxruntime20行代碼玩轉(zhuǎn)RT-DETR
↑ 點擊藍字 關(guān)注極市平臺作者丨陳er來源丨GiantPandaCV編輯丨極市平臺極市導(dǎo)讀 本文采用RT-DETR兩種不同風(fēng)格的onnx格式,使用onnxruntime20行代碼,無需nms操作即可實現(xiàn)簡易部署推理。>>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿【
極市平臺
0
OpenAI Lilian Weng萬字長文解讀LLM幻覺:從理解到克服
↑ 點擊藍字 關(guān)注極市平臺來源丨機器之心極市導(dǎo)讀 Lilian Weng 出品,必是精品。 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿人會有幻覺,大型語言模型也會有幻覺。近日,OpenAI 安全系統(tǒng)團隊負責(zé)人 Lilian Weng 更新了博客,介紹
極市平臺
0
用ViT取代Encoder!VIM:使用 ViT 改進的 VQGAN 進行矢量量化圖像生成(ICLR 2022)
↑ 點擊藍字 關(guān)注極市平臺作者丨科技猛獸編輯丨極市平臺極市導(dǎo)讀 本文探索了在 VQGAN 里面,把圖像的 Encoder 換成 ViT。本文改進之后的 ViT-VQGAN 進一步改進了矢量量化圖像建模的任務(wù),包括無條件圖像生成、class-conditioned 圖像生成和無監(jiān)督
極市平臺
0
CVPR'24 Highlight|一個框架搞定人物動作生成,精細到手部運動
↑ 點擊藍字 關(guān)注極市平臺作者丨機器之心來源丨機器之心編輯丨極市平臺極市導(dǎo)讀 本文提出了一種融合場景和語義信息的動作生成框架,由自回歸的擴散模型作為驅(qū)動,能夠在給定動作類別和路徑點的條件下,生成符合場景約束的人物動作。 >>加入極市CV技術(shù)交流群,走在計算機
極市平臺
0
Mamba一作再祭神作,H100利用率飆至75%!FlashAttention三代性能翻倍,比標準注意力快16倍
↑ 點擊藍字 關(guān)注極市平臺作者丨新智元來源丨新智元編輯丨極市平臺極市導(dǎo)讀 時隔一年,F(xiàn)lashAttention又推出了第三代更新,專門針對H100 GPU的新特性進行優(yōu)化,在之前的基礎(chǔ)上又實現(xiàn)了1.5~2倍的速度提升。>>加入極市CV技術(shù)交流群,走在計算機視覺的最前
極市平臺
1
五年后的今天,訓(xùn)練GPT-2只需不到700刀、24小時,Karpathy又整新活
↑ 點擊藍字 關(guān)注極市平臺來源丨機器之心極市導(dǎo)讀 論老黃賣鏟子的技術(shù)含量。 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿2019 年 2 月,OpenAI 發(fā)布了 GPT-2,因為在文本生成上的優(yōu)異表現(xiàn),以及對于預(yù)訓(xùn)練 Transformer 架構(gòu)的充
極市平臺
0
ICLR 2024|微軟提出視覺新主干EfficientMod:融合卷積和注意力機制
↑ 點擊藍字 關(guān)注極市平臺作者丨VincentLee來源丨曉飛的算法工程筆記編輯丨極市平臺極市導(dǎo)讀 Efficient Modulation (EfficientMod) 融合了卷積和注意力機制的有利特性,同時提取空間上下文并對輸入特征進行投影,然后使用簡單的逐元素乘法
極市平臺
0
大模型最強架構(gòu)TTT問世!斯坦福UCSD等5年磨一劍, 一夜推翻Transformer
↑ 點擊藍字 關(guān)注極市平臺作者丨新智元來源丨新智元編輯丨極市平臺極市導(dǎo)讀 超越Transformer和Mamba的新架構(gòu)誕生了。斯坦福UCSD等機構(gòu)研究者提出的TTT方法,直接替代了注意力機制,語言模型方法從此或?qū)氐赘淖儭?gt;>加入極市CV技術(shù)交流群,走在計算機視覺的
極市平臺
0
ECCV 2024|無視遮擋,跟蹤一切目標!DINO-Tracker成就單目物體追蹤里程碑
↑ 點擊藍字 關(guān)注極市平臺作者丨阿豹來源丨深藍AI編輯丨極市平臺極市導(dǎo)讀 本文的DINO-tracker框架能夠無視遮擋,實現(xiàn)對物體的長距離跟蹤,突破了之前技術(shù)的局限,入選了ECCV24。 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿論文地址:http
極市平臺
0
CVPR世界第二僅次Nature!谷歌2024學(xué)術(shù)指標出爐,NeurIPS、ICLR躋身前十
↑ 點擊藍字 關(guān)注極市平臺來源丨新智元極市導(dǎo)讀 一年一度谷歌學(xué)術(shù)指標公布了!Nature年年霸榜,而今年與以往不同的是,國際學(xué)術(shù)頂會的排名大幅提升,CVPR位居第二,超越Science僅次于Nature。另外,TOP 20中,共有五大頂會入選,被引最高論文與大模型時代下前沿技術(shù),
極市平臺
0
月之暗面kimi底層推理系統(tǒng)方案揭秘(二)
↑ 點擊藍字 關(guān)注極市平臺作者丨ZHANG Mingxing來源丨包包算法筆記編輯丨極市平臺極市導(dǎo)讀 深入探討了月之暗面的底層推理平臺—Mooncake。文章基于作者在知乎上的討論和分享,特別是清華大學(xué)助理教授zhangmingxing的觀點,詳細介紹了Mooncake的分離式架
極市平臺
0
CNN一定比Transformer差嗎?LeCun新作:神經(jīng)網(wǎng)絡(luò)在實踐中的靈活性到底有多大?
↑ 點擊藍字 關(guān)注極市平臺作者丨新智元來源丨新智元編輯丨極市平臺極市導(dǎo)讀 神經(jīng)網(wǎng)絡(luò)擬合數(shù)據(jù)的能力受哪些因素影響?CNN一定比Transformer差嗎?ReLU和SGD還有哪些神奇的作用?近日,LeCun參與的一項工作向我們展示了神經(jīng)網(wǎng)絡(luò)在實踐中的靈活性。>>加入極市
極市平臺
0
李彥宏:開源模型是智商稅!傅盛:付費的閉源大模型才是!
↑ 點擊藍字 關(guān)注極市平臺作者丨付奶茶來源丨夕小瑤科技說編輯丨極市平臺極市導(dǎo)讀 開源大模型和閉源大模型究竟誰才是“智商稅? >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿最近幾天,圈里討論最熱鬧的、打開手機社媒平臺給我推薦最兇的,就是WAIC 2024了
極市平臺
0
參數(shù)少60%還不掉點!浙大EfficientFuser:端到端如何高效融合?
↑ 點擊藍字 關(guān)注極市平臺作者丨Yipin Guo等來源丨自動駕駛之心編輯丨極市平臺極市導(dǎo)讀 浙江大學(xué)最新的工作EfficientFuser,與SOTA的輕量級方法相比,EfficientFuser僅使用了37.6%的參數(shù)和8.7%的計算量,就能取得相同性能! >
極市平臺
0
多模態(tài)模型(VLM)部署方法拋磚引玉
↑ 點擊藍字 關(guān)注極市平臺作者丨oldpan來源丨oldpan博客編輯丨極市平臺極市導(dǎo)讀 文章詳細討論了幾種多模態(tài)模型,如LLaVA、InternLM-XComposer2、QWen-VL等,并解釋了它們的架構(gòu)和訓(xùn)練流程。以及介紹了幾種多模態(tài)模型的部署框架,包括TensorRT-
極市平臺
0
阿里開源新型圖像個性化框架MS-Diffusion,無需微調(diào)一鍵參考多個主題
↑ 點擊藍字 關(guān)注極市平臺作者丨王謝睿、付思銘 、黃啟涵、 何旺貴、姜浩編輯丨極市平臺極市導(dǎo)讀 用戶通過少量主題參考圖,無需微調(diào)即可一鍵生成與多種文本概念結(jié)合的新圖片。該項目已開源。 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿圖像個性化是當今的熱門研
極市平臺
0
局部歸納偏置真的有必要嗎?探索 Transformer 新范式:一個像素就是一個 token!
↑ 點擊藍字 關(guān)注極市平臺作者丨科技猛獸編輯丨極市平臺極市導(dǎo)讀 原始 Transformer 中可以直接將每個單獨的像素 (pixel) 視為 token。 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿本文目錄1 一個像素就是一個 token!探索 T
極市平臺
0
語言≠思維,大模型學(xué)不了推理:一篇Nature讓AI社區(qū)炸鍋了
↑ 點擊藍字 關(guān)注極市平臺作者丨機器之心來源丨機器之心極市導(dǎo)讀 方向完全搞錯了? >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿大語言模型(LLM)為什么空間智能不足,GPT-4 為什么用語言以外的數(shù)據(jù)訓(xùn)練,就能變得更聰明?現(xiàn)在這些問題有 「標準答案」了
極市平臺
0
CVPR 24|ETH Zurich等團隊:重新定義小樣本3D分割任務(wù),新基準開啟廣闊提升潛力!
↑ 點擊藍字 關(guān)注極市平臺作者丨機器之心來源丨機器之心編輯丨極市平臺極市導(dǎo)讀 導(dǎo)讀 >>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿正文該文章的第一作者安照崇,目前在哥本哈根大學(xué)攻讀博士學(xué)位,導(dǎo)師為Serge Belongie。他碩士畢業(yè)于蘇黎世聯(lián)邦理工學(xué)
極市平臺
0
