CVPR 2022 | CNN自監(jiān)督預訓練新SOTA!上交等聯(lián)合提出HCSC:具有層級結構的圖像表征自學習新框架

極市導讀
?來自上海交通大學、Mila 魁北克人工智能研究所以及字節(jié)跳動的研究者提出了一種具有層級語義結構的自監(jiān)督表征學習框架,在 ImageNet 數(shù)據(jù)集上預訓練的模型在多個下游任務中取得了?SOTA 性能。?>>加入極市CV技術交流群,走在計算機視覺的最前沿

缺乏對上述層級語義結構的建模;
負樣本對的定義可能存在噪聲:隨機選擇的兩張圖像可能屬于相同類別。

論文地址: https://arxiv.org/abs/2202.00455
項目地址: https://github.com/gyfastas/HCSC
方法


選擇性實例對比學習
(其中s(·)是相似度函數(shù),在該研究中通過 cosine 相似度實現(xiàn));這一聚類中心代表了該圖像在這一層中所屬的類別。接下來,對于候選負樣本
,它被選擇的作為負樣本的概率為:

選擇性原型對比學習

,選擇性原型對比學習損失被定義為:

實驗結果









郭遠帆: 上海交通大學電子系二年級碩士生, 導師為徐奕副研究員. 他本科就讀于上海交通大學, 本科期間主要研究方向為計算機視覺、醫(yī)學影像處理, 在MICCAI、ISBI、Neurocomputing等會議與期刊中以第一作者/共同第一作者身份發(fā)表論文三篇. 碩士期間研究方向為計算機視覺、自監(jiān)督學習, 在字節(jié)跳動實習期間完成該研究工作。

徐明皓,Mila 魁北克人工智能研究所一年級博士生,導師是唐建教授,主要研究方向是圖表征學習、圖像表征學習和藥物發(fā)現(xiàn)。他本科和碩士就讀于上海交通大學,在上海交大計算機視覺實驗室進行科研工作,導師是倪冰冰教授,期間的主要研究方向為遷移學習和視覺計算。他在 NeurIPS、ICML、CVPR、ICCV、ECCV 等會議上以第一作者 / 共同第一作者身份發(fā)表論文七篇。
公眾號后臺回復“數(shù)據(jù)集”獲取50+深度學習數(shù)據(jù)集下載~

#?CV技術社群邀請函?#

備注:姓名-學校/公司-研究方向-城市(如:小極-北大-目標檢測-深圳)
即可申請加入極市目標檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術交流群
每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

