小目標(biāo)檢測、圖像分類、圖像識(shí)別等開源數(shù)據(jù)集匯總

極市導(dǎo)讀
?本文收集整理了多個(gè)小目標(biāo)檢測、圖像識(shí)別、圖像分類等方向的開源數(shù)據(jù)集,本次還有貓咪、斯坦福狗狗數(shù)據(jù)集以及3D MNIST數(shù)字識(shí)別等~?>>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺的最前沿
往期回顧:
15個(gè)目標(biāo)檢測開源數(shù)據(jù)集匯總
10個(gè)開源工業(yè)檢測數(shù)據(jù)集匯總
21個(gè)深度學(xué)習(xí)開源數(shù)據(jù)集分類匯總
寵物圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5TAgdC
一個(gè)包含 37 個(gè)類別的寵物數(shù)據(jù)集,每個(gè)類別大約有 200 張圖像。這些圖像在比例、姿勢(shì)和照明方面有很大的變化。所有圖像都有相關(guān)的品種、頭部 ROI 和像素級(jí)三元圖分割的地面實(shí)況注釋。

街景門牌號(hào) (SVHN) 數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5ExMWb
SVHN 是一個(gè)真實(shí)世界的圖像數(shù)據(jù)集,用于開發(fā)機(jī)器學(xué)習(xí)和對(duì)象識(shí)別算法,對(duì)數(shù)據(jù)預(yù)處理和格式化的要求最低。它可以被視為與MNIST風(fēng)格相似(例如,圖像是經(jīng)過裁剪的小數(shù)字),但包含一個(gè)數(shù)量級(jí)的更多標(biāo)記數(shù)據(jù)(超過 600,000 個(gè)數(shù)字圖像),并且來自一個(gè)更難、未解決的現(xiàn)實(shí)世界問題(識(shí)別自然場景圖像中的數(shù)字和數(shù)字)。SVHN 是從谷歌街景圖像中的門牌號(hào)獲得的。

3D MNIST 數(shù)字識(shí)別圖像數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/5SUfEd
該數(shù)據(jù)集的目的是提供一種簡單的方法來開始處理 3D 計(jì)算機(jī)視覺問題,例如 3D 形狀識(shí)別。

文檔影印和內(nèi)容數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/6nF67S
MediaTeam Oulu Document 數(shù)據(jù)集是一個(gè)文檔掃描圖像和文檔內(nèi)容數(shù)據(jù)集,包含 500篇 1975年之前的文檔信息。

貓咪數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5TAgbw
CAT 數(shù)據(jù)集包括超過 9,000 張貓圖像。對(duì)于每張圖像,貓的頭部都有九個(gè)點(diǎn)的注釋,眼睛兩個(gè),嘴巴一個(gè),耳朵六個(gè)。

CBCL 街道場景數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/5TAgeA
StreetScenes Challenge Framework 是用于對(duì)象檢測的圖像、注釋、軟件和性能測量的集合。每張圖像都是從馬薩諸塞州波士頓及其周邊地區(qū)的 DSC-F717 相機(jī)拍攝的。然后用圍繞 9 個(gè)對(duì)象類別的每個(gè)示例的多邊形手動(dòng)標(biāo)記每個(gè)圖像,包括 [汽車、行人、自行車、建筑物、樹木、天空、道路、人行道和商店]。這些圖像的標(biāo)記是在仔細(xì)檢查下完成的,以確保對(duì)象總是以相同的方式標(biāo)記,關(guān)于遮擋和其他常見的圖像變換。

小目標(biāo)檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/616t6R
從Internet(例如YouTube或Google)上的圖像/視頻收集的四個(gè)小物體數(shù)據(jù)集,包括4種類型的圖像,可用于小物體目標(biāo)檢測的研究。
數(shù)據(jù)集包含四類:
fly:飛行數(shù)據(jù)集,包含600個(gè)視頻幀,平均每幀86±39個(gè)物體(648×72 @ 30 fps)。32張圖像用于訓(xùn)練(1:6:187),50張圖像用于測試(301:6:600)。 honeybee:蜜蜂數(shù)據(jù)集,包含118張圖像,每張圖像平均有28±6個(gè)蜜蜂(640×480)。數(shù)據(jù)集被平均分配用于訓(xùn)練和測試集。僅前32張圖像用于訓(xùn)練。 seagull:海鷗數(shù)據(jù)集,包含三個(gè)高分辨率圖像(624×964),每個(gè)圖像平均有866±107個(gè)海鷗。第一張圖片用于訓(xùn)練,其余圖片用于測試。 fish:魚數(shù)據(jù)集,包含387幀視頻數(shù)據(jù),平均每幀56±9條魚(300×410 @ 30 fps)。32張圖像進(jìn)行訓(xùn)練(1:3:94),65張圖像進(jìn)行測試(193:3:387)。

斯坦福狗狗數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nF6kM
斯坦福狗數(shù)據(jù)集包含來自世界各地的 120 種狗的圖像。該數(shù)據(jù)集是使用 ImageNet 中的圖像和注釋構(gòu)建的,用于細(xì)粒度圖像分類任務(wù)。
該數(shù)據(jù)集的內(nèi)容:
類別數(shù):120 圖片數(shù)量:20,580 注釋:類標(biāo)簽、邊界框

標(biāo)注魚類數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/616t8X
野生圖像數(shù)據(jù)集中的標(biāo)記魚類由 NOAA Fisheries(國家海洋漁業(yè)服務(wù)局)提供,以鼓勵(lì)對(duì)無約束水下圖像的自動(dòng)圖像分析算法進(jìn)行開發(fā)、測試和性能評(píng)估。
該數(shù)據(jù)集包括魚類、無脊椎動(dòng)物和海床的圖像,這些圖像是使用部署在遠(yuǎn)程操作車輛 (ROV) 上的攝像系統(tǒng)收集的,用于漁業(yè)調(diào)查。

Stanford 汽車圖片數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/616wop
Cars 數(shù)據(jù)集包含 196 類汽車的 16,185 張圖像。數(shù)據(jù)分為 8,144 個(gè)訓(xùn)練圖像和 8,041 個(gè)測試圖像,其中每個(gè)類別大致按 50-50 分割。課程通常在品牌、型號(hào)、年份級(jí)別,例如 2012 Tesla Model S 或 2012 BMW M3 coupe。

公眾號(hào)后臺(tái)回復(fù)“數(shù)據(jù)集”獲取50+深度學(xué)習(xí)數(shù)據(jù)集下載~

#?CV技術(shù)社群邀請(qǐng)函?#

備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測-深圳)
即可申請(qǐng)加入極市目標(biāo)檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動(dòng)交流~

