15個目標檢測開源數(shù)據(jù)集匯總

極市導讀
?目標檢測應當在這幾年當中研究數(shù)量以及應用范圍最廣的一個領域,也持續(xù)的受到很多深度學習者們的關注。本文收集和整理了15個目標檢測相關的開源數(shù)據(jù)集,希望能給大家的學習帶來幫助。?>>加入極市CV技術交流群,走在計算機視覺的最前沿
1.火焰和煙霧圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6fzn0f
該數(shù)據(jù)集由早期火災和煙霧的圖像數(shù)據(jù)集組成。數(shù)據(jù)集由在真實場景中使用手機拍攝的早期火災和煙霧圖像組成。大約有7000張圖像數(shù)據(jù)。圖像是在各種照明條件(室內(nèi)和室外場景)、天氣等條件下拍攝的。該數(shù)據(jù)集非常適合早期火災和煙霧探測。數(shù)據(jù)集可用于火災和煙霧識別、檢測、早期火災和煙霧、異常檢測等。數(shù)據(jù)集還包括典型的家庭場景,如垃圾焚燒、紙塑焚燒、田間作物焚燒、家庭烹飪等。本文僅含100張左右。

2.DOTA航拍圖像數(shù)據(jù)集
DOTA是用于航空圖像中目標檢測的大型數(shù)據(jù)集。它可以用于開發(fā)和評估航空圖像中的目標探測器。這些圖像是從不同的傳感器和平臺收集的。每個圖像的大小在800×800到20000×20000像素之間,包含顯示各種比例、方向和形狀的對象。DOTA圖像中的實例由航空圖像解釋專家通過任意(8 d.o.f.)四邊形進行注釋。

3. AITEX數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5DdJL1
該數(shù)據(jù)庫由七個不同織物結構的245張4096 x 256像素圖像組成。數(shù)據(jù)庫中有140個無缺陷圖像,每種類型的織物20個,除此之外,有105幅紡織行業(yè)中常見的不同類型的織物缺陷(12種缺陷)圖像。圖像的大尺寸允許用戶使用不同的窗口尺寸,從而增加了樣本數(shù)量。

4. T-LESS數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5wnucm
該數(shù)據(jù)集采集的目標為工業(yè)應用、紋理很少的目標,同時缺乏區(qū)別性的顏色,且目標具有對稱性和互相關性,數(shù)據(jù)集由三個同步的傳感器獲得,一個結構光傳感器,一個RGBD sensor,一個高分辨率RGBsensor,從每個傳感器分別獲得了3.9w訓練集和1w測試集,此外為每個目標創(chuàng)建了2個3D model,一個是CAD手工制作的另一個是半自動重建的。訓練集圖片的背景大多是黑色的,而測試集的圖片背景很多變,會包含不同光照、遮擋等等變換(之所以這么做作者說是為了使任務更具有挑戰(zhàn)性)。
同時作者解釋了本數(shù)據(jù)集的優(yōu)勢在于:1.大量跟工業(yè)相關的目標;2.訓練集都是在可控的環(huán)境下抓取的;3.測試集有大量變換的視角;4.圖片是由同步和校準的sensor抓取的;5.準確的6D pose標簽;6.每個目標有兩種3D模型;

5.H2O 行人交互檢測數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6fzmQf
H2O由V-COCO數(shù)據(jù)集中的10301張圖像組成,其中添加了3635張圖像,這些圖像主要包含人與人之間的互動。所有的H2O圖像都用一種新的動詞分類法進行了注釋,包括人與物和人與人之間的互動。該分類法由51個動詞組成,分為5類:
描述主語一般姿勢的動詞 與主語移動方式有關的動詞 與賓語互動的動詞 描述人與人之間互動的動詞 涉及力量或暴力的互動動詞

6.SpotGarbage垃圾識別數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5ZMmRG
圖像中的垃圾(GINI)數(shù)據(jù)集是SpotGarbage引入的一個數(shù)據(jù)集,包含2561張圖像,956張圖像包含垃圾,其余的是在各種視覺屬性方面與垃圾非常相似的非垃圾圖像。

7.NAO自然界對抗樣本數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5KJWJA
NAO包含7934張圖像和9943個對象,這些圖像未經(jīng)修改,代表了真實世界的場景,但會導致最先進的檢測模型以高置信度錯誤分類。與標準MSCOCO驗證集相比,在NAO上評估時,EfficientDet-D7的平均精度(mAP)下降了74.5%。

8.Labelme 圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5Sg9NX
Labelme Dataset 是用于目標識別的圖像數(shù)據(jù)集,涵蓋 1000 多個完全注釋和 2000 個部分注釋的圖像,其中部分注釋圖像可以被用于訓練標記算法 ,測試集擁有來自于世界不同地方拍攝的圖像,這可以保證圖片在續(xù)聯(lián)和測試之間會有較大的差異。該數(shù)據(jù)集由麻省理工學院 –計算機科學和人工智能實驗室于 2007 年發(fā)布,相關論文有《LabelMe: a database and web-based tool for image annotation》。

9.印度車輛數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6uxAIx
該數(shù)據(jù)集包括小眾印度車輛的圖像,如Autorikshaw、Tempo、卡車等。該數(shù)據(jù)集由用于分類和目標檢測的小眾印度車輛圖像組成。據(jù)觀察,這些小眾車輛(如autorickshaw、tempo、trucks等)上幾乎沒有可用的數(shù)據(jù)集。這些圖像是在白天、晚上和晚上的不同天氣條件下拍攝的。該數(shù)據(jù)集具有各種各樣的照明、距離、視點等變化。該數(shù)據(jù)集代表了一組非常具有挑戰(zhàn)性的利基類車輛圖像。該數(shù)據(jù)集可用于駕駛員輔助系統(tǒng)、自動駕駛等的圖像識別和目標檢測。

10.Seeing 3D chairs椅子檢測模型
數(shù)據(jù)集鏈接:http://m6z.cn/5DdK0v
椅子數(shù)據(jù)集包含大約1000個不同三維椅子模型的渲染圖像。

11.SUN09場景理解數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/60wX8r
SUN09數(shù)據(jù)集包含12000個帶注釋的圖像,其中包含200多個對象類別。它由自然、室內(nèi)和室外圖像組成。每個圖像平均包含7個不同的注釋對象,每個對象的平均占用率為圖像大小的5%。對象類別的頻率遵循冪律分布。發(fā)布者使用 397 個采樣良好的類別進行場景識別,并以此搭配最先進的算法建立新的性能界限。
該數(shù)據(jù)集由普林斯頓視覺與機器人實驗室于 2014 年發(fā)布,相關論文有《SUN Database: Large-scale Scene Recognition from Abbey to Zoo》、《SUN Database: Exploring a Large Collection of Scene Categories》。

12.Unsplash圖片檢索數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5wnuoM
使用迄今為止公開共享的全球最大的開放檢索信息數(shù)據(jù)集。Unsplash數(shù)據(jù)集由250000多名貢獻攝影師創(chuàng)建,并包含了數(shù)十億次照片搜索的信息和對應的照片信息。由于Unsplash數(shù)據(jù)集中包含廣泛的意圖和語義,它為研究和學習提供了新的機會。

13.HICO-DET人物交互檢測數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5DdK6D
HICO-DET是一個用于檢測圖像中人-物交互(HOI)的數(shù)據(jù)集。它包含47776幅圖像(列車組38118幅,測試組9658幅),600個HOI類別,由80個賓語類別和117個動詞類別構成。HICO-DET提供了超過150k個帶注釋的人類對象對。V-COCO提供了10346張圖像(2533張用于培訓,2867張用于驗證,4946張用于測試)和16199人的實例。

14.上??萍即髮W人群統(tǒng)計數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5Sgafn
上??萍紨?shù)據(jù)集是一個大規(guī)模的人群統(tǒng)計數(shù)據(jù)集。它由1198張帶注釋的群組圖像組成。數(shù)據(jù)集分為兩部分,A部分包含482張圖像,B部分包含716張圖像。A部分分為訓練和測試子集,分別由300和182張圖像組成。B部分分為400和316張圖像組成的序列和測試子集。群組圖像中的每個人都有一個靠近頭部中心的點進行注釋。總的來說,該數(shù)據(jù)集由33065名帶注釋的人組成。A部分的圖像是從互聯(lián)網(wǎng)上收集的,而B部分的圖像是在上海繁忙的街道上收集的。

15.生活垃圾數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6n5Adu
大約9000多張獨特的圖片。該數(shù)據(jù)集由印度國內(nèi)常見垃圾對象的圖像組成。圖像是在各種照明條件、天氣、室內(nèi)和室外條件下拍攝的。該數(shù)據(jù)集可用于制作垃圾/垃圾檢測模型、環(huán)保替代建議、碳足跡生成等。

公眾號后臺回復“數(shù)據(jù)集”獲取30+深度學習數(shù)據(jù)集下載~

#?CV技術社群邀請函?#

備注:姓名-學校/公司-研究方向-城市(如:小極-北大-目標檢測-深圳)
即可申請加入極市目標檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術交流群
每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

