【深度學(xué)習(xí)】小目標(biāo)檢測(cè)相關(guān)開(kāi)源數(shù)據(jù)集介紹及匯總
編輯丨極市平臺(tái)
導(dǎo)讀
?本文收集整理了一些開(kāi)源的小目標(biāo)檢測(cè)相關(guān)的數(shù)據(jù)集,總大小約為184GB,均附有下載鏈接。?
AI-TOD航空?qǐng)D像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5MjlYk
AI-TOD 在 28,036 張航拍圖像中包含 8 個(gè)類(lèi)別的 700,621 個(gè)對(duì)象實(shí)例。與現(xiàn)有航拍圖像中的目標(biāo)檢測(cè)數(shù)據(jù)集相比,AI-TOD 中目標(biāo)的平均大小約為 12.8 像素,遠(yuǎn)小于其他數(shù)據(jù)集。

iSAID航空?qǐng)D像大規(guī)模數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nUrYe
現(xiàn)有的 Earth Vision 數(shù)據(jù)集要么適用于語(yǔ)義分割,要么適用于對(duì)象檢測(cè)。iSAID 是第一個(gè)用于航空?qǐng)D像實(shí)例分割的基準(zhǔn)數(shù)據(jù)集。這個(gè)大規(guī)模和密集注釋的數(shù)據(jù)集包含 2,806 張高分辨率圖像的 15 個(gè)類(lèi)別的 655,451 個(gè)對(duì)象實(shí)例。iSAID 的顯著特征如下:(a) 大量具有高空間分辨率的圖像,(b) 十五個(gè)重要且常見(jiàn)的類(lèi)別,(c) 每個(gè)類(lèi)別的大量實(shí)例,(d) 每個(gè)類(lèi)別的大量標(biāo)記實(shí)例圖像,這可能有助于學(xué)習(xí)上下文信息,(e) 巨大的對(duì)象尺度變化,通常在同一圖像內(nèi)包含小、中和大對(duì)象,(f) 圖像內(nèi)具有不同方向的對(duì)象的不平衡和不均勻分布,描繪真實(shí)-生活空中條件,(g)幾個(gè)小尺寸物體,外觀模糊,只能通過(guò)上下文推理來(lái)解決,(h)由專業(yè)注釋者執(zhí)行的精確實(shí)例級(jí)注釋,由符合良好規(guī)范的專家注釋者交叉檢查和驗(yàn)證定義的指導(dǎo)方針。

TinyPerson數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6vqF3T
在 TinyPerson 中有 1610 個(gè)標(biāo)記圖像和 759 個(gè)未標(biāo)記圖像(兩者主要來(lái)自同一視頻集),總共有 72651 個(gè)注釋。

Deepscores 數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5xgYdY
DeepScores 數(shù)據(jù)集的目標(biāo)是推進(jìn)小物體識(shí)別的最新技術(shù),并將物體識(shí)別問(wèn)題置于場(chǎng)景理解的背景下。DeepScores 包含高質(zhì)量的樂(lè)譜圖像,分為 300 0 000 張書(shū)面音樂(lè),其中包含不同形狀和大小的符號(hào)。擁有近一億個(gè)小對(duì)象,這使得我們的數(shù)據(jù)集不僅獨(dú)一無(wú)二,而且是最大的公共數(shù)據(jù)集。DeepScores 帶有用于對(duì)象分類(lèi)、檢測(cè)和語(yǔ)義分割的基本事實(shí)。因此,DeepScores 總體上對(duì)計(jì)算機(jī)視覺(jué)提出了相關(guān)挑戰(zhàn),超出了光學(xué)音樂(lè)識(shí)別 (OMR) 研究的范圍。

密集行人檢測(cè)數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nUs1C
WiderPerson 數(shù)據(jù)集是野外行人檢測(cè)基準(zhǔn)數(shù)據(jù)集,其圖像選自廣泛的場(chǎng)景,不再局限于交通場(chǎng)景。我們選擇了 13,382 張圖像并標(biāo)記了大約 400K 帶有各種遮擋的注釋。我們隨機(jī)選擇 8000/1000/4382 圖像作為訓(xùn)練、驗(yàn)證和測(cè)試子集。與 CityPersons 和 WIDER FACE 數(shù)據(jù)集類(lèi)似,我們不發(fā)布測(cè)試圖像的邊界框基本事實(shí)。用戶需要提交最終的預(yù)測(cè)文件,我們將進(jìn)行評(píng)估。

加州理工學(xué)院行人檢測(cè)數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5N3Yk7
加州理工學(xué)院行人數(shù)據(jù)集由大約 10 小時(shí)的 640x480 30Hz 視頻組成,該視頻取自在城市環(huán)境中通過(guò)常規(guī)交通行駛的車(chē)輛。注釋了大約 250,000 幀(在 137 個(gè)大約分鐘長(zhǎng)的片段中),總共 350,000 個(gè)邊界框和 2300 個(gè)獨(dú)特的行人。注釋包括邊界框和詳細(xì)的遮擋標(biāo)簽之間的時(shí)間對(duì)應(yīng)關(guān)系。

NWPU VHR-10衛(wèi)星圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5UAbEW
NWPU VHR-10 Dataset 是一個(gè)用于空間物體檢測(cè)的 10 級(jí)地理遙感數(shù)據(jù)集,其擁有 650 張包含目標(biāo)的圖像和 150 張背景圖像,共計(jì) 800 張,目標(biāo)種類(lèi)包括飛機(jī)、艦船、油罐、棒球場(chǎng)、網(wǎng)球場(chǎng)、籃球場(chǎng)、田徑場(chǎng)、港口、橋梁和汽車(chē)共計(jì) 10 個(gè)類(lèi)別。
該數(shù)據(jù)集由西北工業(yè)大學(xué)于 2014 年發(fā)布,相關(guān)論文有《Multi-class geospatial object detection and geographic imageclassification based on collection of part detectors》、《A survey on objectdetection in optical remote sensing images》和《Learningrotation-invariant convolutional neural networks for object detection in VHRoptical remote sensing images》。

Inria 航空影像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nUs6s
Inria 航空影像標(biāo)注解決了遙感中的一個(gè)核心主題:航空影像的自動(dòng)像素級(jí)標(biāo)注(論文鏈接)。
數(shù)據(jù)集特點(diǎn):
覆蓋面積 810 平方公里(405 平方公里用于訓(xùn)練,405 平方公里用于測(cè)試) 空間分辨率為 0.3 m 的航空正射校正彩色圖像 兩個(gè)語(yǔ)義類(lèi)的地面實(shí)況數(shù)據(jù):構(gòu)建和非構(gòu)建(僅針對(duì)訓(xùn)練子集公開(kāi)披露) 這些圖像涵蓋了不同的城市住區(qū),從人口稠密的地區(qū)(例如,舊金山的金融區(qū))到高山城鎮(zhèn)(例如,奧地利蒂羅爾的 Lienz)。

RSOD遙感圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5EN96H
它是一個(gè)開(kāi)放的遙感圖像目標(biāo)檢測(cè)數(shù)據(jù)集。數(shù)據(jù)集包括飛機(jī)、油箱、游樂(lè)場(chǎng)和立交橋。此數(shù)據(jù)集的格式為PASCAL VOC。數(shù)據(jù)集包括4個(gè)文件,每個(gè)文件用于一種對(duì)象。
飛機(jī)數(shù)據(jù)集,446張圖片中有4993架飛機(jī)。
操場(chǎng),189張圖片中的191個(gè)操場(chǎng)。
天橋,176張圖片中的180座天橋。
油箱,165張圖片中的1586個(gè)油箱。

往期精彩回顧
適合初學(xué)者入門(mén)人工智能的路線及資料下載 (圖文+視頻)機(jī)器學(xué)習(xí)入門(mén)系列下載 機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印 《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯
機(jī)器學(xué)習(xí)交流qq群955171419,加入微信群請(qǐng)掃碼
