<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          深度學習經(jīng)典收藏 | 開源數(shù)據(jù)集大匯總

          共 8094字,需瀏覽 17分鐘

           ·

          2021-08-04 19:36

          點擊上方機器學習與生成對抗網(wǎng)絡”,關注星標

          獲取有趣、好玩的前沿干貨!

          來源:Graviti,方向:開源數(shù)據(jù)集   編輯 AI算法與圖像處理


          本文整理了國內外經(jīng)典的開源數(shù)據(jù),包含了目標檢測、自動駕駛、人臉識別、自然語言處理、本檢測、醫(yī)療等方向,具體如下。

          一、自動駕駛領域數(shù)據(jù)集

          1. KITTI數(shù)據(jù)集

          KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯(lián)合創(chuàng)辦,是自動駕駛場景下的計算機視覺算法評測數(shù)據(jù)集。該數(shù)據(jù)集用于評測立體圖像(stereo),光流(optical flow),視覺測距(visual odometry),3D物體檢測(object detection)和3D跟蹤(tracking)等計算機視覺技術在車載環(huán)境下的性能。

          Kitti 標注情況,截取自Graviti數(shù)據(jù)可視化功能

          KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多達15輛車和30個行人,還有各種程度的遮擋與截斷。整個數(shù)據(jù)集由389對立體圖像和光流圖,39.2 km視覺測距序列以及超過200k 3D標注物體的圖像組成 ,以10Hz的頻率采樣及同步??傮w上看,原始數(shù)據(jù)集被分類為‘Road’, ‘City’, ‘Residential’, ‘Campus’ 和‘Person’。對于3D物體檢測,label細分為car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc組成。 

          數(shù)據(jù)集大小:312MB~440GBGraviti官網(wǎng)搜索「KITTI」查看更多相關數(shù)據(jù)集

          獲取地址:https://www.graviti.cn/open-datasets/

          2.CityScapes數(shù)據(jù)集

          CityScapes是由奔馳自動駕駛實驗室、馬克思·普朗克研究所、達姆施塔特工業(yè)大學聯(lián)合發(fā)布的公開數(shù)據(jù)集,專注于對城市街景的語義理解。該數(shù)據(jù)集包含50個不同的城市,在不同的季節(jié)和天氣條件下的街景中記錄的各種立體視頻序列,Cityscapes數(shù)據(jù)集共有fine和coarse兩套評測標準,前者提供5000張精細標注的圖像,后者提供5000張精細標注外加20000張粗糙標注的圖像。

          數(shù)據(jù)集大小:74.15GB

          獲取地址:https://gas.graviti.cn/dataset/graviti-open-dataset/CityScapes

          3.BDD100K數(shù)據(jù)集

          2018年5月伯克利大學AI實驗室(BAIR)發(fā)布了公開駕駛數(shù)據(jù)集BDD100K,同時設計了一個圖片標注系統(tǒng)。BDD100K 數(shù)據(jù)集包含10萬段高清視頻,每個視頻約40秒\720p\30 fps 。每個視頻的第10秒對關鍵幀進行采樣,得到10萬張圖片(圖片尺寸:1280*720 ),并進行標注。10萬張圖片中,包含了不同天氣、場景、時間的圖片,而且高清、模糊的圖片都有,具有規(guī)模大,多樣化的特點。

          數(shù)據(jù)集大小:6.42GB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/BDD100K

          4.nuScenes數(shù)據(jù)集

          nuScenes數(shù)據(jù)集是由Motional(以前為nuTonomy)的團隊開發(fā)的用于自動駕駛的公共大型數(shù)據(jù)集。Motional致力于實現(xiàn)安全,可靠和可達的無人駕駛環(huán)境。通過向公眾發(fā)布部分數(shù)據(jù),Motional旨在推進計算機視覺和自動駕駛的研究。

          nuScenes數(shù)據(jù)集在波士頓和新加坡這兩個城市收集了1000個駕駛場景,這兩個城市交通繁忙,駕駛狀況極具挑戰(zhàn)性。nuScenes手動選擇20秒長的場景,以顯示各種駕駛操作,交通狀況和意外行為。nuScenes收集了不同大洲的數(shù)據(jù),能讓我們進一步研究計算機視覺算法在不同位置,天氣狀況,車輛類型,植被,道路標記以及左右手交通之間的通用性。nuScenes完整的數(shù)據(jù)集包括約40萬個關鍵幀中的140萬個攝像機圖像,39萬個LIDAR掃描數(shù)據(jù),1.4 M個RADAR掃描數(shù)據(jù)和1.4萬個對象邊界框。其擴展包nuScenes-lidarseg的40,000個點云和1000個場景(用于訓練和驗證的850個場景以及用于測試的150個場景)中包含了14億個標注點。

          數(shù)據(jù)集大小:547.98GB

          獲取地址:https://gas.graviti.cn/dataset/motional/nuScenes

          二、目標檢測數(shù)據(jù)集

          圖像語義分割是計算機視覺領域的經(jīng)典任務之一,目的是將圖像分割成幾組具有某種特定語義含義的像素區(qū)域,并識別出每個區(qū)域的類別,最終獲得具有像素語義標注的圖像。下面為大家介紹幾個常見的語義分割數(shù)據(jù)集。

          1.COCO數(shù)據(jù)集

          COCO的全稱是Common Objects in Context,是微軟團隊提供的用來進行目標識別、圖像分割等任務的數(shù)據(jù)集。

          有如下幾個特點:目標分割、上下文識別、超像素分割、330K圖像(已標記> 200K)、150萬個對象實例、80個對象類別、91個物品類別、每個圖像5個字幕、250,000包含關鍵點的人。

          COCO數(shù)據(jù)集支持目標檢測、實例分割、全景分割、Stuff Segmentation、關鍵點檢測、看圖說話等任務類型。圖片格式均為JPG格式,其中目標檢測,實例分割任務對應的圖像類別為80類;Stuff Segmentation,全景分割任務新增圖像類別53類。

          數(shù)據(jù)大小:83.39GB

          獲取地址:https://gas.graviti.cn/dataset/shannont/COCO

          2.PASCAL VOC數(shù)據(jù)集

          PASCAL VOC挑戰(zhàn)賽 (The PASCAL Visual Object Classes )是一個世界級的計算機視覺挑戰(zhàn)賽, 很多優(yōu)秀的計算機視覺模型比如分類,定位,檢測,分割,動作識別等模型都是基于PASCAL VOC挑戰(zhàn)賽及其數(shù)據(jù)集上推出的,尤其是一些目標檢測模型(比如大名鼎鼎的R CNN系列,以及后面的YOLO,SSD等)。

          從2005年到2012年,VOC挑戰(zhàn)賽每年組織一次。每年的內容都有所不同,從最開始的分類,到后面逐漸增加目標分類、目標檢測、目標分割、人體布局、動作識別等內容,數(shù)據(jù)集的容量以及種類也在不斷的增加和改善。

          對于現(xiàn)在的研究者來說比較重要的兩個年份的數(shù)據(jù)集是 PASCAL VOC 2007 與 PASCAL VOC 2012。PASCAL VOC 2012數(shù)據(jù)集是在2007年的基礎上增加而來的,包含4個大類和20個小類。

          Pascal VOC2012數(shù)據(jù)大小:1.86GB
          獲取地址:https://gas.graviti.cn/dataset/data-decorators/VOC2012Detection

          3.OpenImage數(shù)據(jù)集

          Open Image是一個由Google發(fā)布的包含約900萬張圖像URL的數(shù)據(jù)集,里面的圖片通過標簽注釋被分為6000多類。該數(shù)據(jù)集中的標簽要比ImageNet(1000類)包含更真實生活的實體存在,它足夠讓我們從頭開始訓練深度神經(jīng)網(wǎng)絡。

          數(shù)據(jù)大小:671.41GB

          獲取地址:https://gas.graviti.cn/dataset/shannont/OpenImages_v6

          三、人臉識別類數(shù)據(jù)集

          1.YouTube Face DB數(shù)據(jù)集

          YouTube Face是一個人臉視頻數(shù)據(jù)庫,旨在研究視頻中,非受限情況下的人臉識別的問題。數(shù)據(jù)集包含1,595個不同人的3,425個視頻,都是從YouTube下載的。每個主題平均包含2.15個視頻。視頻剪輯持續(xù)時間最短為48幀,最長為6,070幀,平均長度為181.3幀。

          數(shù)據(jù)集大小:671.41GB

          獲取地址:https://gas.graviti.cn/dataset/shannont/YouTubeFacesDB

          2.CelebA數(shù)據(jù)集

          CelebFaces屬性數(shù)據(jù)集(CelebA)是一個大規(guī)模的面部屬性數(shù)據(jù)集,其中包含超過20萬名人圖像,每個圖像都有40個屬性注釋。該數(shù)據(jù)集中的圖像涵蓋了較大的姿勢變化和背景雜波。

          CelebA具有多種多樣,數(shù)量眾多且注釋豐富的特點,包括:

          • 10,177個不同的ID
          • 202,599張人臉圖像
          • 該數(shù)據(jù)集可用作以下計算機視覺任務的訓練和測試集:面部屬性識別,面部檢測,五官(或面部部分)定位以及面部編輯和合成。

          數(shù)據(jù)集大小:9.55 GB

          獲取地址:https://gas.graviti.cn/dataset/shannont/CelebA

          3.IMDB-WIKI數(shù)據(jù)集

          IMDB-WIKI人臉數(shù)據(jù)庫是有IMDB數(shù)據(jù)庫和Wikipedia數(shù)據(jù)庫組成,其中IMDB人臉數(shù)據(jù)庫包含了460,723張人臉圖片,而Wikipedia人臉數(shù)據(jù)庫包含了62,328張人臉數(shù)據(jù)庫,總共523,051張人臉數(shù)據(jù)庫,IMDB-WIKI人臉數(shù)據(jù)庫中的每張圖片都被標注了人的年齡和性別,對于年齡識別和性別識別的研究有著重要的意義。

          數(shù)據(jù)集大小:276.23GB

          獲取地址:https://gas.graviti.cn/dataset/hello-dataset/IMDbWiki

          4.LFW數(shù)據(jù)集

          LFW (Labeled Faces in the Wild) 人臉數(shù)據(jù)庫是由美國馬薩諸塞州立大學阿默斯特分校計算機視覺實驗室整理完成的數(shù)據(jù)庫,主要用來研究非受限情況下的人臉識別問題。是目前人臉識別的常用測試集,其中提供的人臉圖片均來源于生活中的自然場景,因此識別難度會增大,尤其由于多姿態(tài)、光照、表情、年齡、遮擋等因素影響導致即使同一人的照片差別也很大。并且有些照片中可能不止一個人臉出現(xiàn),對這些多人臉圖像僅選擇中心的人臉作為目標,其他區(qū)域的視為背景干擾。

          LFW數(shù)據(jù)集主要是從互聯(lián)網(wǎng)上搜集圖像,共有13233張人臉圖像,每張圖像均給出對應的人名,共有5749人,且絕大部分人僅有一張圖片,其中有1680 人包含兩個以上的人臉圖像。每張圖片的尺寸為250X250,絕大部分為彩色圖像,也存在少許黑白人臉圖片。

          數(shù)據(jù)集大小:1.29GB

          獲取地址:https://gas.graviti.cn/dataset/graviti-open-dataset/LFW

          四、人體姿態(tài)估計類數(shù)據(jù)集

          1.LSP數(shù)據(jù)集

          Leeds Sports Pose 是由利茲大學計算機學院于 2010 年發(fā)布的一個體育姿勢數(shù)據(jù)集。被分為競技、羽毛球、棒球、體操、跑酷、足球、排球和網(wǎng)球幾類,共包含約 2000 個姿勢注釋,圖像均來自于 Flickr 。通過對圖像進行縮放,聚焦的人物長度約 150 像素,并且每個圖像都帶有14個關節(jié)位置的注釋,其左側和右側關節(jié)始終“以本人的視角”進行標記。

          數(shù)據(jù)集標注情況,截取自Graviti數(shù)據(jù)可視化功能

          數(shù)據(jù)大小:33.78MB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/LeedsSportsPose

          2.FLIC數(shù)據(jù)集

          FLIC(Frames Labeled In Cinema)數(shù)據(jù)集由賓夕法尼亞大學-工程與應用科學學院 GRASP 實驗室于 2013 年發(fā)布。該數(shù)據(jù)集是從好萊塢流行電影中自動收集的圖像數(shù)據(jù)集,包含5003張圖像。這些圖像截取了30部電影的整十倍的幀數(shù),通過最先進的人物檢測器獲得。每個圖像由五個人標注10個上半身關節(jié)。此外,圖像中擁有 5 個中值標記以保證異常值注釋具有魯棒性。最后,如果該人被遮擋或嚴重不正面,將被手動刪除。

          數(shù)據(jù)集大小:1.38GB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/FLIC

          3.MPII Human Pose數(shù)據(jù)集

          MPII Human Pose人體姿勢數(shù)據(jù)集是人體姿勢預估的一個 benchmark。數(shù)據(jù)集中包含約25000張標注圖像,標注人數(shù)超過 4萬人,涵蓋了410中人類活動。這些圖像是從 YouTube video 中抽取出來的。此外,在測試集中還收錄了身體部位遮擋、3D 軀干、頭部方向的標注。

          數(shù)據(jù)集大小:11.26GB

          獲取地址:https://gas.graviti.cn/dataset/shannont/MPIIHumanPose

          五、文本檢測類數(shù)據(jù)集

          1.MNIST數(shù)據(jù)集

          MNIST是深度學習領域的“Hello World!”。MNIST是一個手寫數(shù)字數(shù)據(jù)庫,有60000個訓練樣本集和10000個測試樣本集,每個樣本圖像的寬高為28*28。此數(shù)據(jù)集是以二進制存儲的,不能直接以圖像格式查看,不過很容易找到將其轉換成圖像格式的工具。

          數(shù)據(jù)集大小:12MB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/MNIST

          2.SVHN數(shù)據(jù)集

          SVHN是從Google街景圖像中的門牌號獲得的一個來自現(xiàn)實世界的圖像數(shù)據(jù)集,用于開發(fā)機器學習和對象識別算法,同時對數(shù)據(jù)預處理和格式化的要求最低。它的風格與MNIST相似,但有更多數(shù)量級的標記數(shù)據(jù)(超過600,000位數(shù)字圖像),并且希望解決一個更加困難,難以解決的現(xiàn)實問題(識別自然場景圖像中的數(shù)字)。

          數(shù)據(jù)集中包含10個類別,數(shù)字1~9對應標簽1~9,而“0”的標簽則為10。訓練集中共有73257張圖像,測試集中有26032張圖像。

          數(shù)據(jù)集格式:帶有字符級邊界框的原始圖像。

          數(shù)據(jù)集大小:3.92GB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/SVHN

          3.CCPD數(shù)據(jù)集

          CCPD(Chinese City Parking Dataset)數(shù)據(jù)集是一個用于車牌識別的大型國內停車場車牌數(shù)據(jù)集,是由中科大團隊建立的。該數(shù)據(jù)集在合肥市的停車場采集得來,采集時間早上7:30到晚上10:00。停車場采集人員手持Android POS機對停車場的車輛拍照并手工標注車牌位置。拍攝的車牌照片涉及多種復雜環(huán)境,包括模糊、傾斜、陰雨天、雪天等等。CCPD數(shù)據(jù)集一共包含將近30萬張圖片,每種圖片大小720x1160x3。一共包含8項,具體如下:

          數(shù)據(jù)集大小:23.48GB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/CCPD

          六、NLP數(shù)據(jù)集

          1.common voice數(shù)據(jù)集【ASR】

          Common Voice 是 Mozilla 發(fā)起的一項倡議,旨在推進語音識別技術,更廣泛地為大眾服務。Common Voice 也是一套龐大的數(shù)據(jù)庫,收錄了全球各地貢獻的語音數(shù)據(jù),讓任何人都可以更快更輕松地訓練支持所有語言的語音識別程序。除了應用最廣泛的語言,common voice還收集了使用人數(shù)較少的語種語音樣本。一套豐富而又公開的語音數(shù)據(jù)集能夠幫助開發(fā)者、創(chuàng)業(yè)者以及各個社區(qū)縮小語言規(guī)模的鴻溝。

          該數(shù)據(jù)集當前有 5,671 小時,54 種語言的語音數(shù)據(jù)。數(shù)據(jù)集中的每一條都包含了一組獨立 MP3 錄音及相應的文本文件。數(shù)據(jù)集所記錄的 7,226 小時的錄音中,有許多條數(shù)據(jù)同時包含了年齡、性別、口音等人口統(tǒng)計元數(shù)據(jù),能夠訓練語音識別引擎提升其準確性。

          數(shù)據(jù)集大小:50.06GB

          獲取地址:https://gas.graviti.cn/dataset/hello-dataset/CommonVoiceCN

          2.LibriSpeechASR 數(shù)據(jù)集【ASR】

          公開數(shù)據(jù)集中最常用的英文語料,其中包含了1000小時的16kHz有聲書錄音,這些數(shù)據(jù)來自LibriVox項目的有聲讀物。數(shù)據(jù)都經(jīng)過切割和整理成每條10秒左右的、經(jīng)過文本標注的音頻文件,非常適合入門使用。

          數(shù)據(jù)集大小:140.02GB

          獲取地址:https://gas.graviti.cn/dataset/hello-dataset/LibriSpeechASR

          3. 20NewsGroups 數(shù)據(jù)集【文本分類】

          20newsgroups數(shù)據(jù)集是用于文本分類、文本挖據(jù)和信息檢索研究的國際標準數(shù)據(jù)集之一。數(shù)據(jù)集收集了大約20,000左右的新聞組文檔,均勻分為20個不同主題的新聞組集合。一些新聞組的主題特別相似,還有一些卻完全不相關。

          20newsgroups數(shù)據(jù)集有三個版本。第一個版本19997是原始的并沒有修改過的版本。第二個版本bydate是按時間順序分為訓練(60%)和測試(40%)兩部分數(shù)據(jù)集,不包含重復文檔和新聞組名(新聞組,路徑,隸屬于,日期)。第三個版本18828不包含重復文檔,只有來源和主題。

          • 20news-19997.tar.gz –原始20 Newsgroups數(shù)據(jù)集

          • 20news-bydate.tar.gz –按時間分類; 不包含重復文檔和新聞組名(18846 個文檔)

          • 20news-18828.tar.gz–  不包含重復文檔,只有來源和主題 (18828 個文檔)

          數(shù)據(jù)集大小:44.31MB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/Newsgroups20

          4. Mandarin Chinese Scripted Speech Corpus 數(shù)據(jù)集【ASR】

          此數(shù)據(jù)集包含了755個小時的中文普通話朗讀音頻和轉寫文本,由1080名說話人提供。

          總時長為755小時的中文普通話朗讀語音音頻和轉寫文本,語料內容為日常用語、命令控制和短信。由 Magichub 社區(qū)開源。

          獲取地址:https://gas.graviti.cn/dataset/magichub/MAGICDATAMandarinChineseReadSpeechCorpus_1

          七、醫(yī)學類數(shù)據(jù)集

          COVID-CT數(shù)據(jù)集

          該數(shù)據(jù)集的圖像是從medRxiv,bioRxiv,NEJM,JAMA,Lancet等與COVID19相關的論文中收集的。COVID-CT-Dataset包含來自216位COVID-19患者的349張CT圖像和439張非患者的CT。圖像中,還收集了從論文中提取的元信息,如患者年齡、性別、位置、病史、掃描時間、COVID-19的嚴重程度和放射學報告。

          數(shù)據(jù)集大小:370.82MB

          獲取地址:https://gas.graviti.cn/dataset/data-decorators/COVID_CT



          猜您喜歡:


          等你著陸!【GAN生成對抗網(wǎng)絡】知識星球!  

          CVPR 2021 | GAN的說話人驅動、3D人臉論文匯總

          CVPR 2021 | 圖像轉換 今如何?幾篇GAN論文

          【CVPR 2021】通過GAN提升人臉識別的遺留難題

          CVPR 2021生成對抗網(wǎng)絡GAN部分論文匯總

          經(jīng)典GAN不得不讀:StyleGAN

          最新最全20篇!基于 StyleGAN 改進或應用相關論文

          超100篇!CVPR 2020最全GAN論文梳理匯總!

          附下載 | 《Python進階》中文版

          附下載 | 經(jīng)典《Think Python》中文版

          附下載 | 《Pytorch模型訓練實用教程》

          附下載 | 最新2020李沐《動手學深度學習》

          附下載 | 《可解釋的機器學習》中文版

          附下載 |《TensorFlow 2.0 深度學習算法實戰(zhàn)》

          附下載 | 超100篇!CVPR 2020最全GAN論文梳理匯總!

          附下載 |《計算機視覺中的數(shù)學方法》分享

            

          瀏覽 63
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人毛片18女人免费 | 日韩w w w x x x | 久久免费视频精品 | 影音先锋成人女优资源 | 亚洲黄色电影怎么 |