無需爬梯!1000+優(yōu)質(zhì)數(shù)據(jù)集「極速」免費(fèi)下載
在計(jì)算機(jī)領(lǐng)域中,好的數(shù)據(jù),對(duì)模型訓(xùn)練至關(guān)重要。自己做數(shù)據(jù),即昂貴又費(fèi)時(shí)費(fèi)力;但是,使用現(xiàn)成的數(shù)據(jù)集,既不好找又不好下載及使用。


4歲算法工程師-李小姐

進(jìn)入研發(fā)前花大量時(shí)間進(jìn)行模型預(yù)研,需要找尋相關(guān)的數(shù)據(jù)集,于是就在數(shù)據(jù)的可視化、標(biāo)簽轉(zhuǎn)換上白白耗費(fèi)了很多心血!
需要使用公開數(shù)據(jù)集進(jìn)行論文或?qū)W術(shù)的研究,但是這些幾乎都在境外,下載往往需要VPN,下載又難又慢……


0歲算法工程師-王先生

▲一個(gè)模型的誕...生...
作為大數(shù)據(jù)時(shí)代背景下的互聯(lián)網(wǎng)從業(yè)者,我們每時(shí)每刻都在和數(shù)據(jù)打交道,算法工程師們當(dāng)然不例外。在一個(gè)合格模型的誕生過程中,繁雜的數(shù)據(jù)收集與處理工作往往給算法工程師帶來了低效的工作體驗(yàn)。
……
而最近
小編發(fā)現(xiàn)了一個(gè)數(shù)據(jù)集獲取神器
Graviti Open Dataset
這是一個(gè)提供公開數(shù)據(jù)集的平臺(tái),你可以很方便地從中搜索到想要的數(shù)據(jù)集,可在線預(yù)覽樣例數(shù)據(jù)、標(biāo)注、標(biāo)簽,無需“梯子”即可免費(fèi)高速下載國(guó)外數(shù)據(jù)集。
一、豐富多元的數(shù)據(jù)集種類

目前,Graviti Open Dataset已收錄1000+個(gè)高質(zhì)量人工智能數(shù)據(jù)集。提供一站式檢索、高速下載,免費(fèi)貢獻(xiàn)學(xué)術(shù)社區(qū)。
覆蓋2D/3D目標(biāo)檢測(cè)、圖像分割、圖像分類、目標(biāo)跟蹤、OCR、姿態(tài)估計(jì)、無人駕駛、智慧零售、機(jī)器人等多種AI應(yīng)用領(lǐng)域。
與此同時(shí),Graviti Open Dataset還包含了點(diǎn)云、圖像、視頻序列、三維模型等多種數(shù)據(jù)格式。
這里舉兩個(gè)栗子:
無人駕駛類數(shù)據(jù)集
KITTI-object&Synscapes

▲KITTI-object,含2D/3D目標(biāo)檢測(cè)點(diǎn)云和圖像數(shù)據(jù)

▲Synscapes,含25,000個(gè)真實(shí)街景圖像
文本識(shí)別類數(shù)據(jù)集
MNIST&SVHN

▲MNIST,含60,000個(gè)手寫數(shù)字樣本的訓(xùn)練集和10,000個(gè)樣本的測(cè)試集

▲SVHN,含600,000個(gè)數(shù)字圖像
二、便捷迅速的數(shù)據(jù)集查找
想找心儀數(shù)據(jù)集,現(xiàn)在一目了然。你不僅可以靠數(shù)據(jù)集的內(nèi)容關(guān)鍵詞搜索,還可以通過應(yīng)用行業(yè)、標(biāo)注類型等屬性進(jìn)行多維度查詢。
眾所周知:找數(shù)據(jù)難,找海外數(shù)據(jù)更是難上加難。但擁有Graviti網(wǎng)站就像擁有一把萬能鑰匙。
想進(jìn)行COVID肺部醫(yī)學(xué)影像檢測(cè)模型訓(xùn)練?
在搜索框輸入“COVID”即可一鍵抵達(dá)

▲搜索得到的優(yōu)質(zhì)數(shù)據(jù)集示例
還想搜索醫(yī)學(xué)影像數(shù)據(jù)集?
選擇“medical”進(jìn)行行業(yè)搜索即得


▲更多醫(yī)學(xué)相關(guān)數(shù)據(jù)集
三、直接美觀的數(shù)據(jù)集可視化
話不多說,先上圖片

▲訓(xùn)練集人像截取示例

▲圖像多元素分類
無需下載即可瀏覽樣例數(shù)據(jù),更有多種可視化方案供你隨時(shí)查看。再也不用擔(dān)心費(fèi)勁下完整套數(shù)據(jù)才發(fā)現(xiàn)根本不是自己想要的內(nèi)容。

還 沒 有?心 動(dòng)?嗎 ?
壓軸亮點(diǎn)來了!

四、暢通高速的海外數(shù)據(jù)下載
很多時(shí)候,我們的數(shù)據(jù)獲取渠道都只提供主流的國(guó)內(nèi)公開數(shù)據(jù)集,而更普適的模型卻需要用海內(nèi)外的多元數(shù)據(jù)去共同訓(xùn)練。
針對(duì)海外數(shù)據(jù)獲取難、下載慢的問題,Graviti給出了一站式解決方案——將全球資源Host至國(guó)內(nèi)鏡像,無需VPN訪問,滿帶寬極速下載。和進(jìn)入海外官網(wǎng)下載相比,Graviti至少提速100%。
從此告別繁瑣的登錄注冊(cè)流程,告別令人抓狂的下載時(shí)長(zhǎng)!


▲普通帶寬下載海外數(shù)據(jù),實(shí)測(cè)就有10MB/s的速度
那么問題來了,海外下載提速需要會(huì)員嗎?還是按次計(jì)費(fèi)呢?
答案是:
完全免費(fèi)

????
在Graviti,還有更多有趣又高質(zhì)量的數(shù)據(jù)集在持續(xù)更新中,快來一起探索吧!
另外,如果你在他們網(wǎng)站發(fā)現(xiàn)自己感興趣的數(shù)據(jù)不存在,也可以進(jìn)他們的官方微信群反饋,說不定下次就為你上線了呢:)
一鍵獲取數(shù)據(jù)集↓

↑進(jìn)官方微信群
除了托管公開標(biāo)準(zhǔn)的數(shù)據(jù)集,小編還發(fā)現(xiàn)該網(wǎng)站正在開發(fā)針對(duì)用戶的個(gè)性化的數(shù)據(jù)管理服務(wù),包括數(shù)據(jù)免費(fèi)托管、數(shù)據(jù)版本管理~還可以輕松完成對(duì)數(shù)據(jù)的拆分與合并,對(duì)于開發(fā)自己數(shù)據(jù)集的同學(xué)無疑是個(gè)非常值得期待的功能。

點(diǎn)擊閱讀原文,直達(dá)官網(wǎng)體驗(yàn)。
