人臉識(shí)別常用開(kāi)源數(shù)據(jù)集大全
點(diǎn)擊上方“視學(xué)算法”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
導(dǎo)讀
?本文總結(jié)整理了10個(gè)開(kāi)源的人臉識(shí)別數(shù)據(jù)集,并附有相關(guān)下載鏈接,希望能給大家?guī)?lái)一些幫助。?
1.哥倫比亞大學(xué)公眾人物臉部數(shù)據(jù)庫(kù)
數(shù)據(jù)集鏈接:http://m6z.cn/5DlIR9
PubFig Dataset 是一個(gè)大型人臉數(shù)據(jù)集,主要用于人臉識(shí)別和身份鑒定,其涵蓋互聯(lián)網(wǎng)上 200 人的 58,797 張圖像,不同于大多數(shù)現(xiàn)有面部數(shù)據(jù)集,這些圖像是在主體完全不受控制的情況下拍攝的,因此不同圖像中姿勢(shì)、光照、表情、場(chǎng)景、相機(jī)、成像條件和參數(shù)存在較大差異,該數(shù)據(jù)集類似于 UMass-Amherst 創(chuàng)建的 LFW 數(shù)據(jù)集。
該數(shù)據(jù)集由哥倫比亞大學(xué)于 2009 年發(fā)布,相關(guān)論文有《Attribute and Simile Classifiers for Face Verification》。

2.CelebA人臉數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/60EW0n
CelebFaces Attributes Dataset (CelebA) 是一個(gè)大規(guī)模的人臉屬性數(shù)據(jù)集,包含超過(guò) 20 萬(wàn)張名人圖像,每張都有 40 個(gè)屬性注釋。該數(shù)據(jù)集中的圖像涵蓋了較大的姿勢(shì)變化和雜亂的背景。CelebA 種類多、數(shù)量多、注釋豐富,包括10,177 個(gè)身份,202,599 張人臉圖像,以及5 個(gè)地標(biāo)位置,每張圖像 40 個(gè)二進(jìn)制屬性注釋。
該數(shù)據(jù)集可用作以下計(jì)算機(jī)視覺(jué)任務(wù)的訓(xùn)練和測(cè)試集:人臉屬性識(shí)別、人臉識(shí)別、人臉檢測(cè)、地標(biāo)(或人臉部分)定位以及人臉編輯與合成。

3.美國(guó)國(guó)防部人臉庫(kù)
數(shù)據(jù)集鏈接:http://m6z.cn/5So6DB
為促進(jìn)人臉識(shí)別算法的研究和實(shí)用化,美國(guó)國(guó)防部的Counterdrug Technology Transfer Program(CTTP)發(fā)起了一個(gè)人臉識(shí)別技術(shù)(Face Recognition Technology 簡(jiǎn)稱FERET)工程,它包括了一個(gè)通用人臉庫(kù)以及通用測(cè)試標(biāo)準(zhǔn)。到1997年,它已經(jīng)包含了1000多人的10000多張照片,每個(gè)人包括了不同表情,光照,姿態(tài)和年齡的照片。

4.MTFL人臉識(shí)別數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6fHmaT
該數(shù)據(jù)集包含 12,995 張人臉圖像,這些圖像用 (1) 五個(gè)面部標(biāo)志,(2) 性別、微笑、戴眼鏡和頭部姿勢(shì)的屬性進(jìn)行了注釋。

5.BioID人臉數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5ZUjyC
這個(gè)數(shù)據(jù)集包含了1521幅分辨率為384x286像素的灰度圖像。每一幅圖像來(lái)自于23個(gè)不同的測(cè)試人員的正面角度的人臉。為了便于做比較,這個(gè)數(shù)據(jù)集也包含了對(duì)人臉圖像對(duì)應(yīng)的手工標(biāo)注的人眼位置文件。圖像以 "BioID_xxxx.pgm"的格式命名,其中xxxx代表當(dāng)前圖像的索引(從0開(kāi)始)。類似的,形如"BioID_xxxx.eye"的文件包含了對(duì)應(yīng)圖像中眼睛的位置。

6.PersonID人臉識(shí)別數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5So6vR
該數(shù)據(jù)集所選用的人臉照片均來(lái)自于兩部比較知名的電視劇,《吸血鬼獵人巴菲》和《生活大爆炸》。

7.CMU PIE人臉庫(kù)
數(shù)據(jù)集鏈接:http://m6z.cn/5vPwfO
CMU PIE人臉庫(kù)建立于2000年11月,它包括來(lái)自68個(gè)人的40000張照片,其中包括了每個(gè)人的13種姿態(tài)條件,43種光照條件和4種表情下的照片,現(xiàn)有的多姿態(tài)人臉識(shí)別的文獻(xiàn)基本上都是在CMU PIE人臉庫(kù)上測(cè)試的。

8.Youtube視頻人臉數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6u3P2V
該數(shù)據(jù)集包含 1,595 個(gè)不同人的 3,425 個(gè)視頻。所有視頻都是從 YouTube 下載的。每個(gè)主題平均有 2.15 個(gè)視頻可用。最短剪輯時(shí)長(zhǎng)為 48 幀,最長(zhǎng)剪輯為 6070 幀,視頻剪輯的平均長(zhǎng)度為 181.3 幀。在這個(gè)數(shù)據(jù)集下,算法需要判斷兩段視頻里面是不是同一個(gè)人。有不少在照片上有效的方法,在視頻上未必有效/高效。
9.CASIA 人臉圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5vPwio
CASIA 人臉圖像數(shù)據(jù)庫(kù)版本 5.0(或 CASIA-FaceV5)包含 500 個(gè)對(duì)象的 2,500 個(gè)彩色人臉圖像。CASIA-FaceV5 的面部圖像是使用羅技 USB 攝像頭在一個(gè)會(huì)話中捕獲的。CASIA-FaceV5的志愿者包括研究生、工人、服務(wù)員等。所有人臉圖像均為16位彩色BMP文件,圖像分辨率為640*480。典型的類內(nèi)變化包括照明、姿勢(shì)、表情、眼鏡、成像距離等。

10.Caltech人臉數(shù)據(jù)庫(kù)
數(shù)據(jù)集鏈接:http://m6z.cn/5So6VP
該數(shù)據(jù)集包含通過(guò)在谷歌圖片搜索中輸入常見(jiàn)的名字從網(wǎng)絡(luò)上收集的人的圖像。每個(gè)正面的眼睛、鼻子和嘴巴中心的坐標(biāo)在地面實(shí)況文件中提供。此信息可用于對(duì)齊和裁剪人臉或作為人臉檢測(cè)算法的基本事實(shí)。該數(shù)據(jù)集有 10,524 個(gè)不同分辨率和不同設(shè)置的人臉,例如 肖像圖像、人群等。側(cè)面或非常低分辨率的面孔未標(biāo)記。


點(diǎn)個(gè)在看 paper不斷!
