進(jìn)展 | 密集人群分布檢測(cè)與計(jì)數(shù)
點(diǎn)擊上方“小白學(xué)視覺(jué)”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
最新密集人群分布預(yù)測(cè),人數(shù)評(píng)估統(tǒng)計(jì)、論文、代碼、數(shù)據(jù)集匯
高密度人群聚集容易發(fā)生各種意外事件、所以監(jiān)控與分析高密度人群,防止意外事件發(fā)生,具有重要的現(xiàn)實(shí)意義,分析高密度人群其中一個(gè)最重要的參考就是人群數(shù)量、評(píng)估聚集人群的數(shù)目、分布方式,有利于實(shí)時(shí)分離與管控,防止意外發(fā)生。
傳統(tǒng)特征提取方法
早期的密集人群技術(shù)主要是基于人頭計(jì)數(shù)與行人計(jì)數(shù)、人臉、身體等部位、這些方法都基于SIFT、HAAR、HOG等特征傳統(tǒng)的圖像特征提取技術(shù)、這些方法在面對(duì)遮擋、密集人群的時(shí)候常常失靈、無(wú)法較準(zhǔn)確的統(tǒng)計(jì)評(píng)估出密集人群,特別是對(duì)大規(guī)模的密集人群,如超過(guò)2000+以上的擁擠人群,很難正確計(jì)數(shù)。
深度學(xué)習(xí)的方法
另外一種現(xiàn)在比較流行的方法是生成人群heat map(熱力圖)、然后人群計(jì)數(shù)就變成對(duì)熱力圖的積分計(jì)算。還可以計(jì)算每平方米的行人密度與聚集程度,這種方法是伴隨著深度學(xué)習(xí)到來(lái)逐漸流行起來(lái),使用卷積神經(jīng)網(wǎng)絡(luò)的方法基本上都是在這個(gè)思路上面進(jìn)行各種拓展。

為什么不基于深度學(xué)習(xí)的對(duì)象檢測(cè)、原因是對(duì)象檢測(cè)對(duì)于密集對(duì)象與超小目標(biāo)對(duì)象很難正確識(shí)別與準(zhǔn)確計(jì)數(shù)。無(wú)法正確給出密集人群的模型與聚集程度。
相關(guān)論文
Crowd Counting Using Scale-Aware Attention Networks
https://arxiv.org/pdf/1903.02025.pdf
主要是基于尺度感知的注意力網(wǎng)絡(luò),通過(guò)全局與局部注意力網(wǎng)絡(luò)實(shí)現(xiàn)密集人群計(jì)數(shù)評(píng)估,網(wǎng)絡(luò)的結(jié)構(gòu)如下:

Multi-Level Bottom-Top and Top-Bottom Feature Fusion for Crowd Counting
https://arxiv.org/pdf/1908.10937.pdf
通過(guò)不同層級(jí)尺度的自頂向下與至底向上的特征融合、其中也融入注意機(jī)制,實(shí)現(xiàn)更好的人頭計(jì)數(shù)。


MULTI-SCALE CONVOLUTIONAL NEURAL NETWORKS FOR CROWD COUNTING
https://arxiv.org/pdf/1702.02359.pdf
本文是多尺度卷積實(shí)現(xiàn)密集人群計(jì)數(shù)的經(jīng)典之作,前面的最新研究成果都有參考過(guò)這篇論文,提出的MSCNN實(shí)現(xiàn)密集人群檢測(cè)。
其中的多尺度BLOB結(jié)構(gòu)如下:

Single-Image Crowd Counting via Multi-Column Convolutional Neural Network
http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Zhang_Single-Image_Crowd_Counting_CVPR_2016_paper.pdf
作者論文主要想解決任意相機(jī)與任意角度圖像的密集人群計(jì)數(shù)面臨的難題,作者面對(duì)密集人群分布、前景與人群分割困難等現(xiàn)實(shí)問(wèn)題除了一個(gè)全新的網(wǎng)絡(luò)MCNN來(lái)解決這些問(wèn)題。

CrowdNet: A Deep Convolutional Network for Dense Crowd Counting
https://arxiv.org/abs/1608.06197.pdf
作者同樣對(duì)相機(jī)的角度不同,充分考慮到算法的兼容性問(wèn)題,作者提出了一個(gè)全新的網(wǎng)絡(luò)模型來(lái)解決此類問(wèn)題。結(jié)構(gòu)如下:

Cross-Scene Crowd Counting via Deep Convolutional Neural Networks
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Zhang_Cross-Scene_Crowd_Counting_2015_CVPR_paper.pdf基于深度學(xué)習(xí)的交叉場(chǎng)景的人群計(jì)數(shù)

常用的數(shù)據(jù)集:
UCF CC 50 人頭標(biāo)注數(shù)據(jù)集
UCSD 行人標(biāo)注數(shù)據(jù)集
GCC Dataset
Fudan-ShanghaiTech Dataset
Venice Dataset
UCF-QNRF Dataset
ShanghaiTech Dataset
WorldExpo'10 Dataset
Mall Dataset
SmartCity Dataset
AHU-Crowd Dataset
代碼
- CrowdNet
https://github.com/davideverona/deep-crowd-counting_crowdnet
https://github.com/mrlzla/crowd_density_estimator
- MCNN
https://github.com/svishwa/crowdcount-mcnn
- MTL
https://github.com/svishwa/crowdcount-cascaded-mtl
- MSCNN
https://github.com/Ling-Bao/mscnn
- MCNN
https://github.com/aditya-vora/crowd_counting_tensorflow交流群
歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺(jué)、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺(jué)SLAM“。請(qǐng)按照格式備注,否則不予通過(guò)。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~
