父老們,鄉(xiāng)親們!你知道人臉、商品、車輛識別,以圖搜圖乃至自動(dòng)駕駛,背后的技術(shù)是什么嘛?
起初小編覺得不就是圖像分類、目標(biāo)檢測這些東西嘛,有什么難的?但能熟練這些應(yīng)用的BAT高級工程師們都輕松年薪百萬,笑傲人生了!!!當(dāng)小編正在酸成檸檬精的時(shí)候,BAT大神幽幽的說:這背后是綜合使用目標(biāo)檢測、圖像分類、度量學(xué)習(xí)、圖像檢索的【通用圖像識別系統(tǒng)】…度量學(xué)習(xí)是啥?圖像檢索是啥?通用圖像識別系統(tǒng)又是啥?!看來還是我Too Simple,Too Naive了…難道我真的就無緣年薪百萬了嘛?!正在小編捶胸頓足的時(shí)候,小編突然發(fā)現(xiàn)了一個(gè)通用圖像識別系統(tǒng)快速搭建神器— PP-ShiTu!OMG!這不夢想一下就要實(shí)現(xiàn)了嘛!https://github.com/PaddlePaddle/PaddleClas
那這個(gè)項(xiàng)目到底有什么過人之處,圖像識別又比圖像分類、目標(biāo)檢測強(qiáng)在哪里呢?
拿[商品識別]舉個(gè)栗子,如果你用單純的圖像分類和目標(biāo)檢測,你會(huì)發(fā)現(xiàn):- 商品類別數(shù)以萬計(jì):根本沒法事先把所有類別都放入訓(xùn)練集!訓(xùn)練集都不完備怎么訓(xùn)練算法?
- 樣本差別極小,區(qū)分難度極大:細(xì)分類差別極其細(xì)微,實(shí)際圖像的拍攝角度也多變刁鉆,識別準(zhǔn)確率非常非常低。
- 產(chǎn)業(yè)上線速度要求極高:每張復(fù)雜的圖片處理速度要求在毫秒級別,在閘機(jī)前讓你等個(gè)3秒絕對要炸鍋!
而這個(gè)PP-ShiTu圖像識別系統(tǒng)就可以完美解決以上問題!準(zhǔn)備好需要識別的物體圖片后,只需三步,多類別、微差異、高速度等問題通通不再是問題,絕對的?“開箱即用”,而且它不僅可以用作商品識別,還可以進(jìn)行車輛、人臉、Logo、行人識別!!!- 第一步通過目標(biāo)檢測模型,進(jìn)行主體檢測;
- 第二步對每個(gè)候選區(qū)域進(jìn)行特征提取;
- 第三步將特征提取后的向量在檢索庫中進(jìn)行檢索,完成匹配,返回識別結(jié)果。
而這個(gè)圖像識別系統(tǒng)的4個(gè)核心構(gòu)成模塊,都是經(jīng)過精心打磨。無論是單獨(dú)使用亦或是串聯(lián)開發(fā),都有非凡的效果:主體檢測:采用高精度超輕量的PP-PicoDet檢測算法,它的出現(xiàn),使PP-ShiTu的主體檢測模塊預(yù)測速度提升了15倍以上,而精度幾乎不衰減。骨干網(wǎng)絡(luò):采用CPU級超高性價(jià)比的輕量化骨干網(wǎng)絡(luò)PP-LCNet,它的準(zhǔn)確率不僅超越大模型ResNet50的模型效果,預(yù)測速度還是后者的3倍!簡直香個(gè)跟頭!而PP-ShiTu充分挖掘該網(wǎng)絡(luò)的潛力,學(xué)習(xí)一個(gè)具有超強(qiáng)泛化能力的特征提取模型,同一模型可在多個(gè)數(shù)據(jù)集上同時(shí)實(shí)現(xiàn)高精度識別。度量學(xué)習(xí):集成ArcMargin度量學(xué)習(xí)方法,輕松將圖像轉(zhuǎn)換成特征向量,訓(xùn)練出魯棒的圖像特征,以供后續(xù)進(jìn)行檢索識別。檢索系統(tǒng):集成Faiss算法,高效完成向量檢索。當(dāng)增加新的品類時(shí),不需要重新訓(xùn)練提取特征模型,僅需要更新檢索庫即可識別新的目標(biāo),一次訓(xùn)練長期使用,還兼容(Linux, Windows, MacOS)多平臺。開發(fā)者不僅可以單獨(dú)或自主組裝使用這四個(gè)模塊,還可以直接采用構(gòu)建好的車輛識別、LOGO識別、商品識別、動(dòng)漫識別四個(gè)系統(tǒng)。只需要補(bǔ)充好檢索庫,就可以直接投產(chǎn)使用了!有了它們的助力,看齊大廠程序員,年薪百萬不是夢!(逐漸露出暴富的笑容~?)這么強(qiáng)大、用心的項(xiàng)目 ,你還在等什么?!還不趕緊Star??收藏上車吧!傳送門:
https://github.com/PaddlePaddle/PaddleClashttps://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/quick_start/quick_start_recognition.md為了讓開發(fā)者更深入的了解PaddleClas并手把手教大家完成圖像識別系統(tǒng)的搭建,項(xiàng)目團(tuán)隊(duì)還精心準(zhǔn)備了為期4天的直播課程。11月2日-3日百度高工為我們講解了圖像識別技術(shù)難點(diǎn)及選型策略及SOTA模型煉丹秘訣,11月4日-5日還有圖像識別產(chǎn)業(yè)應(yīng)用的方法和技巧解析,現(xiàn)場直接為大家進(jìn)行答疑,還在等什么!趕緊掃碼上車吧!
掃碼報(bào)名直播課,加入技術(shù)交流群
精彩內(nèi)容搶先看!長按收藏海報(bào)~
如果您想詳細(xì)了解更多飛槳的相關(guān)內(nèi)容,請參閱以下文檔。https://www.paddlepaddle.org.cnGitHub:?https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3Gitee:
https://gitee.com/paddlepaddle/PaddleClas這么強(qiáng)大、用心的項(xiàng)目 ,還不趕緊給各位開發(fā)者一個(gè)Star??的鼓勵(lì)!https://github.com/PaddlePaddle/PaddleClas
數(shù)據(jù)來源:部分圖片來源于網(wǎng)絡(luò),侵權(quán)可刪