建議收藏 | CV 全路徑學(xué)習(xí)推薦
我跟幾位BATJ現(xiàn)職的CV算法工程師聊了聊學(xué)習(xí)路徑的話題——
學(xué)習(xí)CV要具備哪些基礎(chǔ)?
CV算法工程師應(yīng)當(dāng)掌握哪些技能?
01 編程與數(shù)理基礎(chǔ)
掌握Python基礎(chǔ)理論知識(shí)、了解第三方數(shù)據(jù)科學(xué)庫,能夠使用Python語言進(jìn)行初級(jí)機(jī)器學(xué)習(xí)編程。掌握線性代數(shù)、微積分、概率論、最優(yōu)化的相關(guān)知識(shí)。
02 機(jī)器學(xué)習(xí)基礎(chǔ)
了解線性回歸、邏輯回歸、決策樹等機(jī)器學(xué)習(xí)經(jīng)典模型、能夠基于Python語言上手機(jī)器學(xué)習(xí)算法實(shí)踐。
03 深度學(xué)習(xí)基礎(chǔ)
熟練卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)、了解簡單的Pytorch使用。
04 計(jì)算機(jī)視覺基礎(chǔ)
以O(shè)penCV為基礎(chǔ),掌握?qǐng)D像基礎(chǔ)知識(shí)、基本處理等CV方向的基礎(chǔ)理論。
01 圖像分類
vgg、inception、resnet、mobilenet、SENet。
02 圖像分割
unet、deeplab系列、FCN、SegNet、BiSeNet。
03 目標(biāo)檢測(cè)
SSD、FPN、RetinaNet、Faster rcnn、AnchorFree、基于Transformer和CNN的端到端檢測(cè)。
04 GAN
GAN、DCGAN、Pix2Pix。
01 圖像分類
圖像分類是計(jì)算機(jī)視覺領(lǐng)域最基礎(chǔ)也是最核心的任務(wù),雖然最近涌現(xiàn)出大量優(yōu)秀的CNN模型可直接用于圖像分類,簡化了傳統(tǒng)圖像分類人工設(shè)計(jì)特征的流程,但是真正的企業(yè)級(jí)應(yīng)用中遠(yuǎn)不止使用CNN網(wǎng)絡(luò)模型那么簡單。實(shí)際項(xiàng)目算法開發(fā)過程中,除了模型使用還需要考慮數(shù)據(jù)分布、類別均衡、數(shù)據(jù)增強(qiáng)、損失函數(shù)等trick的應(yīng)用。
推薦項(xiàng)目:花朵分類&不均衡Cifar分類
熟悉訓(xùn)練技巧,掌握獨(dú)立完成項(xiàng)目級(jí)圖像分類模型訓(xùn)練的能力。

02 圖像分割
圖像分割是CV主要方向之一,在自動(dòng)駕駛、人像摳圖、醫(yī)學(xué)圖像分析和工業(yè)質(zhì)檢均有廣泛應(yīng)用。能掌握經(jīng)典圖像分割算法,熟悉代碼開發(fā)流程,獨(dú)立完成圖像分割項(xiàng)目是算法工程師必備的能力。
推薦項(xiàng)目:自動(dòng)駕駛語義分割&人像分割及證件照制作
用代碼實(shí)現(xiàn)數(shù)據(jù)集讀取、圖像分割模型訓(xùn)練、訓(xùn)練分析、模型推理、線上部署。完整地做一次圖像分割項(xiàng)目實(shí)戰(zhàn)。

03 目標(biāo)檢測(cè)
目標(biāo)檢測(cè)是CV領(lǐng)域的重要方向之一,在自動(dòng)駕駛、衛(wèi)星遙感、機(jī)器人、智慧工廠、智能交通等領(lǐng)域中應(yīng)用廣泛。掌握經(jīng)典的目標(biāo)檢測(cè)算法,學(xué)會(huì)檢測(cè)器性能提升方法和模型輕量化的方法,了解模型部署的流程,是計(jì)算機(jī)視覺工程師的必備技能,也是進(jìn)入各大廠和創(chuàng)業(yè)公司的必要條件。
推薦項(xiàng)目:基于YOLOX構(gòu)建高性能目標(biāo)檢測(cè)器&輕量級(jí)目標(biāo)檢測(cè)器
掌握構(gòu)建baseline檢測(cè)器的方法,掌握目標(biāo)檢測(cè)器性能優(yōu)化和輕量化的技巧,了解工程實(shí)踐中目標(biāo)檢測(cè)任務(wù)開發(fā)的一般流程。

04 GAN
生成式對(duì)抗網(wǎng)絡(luò)模型被譽(yù)為“下一代深度學(xué)習(xí)框架”,是目前最強(qiáng)大的生成式模型,已在圖像視頻生成、增強(qiáng)、編輯等應(yīng)用領(lǐng)域廣泛落地。每隔一段時(shí)間網(wǎng)絡(luò)上就會(huì)出現(xiàn)關(guān)于其神奇效果的相關(guān)報(bào)道,比如換臉、繪畫、讓人物跳舞、老片修復(fù)、以及讓照片人臉動(dòng)起來等等。這其中,圖像增強(qiáng)可謂是GAN落地最成熟的一個(gè)方向。此外,數(shù)據(jù)爬取、數(shù)據(jù)分析篩選、模型批量調(diào)參、模型快速部署等算法工程師必備技能也是本項(xiàng)目的重點(diǎn)。
推薦項(xiàng)目:圖像增強(qiáng)經(jīng)典超分辨率任務(wù)均衡Cifar分類項(xiàng)目
學(xué)習(xí)和探索GAN技術(shù)是如何在企業(yè)中一步步落地,解決客戶的實(shí)際需求。

以上內(nèi)容在深度之眼CV項(xiàng)目班中均有涉及,本公眾號(hào)粉絲開放獲取特殊福利:CV項(xiàng)目試學(xué) —— 約3小時(shí):
0.1元領(lǐng)取!
01 算法崗簡歷撰寫及求職面試準(zhǔn)備(74分鐘)

02 圖像分類模型漲點(diǎn)技巧(50分鐘)

03 數(shù)據(jù)爬取及篩選(86分鐘)

0.1元領(lǐng)取!
