雙一流博士導師整理:最新的計算機視覺學習路線(含時間分配建議)
因工作需要,年初花了4個月左右時間學習了機器學習、神經(jīng)網(wǎng)絡(luò)相關(guān)的知識,工作日每天大概學習4-6個小時,周末每天大概10個小時,工作中的需求應對也得心應手了。
?
想快速入門的話,從自己的經(jīng)驗看,可以先不看高等數(shù)學和線性代數(shù),因為機器學習和深度學習中涉及的相關(guān)知識并不多。
?
視覺的知識部分建議分成兩部分學習,第一部分傳統(tǒng)圖像處理,第二部分基于深度學習的圖像處理。
?
但我發(fā)現(xiàn),幾乎80%的CVer 都沒有從頭至尾深入的學習圖像處理方面的知識。
?
現(xiàn)在有了深度學習,不需要人為提取特征了,所以很多人不再關(guān)注圖像底層的信息,而是直接越過這個根基去搭建模型,我覺得這是一個誤區(qū)。
?
計算機視覺的提升不在于搭建模型,而在于不斷調(diào)優(yōu)、改進過程中積累的經(jīng)驗。
?
我們該怎么針對不同領(lǐng)域的圖像設(shè)置不同的參數(shù)?其中包括卷積核大小、網(wǎng)絡(luò)架構(gòu)、初始權(quán)重等等,不可能拿到一個模型,既適合醫(yī)學圖像,又適合人臉識別,這其中就需要n次從70%的精度調(diào)到95%以上中積累出經(jīng)驗。
如果你決心要在這個領(lǐng)域深耕,那么圖像底層方面的知識堅決不可跨越的,欲速則不達。
分享一套當時我學習過的教程,有視頻、代碼、PPT等,幫助大家打好基礎(chǔ)。
?
跟著這個路線重新去梳理一下你的學習路線,相信計算機視覺水平一定會有質(zhì)的提升。
?
資源已經(jīng)整理好了,文末附下載方式!以下是詳細內(nèi)容介紹~?
?
?第一章:機器學習與計算機視覺
?
計算機視覺簡介
技術(shù)背景
了解人工智能方向、熱點
?
計算機視覺簡介
cv簡介
cv技能樹構(gòu)建
應用領(lǐng)域
?
機器學習的數(shù)學基礎(chǔ)
線性與非線性變換
概率學基礎(chǔ)
熵
kl散度
梯度下降法
?
計算機視覺與機器學習基礎(chǔ)
圖像和視頻
圖像的取樣與量化
濾波
直方圖
上采樣
下采樣
卷積
直方圖均衡化算法
最近鄰差值
單/雙線性差值
?
特征選擇與特征提取
特征選擇方法
filter等
特征提取方法:PCA、LDA、SVD等
?
邊緣提取
Canny
Roberts
Sobel
Prewitt
Hessian特征
Haar特征
?
相機模型
小孔成像模型
相機模型
鏡頭畸變
透視變換
?
計算機視覺與機器學習進階
聚類算法
kmeans
層次聚類
密度聚類
譜聚類
?
坐標變換與視覺測量
左右手坐標系及轉(zhuǎn)換
萬向鎖
旋轉(zhuǎn)矩陣
四元數(shù)
?
三維計算機視覺
立體視覺
多視幾何
SIFT算法
?
三維計算機視覺與點云模型
PCL點云模型
spin image
三維重構(gòu)
SFM算法
?
圖像濾波器
直通濾波
體素濾波
雙邊濾波器
條件濾波
半徑濾波
圖像增加噪聲與降噪
?
?
OpenCV詳解
OpenCV算法解析
線性擬合
最小二乘法
RANSAC算法
哈希算法
DCT算法
漢明距離
圖像相似度
?
第二章:深度學習與計算機視覺
神經(jīng)網(wǎng)絡(luò)
深度學習與神經(jīng)網(wǎng)絡(luò)
深度學習簡介
基本的深度學習架構(gòu)
神經(jīng)元
激活函數(shù)詳解(sigmoid、tanh、relu等)
感性認識隱藏層
如何定義網(wǎng)絡(luò)層
損失函數(shù)
?
推理和訓練
神經(jīng)網(wǎng)絡(luò)的推理和訓練
bp算法詳解
歸一化
Batch Normalization詳解
解決過擬合
dropout
softmax
手推神經(jīng)網(wǎng)絡(luò)的訓練過程
?
從零開始訓練神經(jīng)網(wǎng)絡(luò)
使用python從零開始實現(xiàn)神經(jīng)網(wǎng)絡(luò)訓練
構(gòu)建神經(jīng)網(wǎng)絡(luò)的經(jīng)驗總結(jié)
?
深度學習開源框架
pytorch
tensorflow
caffe
mxnet
keras
優(yōu)化器詳解(GD,SGD,RMSprop等
