2021年9月最新的保姆級計算機視覺學習路線
因工作需要,年初花了4個月左右時間學習了機器學習、神經(jīng)網(wǎng)絡相關的知識,工作日每天大概學習4-6個小時,周末每天大概10個小時,工作中的需求應對也得心應手了。
想快速入門的話,從自己的經(jīng)驗看,可以先不看高等數(shù)學和線性代數(shù),因為機器學習和深度學習中涉及的相關知識并不多。
視覺的知識部分建議分成兩部分學習,第一部分傳統(tǒng)圖像處理,第二部分基于深度學習的圖像處理。
但我發(fā)現(xiàn),幾乎80%的CVer 都沒有從頭至尾深入的學習圖像處理方面的知識。
現(xiàn)在有了深度學習,不需要人為提取特征了,所以很多人不再關注圖像底層的信息,而是直接越過這個根基去搭建模型,我覺得這是一個誤區(qū)。
計算機視覺的提升不在于搭建模型,而在于不斷調(diào)優(yōu)、改進過程中積累的經(jīng)驗。
我們該怎么針對不同領域的圖像設置不同的參數(shù)?其中包括卷積核大小、網(wǎng)絡架構、初始權重等等,不可能拿到一個模型,既適合醫(yī)學圖像,又適合人臉識別,這其中就需要n次從70%的精度調(diào)到95%以上中積累出經(jīng)驗。
如果你決心要在這個領域深耕,那么圖像底層方面的知識堅決不可跨越的,欲速則不達。
分享一套當時我學習過的教程,有視頻、代碼、PPT等,幫助大家打好基礎。
跟著這個路線重新去梳理一下你的學習路線,相信計算機視覺水平一定會有質(zhì)的提升。
資源已經(jīng)整理好了,文末附下載方式!以下是詳細內(nèi)容介紹~
第一章:機器學習與計算機視覺
計算機視覺簡介
技術背景
了解人工智能方向、熱點
計算機視覺簡介
cv簡介
cv技能樹構建
應用領域
機器學習的數(shù)學基礎
線性與非線性變換
概率學基礎
熵
kl散度
梯度下降法
計算機視覺與機器學習基礎
圖像和視頻
圖像的取樣與量化
濾波
直方圖
上采樣
下采樣
卷積
直方圖均衡化算法
最近鄰差值
單/雙線性差值
特征選擇與特征提取
特征選擇方法
filter等
特征提取方法:PCA、LDA、SVD等
邊緣提取
Canny
Roberts
Sobel
Prewitt
Hessian特征
Haar特征
相機模型
小孔成像模型
相機模型
鏡頭畸變
透視變換
計算機視覺與機器學習進階
聚類算法
kmeans
層次聚類
密度聚類
譜聚類
坐標變換與視覺測量
左右手坐標系及轉(zhuǎn)換
萬向鎖
旋轉(zhuǎn)矩陣
四元數(shù)
三維計算機視覺
立體視覺
多視幾何
SIFT算法
三維計算機視覺與點云模型
PCL點云模型
spin image
三維重構
SFM算法
圖像濾波器
直通濾波
體素濾波
雙邊濾波器
條件濾波
半徑濾波
圖像增加噪聲與降噪
OpenCV詳解
OpenCV算法解析
線性擬合
最小二乘法
RANSAC算法
哈希算法
DCT算法
漢明距離
圖像相似度
第二章:深度學習與計算機視覺
神經(jīng)網(wǎng)絡
深度學習與神經(jīng)網(wǎng)絡
深度學習簡介
基本的深度學習架構
神經(jīng)元
激活函數(shù)詳解(sigmoid、tanh、relu等)
感性認識隱藏層
如何定義網(wǎng)絡層
損失函數(shù)
推理和訓練
神經(jīng)網(wǎng)絡的推理和訓練
bp算法詳解
歸一化
Batch Normalization詳解
解決過擬合
dropout
softmax
手推神經(jīng)網(wǎng)絡的訓練過程
從零開始訓練神經(jīng)網(wǎng)絡
使用python從零開始實現(xiàn)神經(jīng)網(wǎng)絡訓練
構建神經(jīng)網(wǎng)絡的經(jīng)驗總結
深度學習開源框架
pytorch
tensorflow
caffe
mxnet
keras
優(yōu)化器詳解(GD,SGD,RMSprop等
