浙大博士整理的計算機視覺學習路線(含時間建議分配)
看吳恩達《機器學習》《深度學習》課程,學一點機器學習的知識。
讀幾篇CV模型的文章,了解一下經(jīng)典的Alexnet、R-CNN系列、YOLO等。
在github上找?guī)讉€tensorflow、pytorch實現(xiàn)上述模型的開源代碼。
下載VOC、ImageNet、COCO、kaggle等數(shù)據(jù)集。
按照開源代碼中的Readme準備一下數(shù)據(jù)集,跑一下結(jié)果。
?第一章:機器學習與計算機視覺
計算機視覺簡介
技術(shù)背景
了解人工智能方向、熱點
計算機視覺簡介
cv簡介
cv技能樹構(gòu)建
應用領(lǐng)域
機器學習的數(shù)學基礎(chǔ)
線性與非線性變換
概率學基礎(chǔ)
熵
kl散度
梯度下降法
計算機視覺與機器學習基礎(chǔ)
圖像和視頻
圖像的取樣與量化
濾波
直方圖
上采樣
下采樣
卷積
直方圖均衡化算法
最近鄰差值
單/雙線性差值
特征選擇與特征提取
特征選擇方法
filter等
特征提取方法:PCA、LDA、SVD等
邊緣提取
Canny
Roberts
Sobel
Prewitt
Hessian特征
Haar特征
相機模型
小孔成像模型
相機模型
鏡頭畸變
透視變換
計算機視覺與機器學習進階
聚類算法
kmeans
層次聚類
密度聚類
譜聚類
坐標變換與視覺測量
左右手坐標系及轉(zhuǎn)換
萬向鎖
旋轉(zhuǎn)矩陣
四元數(shù)
三維計算機視覺
立體視覺
多視幾何
SIFT算法
三維計算機視覺與點云模型
PCL點云模型
spin image
三維重構(gòu)
SFM算法
圖像濾波器
直通濾波
體素濾波
雙邊濾波器
條件濾波
半徑濾波
圖像增加噪聲與降噪
OpenCV詳解
OpenCV算法解析
線性擬合
最小二乘法
RANSAC算法
哈希算法
DCT算法
漢明距離
圖像相似度
第二章:深度學習與計算機視覺
神經(jīng)網(wǎng)絡(luò)
深度學習與神經(jīng)網(wǎng)絡(luò)
深度學習簡介
基本的深度學習架構(gòu)
神經(jīng)元
激活函數(shù)詳解(sigmoid、tanh、relu等)
感性認識隱藏層
如何定義網(wǎng)絡(luò)層
損失函數(shù)
推理和訓練
神經(jīng)網(wǎng)絡(luò)的推理和訓練
bp算法詳解
歸一化
Batch Normalization詳解
解決過擬合
dropout
softmax
手推神經(jīng)網(wǎng)絡(luò)的訓練過程
從零開始訓練神經(jīng)網(wǎng)絡(luò)
使用python從零開始實現(xiàn)神經(jīng)網(wǎng)絡(luò)訓練
構(gòu)建神經(jīng)網(wǎng)絡(luò)的經(jīng)驗總結(jié)
深度學習開源框架
pytorch
tensorflow
caffe
mxnet
keras
優(yōu)化器詳解(GD,SGD,RMSprop等
