深度學(xué)習(xí)的深度學(xué)習(xí)路程
MyEncyclopedia 公眾號(hào)主浙大本碩畢業(yè)后在BAT做資深工程開(kāi)發(fā),精通Java,算法和大數(shù)據(jù)開(kāi)發(fā),本可以靠著工程能力成為P9,但出于對(duì)AI的強(qiáng)烈興趣,在業(yè)余時(shí)間,自學(xué)多年,從理論到實(shí)踐,并最終轉(zhuǎn)行到知名公司任資深機(jī)器學(xué)習(xí)崗。MyEncyclopedia 公眾號(hào)提煉自己在AI多個(gè)領(lǐng)域的學(xué)習(xí)心得體會(huì):深度學(xué)習(xí),強(qiáng)化學(xué)習(xí),統(tǒng)計(jì)機(jī)器學(xué)習(xí),算法與工程實(shí)現(xiàn)。同時(shí),用上述多個(gè)視角來(lái)全面看待問(wèn)題,堅(jiān)持從第一性原理出發(fā)理解推導(dǎo)。憑借著強(qiáng)大的編程能力,公眾號(hào)還大量使用動(dòng)畫(huà)模擬和代碼例子的來(lái)闡述深?yuàn)W的概念。
目前,MyEncyclopedia 系列文章包括
深度學(xué)習(xí)論文解析
深度強(qiáng)化學(xué)習(xí)實(shí)踐和理論
基礎(chǔ)統(tǒng)計(jì)和統(tǒng)計(jì)機(jī)器學(xué)習(xí)
多維度思考算法題
動(dòng)手學(xué) Sutton 強(qiáng)化學(xué)習(xí)教程
將來(lái),會(huì)逐漸完善已有系列并涉及
GNN,NLP,CV,KG,RL 方向的前沿論文和動(dòng)手實(shí)踐,并致力于尋求聯(lián)系
深入數(shù)學(xué)理論,進(jìn)一步用動(dòng)畫(huà)來(lái)可視化,建立直覺(jué)的聯(lián)系
創(chuàng)意編程,用深度學(xué)習(xí),強(qiáng)化學(xué)習(xí)實(shí)踐cool idea
如果你也想更廣更深的學(xué)習(xí)深度學(xué)習(xí)和算法的話,就趕緊關(guān)注吧~
下面是頻道精彩原創(chuàng)分類鏈接
深度學(xué)習(xí)論文解析
視頻論文解讀:MINE 互信息神經(jīng)網(wǎng)絡(luò)估計(jì)
透徹直覺(jué)解讀深度表征學(xué)習(xí)論文 CPC InfoNCE
視頻論文解讀:經(jīng)典表征學(xué)習(xí) NCE (負(fù)采樣)的宏觀理解
Pointer Networks 論文解讀:RNN解組合優(yōu)化
更多 Deep Representation Learning 構(gòu)建籌劃中
Graph Neural Networks 領(lǐng)域?qū)W習(xí)籌劃中
深度強(qiáng)化學(xué)習(xí)實(shí)踐和理論系列
解讀深度強(qiáng)化學(xué)習(xí)基石論文:函數(shù)近似的策略梯度方法
解讀TRPO論文,深度強(qiáng)化學(xué)習(xí)結(jié)合傳統(tǒng)優(yōu)化方法
強(qiáng)化學(xué)習(xí)開(kāi)源環(huán)境集 Soft ActorCritic, ACKTR 等模型 RLLib 分布式訓(xùn)練
多角度刷算法題系列
深入 LeetCode 470 了解拒絕采樣和求期望法,再挑戰(zhàn)一道經(jīng)典概率面試題
Leetcode 1029 兩地調(diào)度問(wèn)題的優(yōu)化解法(附OR-Tools和PuLP代碼)
從蒙特卡羅模擬,數(shù)學(xué)遞推到直覺(jué)來(lái)思考 Leetcode 1227 飛機(jī)座位分配概率
24 點(diǎn)游戲算法題的 Python 函數(shù)式實(shí)現(xiàn): 學(xué)用itertools,yield,yield from 巧刷題
組合游戲系列1: Leetcode中的Minimax 和 Alpha Beta剪枝
組合游戲系列2: 井字棋Minimax最佳策略和Leetcode相關(guān)題解
TSP問(wèn)題從DP算法到深度學(xué)習(xí)1:遞歸DP方法 AC AIZU TSP問(wèn)題 TSP問(wèn)題從DP算法到深度學(xué)習(xí)2:歐氏空間數(shù)據(jù)集的DP解 TSP問(wèn)題從DP算法到深度學(xué)習(xí)3:Pointer Network TSP問(wèn)題從DP算法到深度學(xué)習(xí)4:概率最大狀態(tài)序列算法 更多統(tǒng)計(jì),優(yōu)化,模擬和算法綜合主題構(gòu)建籌劃中
統(tǒng)計(jì)和機(jī)器學(xué)習(xí)基礎(chǔ)系列
深入理解極大似然估計(jì)(MLE) 1: 引入問(wèn)題
從零構(gòu)建統(tǒng)計(jì)隨機(jī)變量生成器之離散基礎(chǔ)篇 用模擬方法直覺(jué)理解更多隨機(jī)變量生成和隨機(jī)過(guò)程
Sutton 強(qiáng)化學(xué)習(xí)基礎(chǔ)系列
通過(guò)代碼學(xué)Sutton強(qiáng)化學(xué)習(xí):GridWorld OpenAI環(huán)境和策略評(píng)價(jià)算法 Sutton強(qiáng)化學(xué)習(xí)之用代碼學(xué)習(xí)2:Grid World 策略迭代和值迭代 通過(guò)代碼學(xué)Sutton強(qiáng)化學(xué)習(xí)3:21點(diǎn)游戲的策略蒙特卡洛值預(yù)測(cè) 通過(guò)代碼學(xué)Sutton強(qiáng)化學(xué)習(xí)4:21點(diǎn)游戲蒙特卡洛解得最佳策略 通過(guò)代碼學(xué)Sutton強(qiáng)化學(xué)習(xí)第四章動(dòng)態(tài)規(guī)劃 通過(guò)代碼學(xué)Sutton強(qiáng)化學(xué)習(xí):SARSA、Q-Learning和Expected SARSA 時(shí)序差分算法訓(xùn)練CartPole 通過(guò)代碼學(xué)Sutton強(qiáng)化學(xué)習(xí):從Q-Learning 演化到 DQN
資源共享
分享最新Harvard深度學(xué)習(xí)課程視頻 Unleashing Novel Data at Scale
課程視頻共享:Illinois大學(xué) CS598 統(tǒng)計(jì)強(qiáng)化學(xué)習(xí)
分享精品深度強(qiáng)化學(xué)習(xí)講座 Berkeley Deep RL Bootcamp 2017
新書(shū)推薦&課程視頻網(wǎng)盤(pán)下載:強(qiáng)化學(xué)習(xí)與最優(yōu)控制
