何愷明一作論文 MAE 已有人復(fù)現(xiàn)!PyTorch 版?。ǜ芥溄樱?/h1>

來源:AI算法與圖像處理 本文多圖,建議閱讀5分鐘
CV大神何愷明論文復(fù)現(xiàn)。
大家好,我是紅色石頭。之前介紹過CV大神何愷明又出力作!論文「Masked Autoencoders Are Scalable Vision Learners」
Arxiv鏈接:
https://arxiv.org/pdf/2111.06377.pdf
現(xiàn)在,有人復(fù)現(xiàn)了這篇文章,而且是PyTorch的版本!
復(fù)現(xiàn)代碼:
https://github.com/pengzhiliang/MAE-pytorch
何愷明大佬新作一發(fā)出來,知乎上就有眾多大佬在討論
具體鏈接:
https://www.zhihu.com/question/498364155
除了大家對何愷明大佬的工作的肯定外(當(dāng)然部分認(rèn)為novelty不足),也引發(fā)對未來CV工作的思考,是否會引領(lǐng)類似去年 transformer那樣子的熱潮?亦或是證明ViT的各種改變可能都是沒有意義的。
這次何愷明大佬又把握了技術(shù)發(fā)展的趨勢,NLP和CV互相融合的工作看來會是大勢所趨。

論文鏈接: https://arxiv.org/pdf/2111.06377.pdf

復(fù)現(xiàn)代碼: https://github.com/pengzhiliang/MAE-pytorch
項目結(jié)構(gòu):

詳情:

編輯:于騰凱
瀏覽
115

來源:AI算法與圖像處理 本文多圖,建議閱讀5分鐘
CV大神何愷明論文復(fù)現(xiàn)。
Arxiv鏈接:
https://arxiv.org/pdf/2111.06377.pdf
具體鏈接:
https://www.zhihu.com/question/498364155




編輯:于騰凱
評論
圖片
表情
