自動駕駛 | 特斯拉純視覺機器學習解決方案
點擊上方“小白學視覺”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
本文轉(zhuǎn)自:計算機視覺聯(lián)盟
Scaled ML Conference今年2月26-27召開,特斯拉AI高級總監(jiān)Andrej Karpathy在會上給了一個報告,其中一些內(nèi)容在去年6月ICML也講過了。下面以網(wǎng)上的視頻截屏作為筆記,我稍稍注釋一下。



報告綱要

特斯拉30億英里的駕駛數(shù)據(jù),無人匹敵。

前不久提供的導航功能(高速閘口),能自動換道。

還有停車場的手機召喚。

這是最近實現(xiàn)的L2.5功能。

三個短視頻,介紹行人AEB。

這里展示了特斯拉的全自動駕駛的視頻,看到上下高速。

這里提了一下谷歌維摩,解釋為什么人家那么早就開始了,因為有激光雷達,高清地圖。

這是維摩的自動駕駛展示,強調(diào)特斯拉是純視覺技術(shù)。

這里就是視覺的任務。

展示全自動駕駛視頻中的視覺技術(shù)。

為強調(diào)視覺的難度,特意拿stop sign detection為例子,展示各種困難。

介紹Data Engine的平臺,以前ICML也講過,同時強調(diào)特斯拉的shadow mode。

這里舉例,上面是遮擋,下面是右轉(zhuǎn)彎不需要遵守stop。

評估測度。

介紹hydranet,以前就是多任務訓練(multi task learning),給了個名字。

重新介紹operation vacation,舉例police alert light檢測,稱為landmark task,landmark定義為example of prototype。

舉例HydraNet,檢測運動目標、道路邊緣和道路線。

這是其中Road Edge網(wǎng)絡(luò)輸出。

這是Occupancy tracker,將道路邊緣連接成空區(qū)域,可用于smart summon。

過了兩年,重提SW 2.0,不過這里是用于泊車場。

提出BEV Net,即鳥瞰視圖的預測,backbone共享,多個head。

這里介紹BEV Net結(jié)果好于2D邊緣預測的方法。

應用視頻:停車場紅色邊緣,綠色是分界。

另外一個應用視頻:停車場手機召喚。

強調(diào)深度圖,偽激光雷達,3D目標檢測。

介紹自己的非監(jiān)督學習深度圖預測,還是強調(diào)偽激光雷達的效果。

特斯拉有最多的視頻數(shù)據(jù)。

交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

