集成電路行業(yè)觀察(下)
集成電路行業(yè)觀察(下)
01
關(guān)鍵設(shè)備層——光刻機(jī)
在上期集成電路行業(yè)觀察(上)中說過了柵極長度被稱為關(guān)鍵工藝節(jié)點,而光刻出的最細(xì)線條寬度決定了柵極的極限長度,因此,可以說光刻機(jī)是在半導(dǎo)體領(lǐng)域最重要的一臺超精細(xì)設(shè)備了。關(guān)于光刻機(jī)的詳細(xì)介紹參見卡住中國芯片發(fā)展脖子的設(shè)備——EUV;左圖為光刻機(jī)的關(guān)鍵系統(tǒng)及組件。如此精細(xì)化的結(jié)構(gòu)造成了極高的制成技術(shù)設(shè)備壁壘,國際上最先進(jìn)的極紫外光刻機(jī)廠商是荷蘭的阿斯麥。而目前我國在低端光刻機(jī)國產(chǎn)化進(jìn)程上,雖然取得了一定的成果,但是在極紫外光刻機(jī)EUV方面還和荷蘭存在極大差距。據(jù)悉,華為已參與到14nm光刻機(jī)的自研中,這樣復(fù)雜的光學(xué)、材料學(xué)、模組學(xué)、機(jī)械制動學(xué)的機(jī)械我們拭目以待。

02
關(guān)鍵器件層——3D傳感芯片
在 2015 年,一張“鴿子為什么這么大”的照片火遍全網(wǎng),其本質(zhì)原因就 是單圖像傳感器難以體現(xiàn)深度(物體遠(yuǎn)近)信息,顯得圖中的鴿子格外巨大?!敖筮h(yuǎn)小”這個事實,在肉眼視角中不值一提,是一個常識;然而僅僅憑 借一張照片,在失去深度信息的前提下,“遠(yuǎn)”和“近”便難以分辨了,因此出現(xiàn)了這個笑話。在 AIoT 時代,機(jī)器學(xué)習(xí)、圖像識別等技術(shù)開始廣泛應(yīng)用, 如果在輸入端沒有深度的信息,AI 對世界的認(rèn)知就會失真,進(jìn)而輸出錯誤的 判斷。在精細(xì)化遇到瓶頸的情況下,為了更好地還原、接近人眼感受到的世界,圖像傳感器的發(fā)展趨勢是三維化。

那么3D傳感有哪些應(yīng)用場景呢?在消費(fèi)電子中以手機(jī)為主,在醫(yī)療、工業(yè)、軍事、智能家居領(lǐng)域也開始滲透。全球消費(fèi)電子用 3D 傳感市場空間已超過 50 億元,預(yù)計 2025 年可達(dá)150 億元。AR 生態(tài)是 3D 傳感從可選走向必選、市場空間從百億邁向千億的關(guān)鍵。若 不搭載該技術(shù),則 AR 無法體現(xiàn)近大遠(yuǎn)小特征,虛擬與現(xiàn)實的 3D 交互將失 真。目前各大終端廠商正積極探索 AR 生態(tài),并應(yīng)用 3D 傳感技術(shù)于其中。這個技術(shù)也是元宇宙的一個底層基礎(chǔ)性硬件。
雙目視覺的深度信息識別原理是利用相差。如下圖所示,一個物體在兩 臺相機(jī)中成像的位置是不一樣的(此處使用小孔成像近似)。通過位置差信息、兩臺相機(jī)之間的距離(基線長度)即可計算出物體距離相機(jī)的距離。在 實際應(yīng)用中,還有各種相差修正等參數(shù);同時,比對兩幅圖像,并識別出“一 個物體”。是其中最難、算力消耗最大的一步。整體應(yīng)用較少。
結(jié)構(gòu)光是通過點陣投影器投射預(yù)先編碼好的紅外點陣,通過攝像頭拍攝后與標(biāo)定的參數(shù)進(jìn)行比對,計算變形的比例后即可還原出物體深度。其本質(zhì) 與雙目視覺相似,也是通過投射光和接受光的光路視差,對基線長度也有要求。由于每個點陣投影器投出的點數(shù)是恒定的,因此距離越遠(yuǎn)單位面積的點 密度越低,算法的還原效果越差。因此結(jié)構(gòu)光技術(shù)不適用于遠(yuǎn)距離場景。
I-ToF 傳感器使用積分的方式將光信號轉(zhuǎn)為電信號,通過編碼脈沖并 對返回電荷積分的方式間接求得飛行的時間(如下圖),其精度會受到脈沖 周期的限制;D-ToF 則可通過單光子雪崩二極管(SPAD)精確地記錄光子發(fā) 射和返回的時刻,因此其精度不隨距離增長而下降。而dToF方案相對iToF來說,標(biāo)定相對簡單,功耗低,理論精度更高且精度不隨距離下降,成像質(zhì)量更高,同時更適用于戶外場景。但在具體實現(xiàn)上,dToF相較于iToF來說難度要大許多,其難點在于要檢測的光信號是一個脈沖信號,在低功耗、高時間精準(zhǔn)度要求下檢測微弱光學(xué)回波信號,因此對探測器性能要求非常高。dToF常見檢測器是單光子雪崩二極管SPAD,也就是說SPAD直接決定了dToF的性能。

不同技術(shù)路線決定不同距離下的精度,進(jìn)而決定應(yīng)用場景。雙目視覺精度取決于基線長度,消費(fèi)電子要求小模組,其精度低、應(yīng)用少;結(jié)構(gòu)光的精度取決于點陣密度,適用于對安全性要求高而測量距離較低的場景,例如人臉識別、AOI 檢測等;ToF 的精度取決于其單位測量時間,D-ToF 精度不隨距離增長而降低,是遠(yuǎn)距離應(yīng)用的關(guān)鍵技術(shù),應(yīng)用場景例如 3D 建模、游戲、導(dǎo)航、汽車避障、自動駕駛、手勢捕捉、導(dǎo)航、AR 等各個方面。
單從技術(shù)方面看,dToF取代iToF存在很強(qiáng)的邏輯必然性。現(xiàn)在iToF實際應(yīng)用中暴露出三個自身難以解決的問題:一是全系統(tǒng)能耗太大(因為采用連續(xù)波或?qū)捗}沖激光),二是準(zhǔn)度易受干擾(如透明物體干擾、多光路干擾、反射率對比度干擾),三是抗環(huán)境光能力差限制了戶外應(yīng)用。這三個問題顯著限制了iToF的應(yīng)用。而dToF則從根本上解決了以上三個問題,實際應(yīng)用的性能天花板要遠(yuǎn)高于iToF。然而任何一項新技術(shù)的發(fā)展都不只取決于技術(shù)原理,產(chǎn)業(yè)鏈的成熟度、全產(chǎn)業(yè)鏈成本、可靠性等因素以及市場的宏觀局勢都會影響技術(shù)演進(jìn)。當(dāng)前的dToF產(chǎn)業(yè)鏈成熟度尚不如iToF,因此未來dToF是否取代iToF會取決于很多因素。3D ToF的應(yīng)用場景非常多,對于某些特定應(yīng)用場景,iToF跟dToF也會各自有一些優(yōu)勢。

2020年10月發(fā)布的新款iPhone機(jī)型中有兩款(iPhone12 pro和iPhone 12 pro max)都搭載了激光雷達(dá)掃描儀,以拓展智能手機(jī)實現(xiàn)增強(qiáng)現(xiàn)實(AR)場景和自動對焦的能力。這對于智能手機(jī)未來作為視頻內(nèi)容創(chuàng)作平臺和AR應(yīng)用平臺的大趨勢來說有著關(guān)鍵性的推進(jìn)作用。
據(jù)悉,安卓手機(jī)陣營正在積極跟進(jìn)這一潮流,華米OV明確表示了自己在3D感知以及AR領(lǐng)域的布局。然而,當(dāng)前安卓手機(jī)廠商能夠獲得的3D傳感器仍僅限于iToF傳感器或有限點距離傳感器,均與iPhone搭載的基于單光子探測器(SPAD)陣列的dToF傳感器存在代差。
據(jù)悉,蘋果在該項技術(shù)上存在巨大技術(shù)優(yōu)勢,目前手機(jī)市場能提供關(guān)鍵芯片的供應(yīng)商我了解到只有靈明光子和南京芯世界兩家初創(chuàng)公司。但其余蘋果的供應(yīng)商在供應(yīng)鏈能力方面還是小巫見大巫了。與此同時,蘋果的dToF 3D傳感技術(shù)也使服務(wù)型機(jī)器人、AR頭顯等其它需要3D傳感方案的行業(yè)看到了一種更新、更先進(jìn)的技術(shù),全科技行業(yè)對于dToF 3D傳感器的需求正在蓄勢,極有可能在未來一兩年內(nèi)出現(xiàn)爆發(fā)性的需求增長。
在Gartner曲線當(dāng)中,3D傳感這個技術(shù)已經(jīng)越過了第一輪投資過熱階段,預(yù)計2~5年將會逐步進(jìn)入成熟期走向市場,所以是一個非常適合創(chuàng)業(yè)或者是投資的一個關(guān)鍵領(lǐng)域。

03
關(guān)鍵器件+電路層——存算一體化
由于摩爾定律發(fā)展極度放緩甚至停止,傳統(tǒng)通過做小來提高算力、降低成本的方式不再有效。另一方面,現(xiàn)有手機(jī)、個人電腦以及近年火熱的云計算服務(wù)器,它們內(nèi)部芯片都采用了1946年由馮諾伊曼提出的經(jīng)典計算體系結(jié)構(gòu),其性能提升也達(dá)到了一個極限。但是在未來AIOT的世代,數(shù)據(jù)呈現(xiàn)爆發(fā)時增長,除了在軟件側(cè)通過量化、剪枝、稀疏化等方法提高運(yùn)算速度外,如何從硬件及電路協(xié)同設(shè)計方面提出新的架構(gòu),來提高算力也是十分剛需的。

所謂馮諾依曼架構(gòu)就是處理器和數(shù)據(jù)存儲器是分開的,比如電腦中的CPU和內(nèi)存硬盤,從硬盤中讀取數(shù)據(jù),運(yùn)輸?shù)紺PU中計算處理,把處理后的數(shù)據(jù)放回緩存區(qū)或硬盤中。這樣運(yùn)算速度受到存儲器帶寬的影響,沒法再進(jìn)一步提升,不管處理器多快,存儲器的速度沒法再進(jìn)一步提升。這也就是經(jīng)典的存儲墻的問題。
另外一方面,數(shù)據(jù)搬運(yùn)的功耗過大。存儲器容量越來越大,從中間取出一個數(shù)的功耗也越來越大,基本是運(yùn)算的百倍。這就是典型的“功耗墻”問題。
而所謂“存算一體”是直接把存儲單元變成了運(yùn)算單元,利用了存儲器中的模擬計算。存算一體可以理解為一種計算器,一個類似于CPU的計算芯片,實際上是用存儲器去完成計算。即將龐大的參數(shù)矩陣固定在存儲器中,使乘加運(yùn)算通過模擬或數(shù)字的方式發(fā)生在存儲器中。有可能帶來理論千倍的能效比。這對于時延要求較高、功耗(能效比)要求較高、短時間內(nèi)需要有大量數(shù)據(jù)進(jìn)行處理的端側(cè)場景是天然適用的。

據(jù)統(tǒng)計,在全球訓(xùn)練芯片應(yīng)用上,2017年99%為云端市場,邊緣市場僅1%,而預(yù)計2023年邊緣市場占比24%,云端市場占比76%;在推理芯片應(yīng)用上,2017年云端市場占94%,邊緣市場占6%,2022年75%的邊緣設(shè)備將配有AI功能,邊緣市場將增長至43%,預(yù)計2025年邊緣側(cè)芯片將超過云端芯片,份額達(dá)到200億-300億美元。是一個相對很大的市場了。
目前,存算一體芯片主要用來做基于人工智能的運(yùn)算。人工智能的特點是向量和矩陣的計算量占比非常大,像可穿戴設(shè)備、手機(jī)、VR眼鏡、智能駕駛以及數(shù)據(jù)中心,不同的場景需要算力不一樣。
一般一個2M的存儲就可以提供足夠多的算法一定算力完成向量矩陣運(yùn)算,比當(dāng)前的芯片效率要高出50~100倍左右,用于可穿戴設(shè)備功耗可以很低,長待機(jī)。PC和移動終端需要大概32M、64M的存儲空間存儲算法,算力可以到16Tops~32Tops,實時性可以很高,另外在移動終端功耗限制下,可以很低功耗的去完成視覺信號處理這些AI算法。
智能眼鏡對低功耗需求很強(qiáng),它的電池很小散熱很差,但又需要很多人工智能方法進(jìn)行交互,包括手勢識別、語音識別、肌肉肌電的識別、眼動識別等,對AI的算力需求很高,基本需要到100多兆存儲空間,同時算力也很大。而自動駕駛對存算一體的要求是一個很高的場景,它除了算力要達(dá)標(biāo)外,可靠性也要達(dá)標(biāo),穩(wěn)定程度也是要達(dá)標(biāo),算力也很大,實時性對容錯率也很低,我認(rèn)為可能需要4~5年左右才能把存算一體芯片開發(fā)到可以滿足智能駕駛的使用。而對于數(shù)據(jù)中心的成本,一個是在芯片采購方面,另一半兒的成本實際是在降溫上,如果存算一體能夠在提供同樣大小算力情況下,把芯片的成本降低,功耗降低,實際上在數(shù)據(jù)中心有很大的優(yōu)勢。
另外,存算一體化減小了數(shù)據(jù)搬運(yùn)的能耗,提升里運(yùn)算效率。通過性能功耗的總結(jié)可以發(fā)現(xiàn),斯坦福團(tuán)隊提出的基于開關(guān)電容的數(shù)?;旌系拇嫠阋惑w架構(gòu)能夠?qū)崿F(xiàn)86%的識別準(zhǔn)確率和3.8微焦的單次識別能耗。

常見的實現(xiàn)存算一體化的硬件載體有浮柵晶體管和新型相變存儲器RRAM。其中浮柵晶體管,優(yōu)點是電流變化范圍大(pA~uA),使存算空間大、密度高、電流小、功耗低,而且已有30年的發(fā)展歷史,工藝成熟,可以與CMOS兼容。缺點是編程速度慢(微秒級), 可擦寫次數(shù)少;憶阻器是一種有記憶功能的非線性電阻,電阻可變范圍大,不需要反復(fù)移動數(shù)據(jù),可以并行處理大量信號,編程時間為10-1000ns,可擦寫次數(shù)達(dá)106-1012,適合機(jī)器學(xué)習(xí)系統(tǒng),但工藝未成熟,目前未能量產(chǎn)。
目前產(chǎn)業(yè)界最多的存算一體發(fā)展方向是把存儲單元變成一個做乘法加法運(yùn)算的東西,相當(dāng)于有多少個存儲單元就可以做多少個乘法加法運(yùn)算。如圖所示,以典型的存算一體化架構(gòu)為例,向量以電壓形式驅(qū)動陣列字線(行),利用電壓乘以電導(dǎo)等于電流,并且電流在位線(列)自然匯聚相加的電流定律,一次讀操作即可完成向量與矩陣的乘加操作。這種方法不但提高了矩陣乘法的并行度,而且避免了反復(fù)讀取權(quán)重,進(jìn)一步提高了架構(gòu)的能效比。

另一方面,存算一體硬件FLASH和RRAM的摩爾定律還沒有像MOSFET那樣卷,還有一定的節(jié)點縮減空間。這對于Fab廠是一個很好的價值空間點。

在更高精度方向有一個方向是做工藝優(yōu)化,過去存算一體都是直接拿存儲器的加工工藝實現(xiàn),并沒有針對存算一體去優(yōu)化精度。近幾年尤其近一年有非常多的存儲公司成立,資本也投入了很大,我相信未來幾年會有工藝上的優(yōu)化,尤其在代工廠層面會針對存算一體做優(yōu)化。另外一個是數(shù)?;旌线\(yùn)算是一種提高計算精度的架構(gòu),它的問題是通用性。
在實現(xiàn)更高算力的方向先進(jìn)封裝是更好的一種方式,比如現(xiàn)在非?;鸬?.5D封裝,可以把多個不同工藝的芯片放在一個大的硅基或者其他有機(jī)物基板上,可以理解成一個大芯片上承載了很多小芯片,并且這些不同的小芯片都采用不同的工藝。采用不同工藝的意義非常大,如果沒有這種先進(jìn)的2.5D封裝,意味著做一個大芯片時,所有的東西都要采用同一個工藝,像邏輯工藝必須在10納米以下才能跑的非???,成本很高,良率相對降低,收益不是那么大。最新AMD的芯片也都大量采用2.5D封裝,它的邏輯芯片以及緩存、其他模擬單元都采用不同的工藝,預(yù)計兩年后在很多小公司或者消費(fèi)電子產(chǎn)品上也可以采用這種技術(shù)。它的挑戰(zhàn)是未來兩三年內(nèi)要解決怎么形成一個標(biāo)準(zhǔn)的測試方法,尤其形成測試工具,現(xiàn)在沒有很好的一個產(chǎn)業(yè)鏈,沒有封裝、測試,也沒有標(biāo)準(zhǔn)化接口。
3D堆疊也是過去十年主要發(fā)展的一種先進(jìn)封裝,可以提升多層的存儲。目前3D堆疊在存儲器上用的最多,比如顯卡、固態(tài)硬盤,也有堆疊兩三個不同存儲器的。它的挑戰(zhàn)是如果標(biāo)準(zhǔn)品像存儲器用這種方案是一個比較標(biāo)準(zhǔn)的,成本不會增高,但像一些非標(biāo)準(zhǔn)的場景下,采用這種方式,有可能會增加很多研發(fā)成本及生產(chǎn)成本。
剛剛也說過了新型存儲器在電阻可變范圍、編程時間、可擦寫次數(shù)等方面都比現(xiàn)在的SRAM、FLASH更有優(yōu)勢。因此加大對于RRAM的材料、工藝、器件研究也是硬件端的一個很好的方向。
小貝殼的淺安時光
科技前沿
求職就業(yè)
薦書薦影
旅行攻略
