<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          軟件ISP將成為圖像處理未來?

          共 4334字,需瀏覽 9分鐘

           ·

          2023-09-21 21:53

          點(diǎn)擊下方卡片,關(guān)注“新機(jī)器視覺”公眾號

          視覺/圖像重磅干貨,第一時間送達(dá)

           

          從電子門鈴、網(wǎng)絡(luò)攝像頭,到手機(jī)、電腦、汽車,圖像傳感器已遍布我們生活中的各個角落,高清晰度、精細(xì)化的圖像已經(jīng)成為了消費(fèi)者的基本期望。


          在這些邊緣設(shè)備中,攝像頭收集到的圖像需要先由圖像信號處理器 (ISP)實時處理后再呈現(xiàn)給用戶。然而,如何在高效處理海量數(shù)據(jù)的同時又確保圖像質(zhì)量,對芯片制造商來說既是一個挑戰(zhàn),也是一個機(jī)會。


          一般來說,ISP 通常作為硬件組件來實現(xiàn),但最近,以色列的一家初創(chuàng)公司Visionary.ai開發(fā)了一種基于AI技術(shù)的軟件ISP,據(jù)稱可以有效地解決圖像中的噪聲和靈活性挑戰(zhàn)。


          其實,軟件定義圖像質(zhì)量這一理念早在Google Pixel中就開始盛行,從Pixel 2到Pixel 6,谷歌保留了相同的相機(jī)和鏡頭硬件,但將改進(jìn)重點(diǎn)放在圖像處理軟件上。那軟件ISP會成為圖像處理的新常態(tài)嗎?


          了解圖像信號處理器(ISP)


          首先讓我們來簡單了解下圖像信號處理器的工作原理。


          圖像傳感器由數(shù)百萬像素組成的半導(dǎo)體矩形構(gòu)成。這些像素小至1微米(1 x 10^-6m),并配備微小的彩色濾光片。在常見的“拜耳”濾光片陣列中,這些濾光片的顏色為紅、綠或藍(lán)。當(dāng)光子落在半導(dǎo)體表面上時,其中一部分將與硅原子發(fā)生量子相互作用,產(chǎn)生電子空穴對,并因此產(chǎn)生雖然小但可測量的電荷,一般而言,電荷量與落在像素上的光強(qiáng)度成比例。


          圖像信號處理器(ISP)從傳感器中獲取紅、綠、藍(lán)三色的原始數(shù)據(jù),并對其進(jìn)行如消除馬賽克效應(yīng)、調(diào)整顏色、消除鏡頭失真等多項校正處理,并進(jìn)行有效的數(shù)據(jù)壓縮。原始傳感器數(shù)據(jù)可能具有 12 到 24 位范圍內(nèi)的位深度,而輸出通常是 8 位 RGB 信號。


          目前,主流的ISP由幾家供應(yīng)商提供的IP模塊組成,通過高度并行的計算方式,將算法以硬編碼的方式加入到硬件中,因此成品的靈活性有限。


          圖像處理面臨兩大挑戰(zhàn):噪聲和靈活性


          圖像傳感器和ISP中的一個特定問題是噪聲,在許多情況下,這是系統(tǒng)設(shè)計的限制因素。


          噪聲的根本原因在于圖像傳感器本身,當(dāng)幾乎沒有光子被捕獲的低光照條件下此問題最為嚴(yán)重。當(dāng)落在傳感器上的光子減少,其與硅原子的相互作用也隨之變少,當(dāng)兩者不一致時,就會產(chǎn)生噪聲。為此,可以添加硅本身產(chǎn)生的熱噪聲——由此隨機(jī)產(chǎn)生電子空穴對,并可能被誤認(rèn)為是光子。噪聲來自對極低電荷水平進(jìn)行測量和數(shù)字化的過程。很明顯,噪聲會通過多種方式蔓延到系統(tǒng)中。


          大家都不喜歡嘈雜的圖片,因為這扭曲了大腦對圖像的理解能力。同樣,在機(jī)器視覺系統(tǒng)中,噪聲會阻礙性能,使算法更難以可靠地檢測物體。因此,對于人類和機(jī)器視覺,如果存在噪聲,它將限制設(shè)備在弱光下運(yùn)行的能力。此外,它還降低了系統(tǒng)處理高動態(tài)范圍圖片的能力(同一圖像中的極度明亮和黑暗)。


          當(dāng)然,在傳感器設(shè)計中有一些解決噪聲的方法,主要基于捕獲更多的光子來增加相對于噪聲的信號。例如,可以增大像素,但這要么需要更大、更昂貴的傳感器,要么需要降低圖像分辨率。當(dāng)硅的表面積增加時,透鏡的尺寸也會改變,因此我們最終會得到一種不太堅固且更難封裝的器件。另一種方法是增加曝光時間,但這顯然會導(dǎo)致幀率降低并增加運(yùn)動模糊的風(fēng)險。此外,我們也可以選擇消除噪音,目前市場上的 ISP 采用幾種不同的信號處理算法,但性能均存在局限性,例如,一些電流降噪器使圖像平滑,因此丟失了圖像中特征的清晰度。


          除了噪音性能不佳外,傳統(tǒng)ISP的另一個缺點(diǎn)是靈活性相對不足。將 ISP與傳感器相匹配的調(diào)優(yōu)過程,可能需要數(shù)周甚至數(shù)月。這項調(diào)優(yōu)任務(wù)會帶來巨大的成本壓力,并增加圖像系統(tǒng)工程項目的時間周期。


          軟件ISP,提升圖像質(zhì)量的關(guān)鍵


          以色列初創(chuàng)公司 Visionary.ai 開發(fā)的這種基于AI的軟件ISP,其圖像信號處理器是以軟件形式實現(xiàn),而且能夠比傳統(tǒng)算法檢測并消除更多的圖像噪聲。雖然許多計算機(jī)視覺研究人員正在開發(fā)更好的方法來檢測和識別圖像中的對象,但 Visionary.ai的創(chuàng)始人意識到,優(yōu)化ISP是提升圖像質(zhì)量的關(guān)鍵。一個高效的 ISP 能提供更高品質(zhì)的圖像數(shù)據(jù),從而增強(qiáng)如物體識別和圖像分割等AI任務(wù)的效能。


          解決“垃圾進(jìn)垃圾出”的問題已證明可提供更高的精度和改善機(jī)器視覺效果。至于智能手機(jī)或筆記本電腦視頻質(zhì)量等“人類視覺”應(yīng)用,Visionary.ai 的實時降噪器可以生成更清晰、更明亮的成像,并提供更準(zhǔn)確的著色。


          與其他降噪器不同,由 Visionary.ai 開發(fā)的 AI 降噪方法可實時消除噪聲,并能夠?qū)崿F(xiàn) 19dB 的信噪比增強(qiáng)。但是,為了消除最大噪聲量,AI 需要從圖像傳感器訪問原始信號,然后才能被 ISP 修改和壓縮。Visionary.ai 通過創(chuàng)建軟件ISP完全取代傳統(tǒng)硬件 ISP 來應(yīng)對這一挑戰(zhàn)(圖 1)。


          圖 1:軟件ISP實時消除最大噪聲量


          由于ISP和降噪功能采用軟件實現(xiàn),這表示在硬件設(shè)計中必須配備適當(dāng)?shù)挠嬎阗Y源。


          首先,降噪功能依賴于神經(jīng)網(wǎng)絡(luò)。其性能需求會隨工作負(fù)載、視頻幀速率以及圖像分辨率發(fā)生變化。在降噪器的早期研發(fā)階段,團(tuán)隊采用了Nvidia Jetson,這種計算平臺在性能方面有巨大優(yōu)勢,能夠不受限制地進(jìn)行實驗和研究。但從長遠(yuǎn)考慮,他們的目標(biāo)是開發(fā)一種既滿足硅片面積要求又在功率預(yù)算內(nèi)的解決方案,以適合廣泛應(yīng)用的技術(shù)和商業(yè)需求。


          當(dāng)談到AI,尤其是邊緣AI,人們常常會聯(lián)想到為多種推理任務(wù)設(shè)計的10、100甚至1000 TOPS的性能,但這顯然不適用于降噪應(yīng)用。新思科技的ARC EV7x系列是一系列的異構(gòu)嵌入式視覺處理器,它包括了可擴(kuò)展的矢量DSP核心和神經(jīng)網(wǎng)絡(luò)引擎。事實證明,Visionary.ai的降噪算法可以在新思科技 ARC EV72 處理器上非常有效地運(yùn)行,同時,他們還計劃在 ARC VPX矢量DSP和ARC NPX神經(jīng)處理單元的新版本上運(yùn)行。


          除了ISP算法和降噪功能外,系統(tǒng)還需要一個應(yīng)用處理器來執(zhí)行控制代碼。對于這種要求不高的工作負(fù)載,一個單核的32位處理器即可滿足需求,如新思科技 ARC HS系列(參見圖2)。


          圖 2:AI降噪器和軟件ISP可以

          使用傳感器的原始數(shù)據(jù)來優(yōu)化性能


          對于靈活性問題,軟件定義的ISP可以通過其噪聲和AI功能更快地進(jìn)行調(diào)諧,并且還可以在其生命周期內(nèi)更新以增強(qiáng)性能。當(dāng)供應(yīng)鏈中出現(xiàn)問題,或需使用不同的圖像傳感器模型時,基于新組件的系統(tǒng)重新設(shè)計變得更為簡便。


          隨著調(diào)諧執(zhí)行速度更快、成本更低,進(jìn)行應(yīng)用特定的調(diào)諧已變得可行。例如,針對特定農(nóng)業(yè)應(yīng)用中對綠色細(xì)節(jié)的精準(zhǔn)捕獲,或醫(yī)療場景中更準(zhǔn)確的紅色識別,都可以進(jìn)行精細(xì)化的優(yōu)化。


          寫在最后


          搭乘新思科技的ARC EV72 處理器的快船,Visionary.ai帶降噪器的軟件ISP已經(jīng)正式面市,這為消費(fèi)類電子產(chǎn)品和安全攝像頭的設(shè)計帶來了新的可能性。同時,他們也瞄準(zhǔn)了汽車、無人機(jī)以及醫(yī)療行業(yè)等多個領(lǐng)域。


          軟件定義汽車、軟件定義手機(jī)……軟件定義的原則正在整個科技領(lǐng)域傳播。雖然軟件圖像處理可能仍處于起步階段,但憑借其優(yōu)勢和靈活性,并且隨著邊緣人工智能和人工智能成像的發(fā)展,軟件ISP正在獲得越來多廠商的關(guān)注。


          來源:半導(dǎo)體行業(yè)觀察

          如需轉(zhuǎn)載請注明以上內(nèi)容

          聲明:部分內(nèi)容來源于網(wǎng)絡(luò),僅供讀者學(xué)習(xí)、交流之目的文章版權(quán)歸原作者所有。如有不妥,請聯(lián)系刪除。


          —THE END—

          瀏覽 1747
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  强开小嫩苞一区二区三区图片 | 爽好紧别夹喷水一区二区 | 日日干夜夜爽 | 欧美 亚洲 日韩 国产 高清 | 欧美性爱日韩 |