<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          圖像處理,計算機(jī)視覺和人工智能之間的差異

          共 3847字,需瀏覽 8分鐘

           ·

          2021-03-31 10:25

          點擊上方小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時間送達(dá)

          本文轉(zhuǎn)自:AI算法與圖像處理


          圖像處理和計算機(jī)視覺是超級令人興奮的研究和研究領(lǐng)域。隨著人工智能的進(jìn)步,這兩個領(lǐng)域都在不斷發(fā)展。
          你會發(fā)現(xiàn)任何以AI和計算機(jī)視覺命名的產(chǎn)品在創(chuàng)造每個智能系統(tǒng)中都起著重要作用。下面將提供了一些有意思的鏈接,可以在本文的最后使用該程序,你可以自己嘗試并體驗這些顛覆性技術(shù)如何改變世界前后的工作方式。
          因此,在本文中,我將幫助你了解圖像處理,計算機(jī)視覺和人工智能之間的區(qū)別。
          我提出了一個有趣的情況,這將有助于你非常輕松地理解所有這三個主題。
          “所以,在假期你決定對兩只寵物狗”Shimmy“和”Pluto“訓(xùn)練過程拍照,在你美麗的花園里進(jìn)行一場比賽?!癝himmy”必須在拿球后走左路,”Pluto“應(yīng)該走右邊的路線。


           圖像處理


          你拍了數(shù)百張照片,很快就完成了拍攝照片,現(xiàn)在你希望在社交媒體上上傳完美的照片。

          但在發(fā)布圖像之前,你希望圖像看起來更加完美,并且你還希望告訴你的朋友,圖像是在周日早上7點拍攝的,并在圖像上打印出可愛的寵物名稱作為主題標(biāo)簽。

          要完成上述所有操作,你決定通過圖像編輯移動應(yīng)用程序傳遞圖像,該應(yīng)用程序在后端運行多個功能,并在每個功能中運行圖像處理算法,該算法將你的圖像作為輸入對圖像執(zhí)行數(shù)學(xué)運算,如在算法中并給出所需的輸出圖像。如下圖所示,你可以看到重新分布的色調(diào)級別(伽馬校正),輸出圖像和嵌入其中的文本。

          左圖像是輸入圖像,右圖像是處理圖像

          這是我的圖像處理代碼的鏈接,它很容易和有趣的嘗試自己。https://github.com/PallawiSinghal/AI_Starter/blob/master/image_processing.ipynb


          計算機(jī)視覺


          現(xiàn)在,你希望獎勵你的寵物“Shimmy”和“Pluto”作為獲勝者和亞軍,根據(jù)誰在他們的嘴里抓住紅蘋果或黃色圓盤的最大次數(shù)并將它們返回給你在他們各自的軌道上移動 ,左邊是“Shimmy”,右邊是“Pluto”(游戲規(guī)則)。


          你可以通過查看上面的圖像來輕松決定Shimmy是贏家,但如果你每天玩50次游戲而且每周玩7天,該怎么辦?


          然后通過查看圖像決定誰是勝者,現(xiàn)在數(shù)量已增加到每周350張圖像變成一項艱巨的任務(wù)。

          所以,現(xiàn)在你必須建立一個計算機(jī)視覺系統(tǒng)來自動化你的工作。

          因此,CV(計算機(jī)視覺)系統(tǒng)的第一步應(yīng)該對350的每個圖像進(jìn)行詳細(xì)分析。


          分析階段

          這項分析的目的是找到一個通用的解決方案,不僅僅是幾百個圖像,而是多年來的許多圖像。

          我們在圖像中必須尋找的是大多數(shù)時候?qū)櫸锶绾纬霈F(xiàn)在圖像中的模式。就像這里“Shimmy”在左側(cè)軌道,“Pluto”在右側(cè)。


          此外,深入分析圖像質(zhì)量,如圖像中局部和全局噪聲的數(shù)量,對比度增強(qiáng)的要求和邊緣保存。在圖像中需要和容易分割。此外,哪些圖像的特征是提取以找到帶球的寵物,其可以是球的形狀或狗的顏色。


          現(xiàn)在計算機(jī)視覺主要是兩個主要的事情,分析和圖像處理算法,你選擇聯(lián)合起來得出這樣的結(jié)論,誰是兩個寵物中的勝利者。


          圖像處理算法在對大量數(shù)據(jù)進(jìn)行詳細(xì)分析后智能地進(jìn)行分組,以給出正確的結(jié)果,例如每只寵物抓住球的次數(shù),是否公平,何時以及為什么寵物未能接球,能接到球最大或最小高度,以及如果給定任何輸入圖像來定義計算機(jī)視覺系統(tǒng)。它是關(guān)于概括或提供結(jié)合許多圖像處理算法的可擴(kuò)展解決方案。


          由于圖像處理輔助計算機(jī)視覺從圖像中獲取更有意義的信息,因此它還使開發(fā)人員的分析質(zhì)量極其獨立,負(fù)責(zé)開發(fā)通用解決方案,以便通過CV系統(tǒng)獲得較不相似的測試圖像的準(zhǔn)確輸出。


          在下面的圖像中,你可以看到我發(fā)現(xiàn)“Shimmy”有黃色圓盤。我通過執(zhí)行圖像分割,輪廓搜索,凸包檢測,多邊形逼近,將多邊形映射到空白圖像并最終使用模板匹配檢測黃色圓盤來完成此操作。


          左圖是輸入圖像,中間圖像是掩模(如果你不斷看圖像一段時間你可以找到從中心到角的強(qiáng)度差異),右圖是背景圖像(這個背景) 使用非常著名的OpenCV函數(shù)“Grabcut”完成刪除(前景和背景分割)

          第一個圖像是上面最右邊圖像的模糊圖像,這里使用的模糊像處理算法,用于邊緣保存和噪聲消除。第二幅圖像是灰度圖像。第三圖像是閾值圖像,也稱為二值圖像。第四個圖像是第三個圖像的輪廓圖像(簡單地說,我們試圖在所有顏色為白色的物體上繪制邊界,其中也包括寵物),在最后一個圖像中,我們通過周長逼近最大輪廓使用凸包,這里最大的輪廓將是寵物的輪廓,并在圖像上繪制近似的形狀,多邊形

          左圖像是該步驟的輸入圖像,我們制作近似的小掩模(中心圖像)以將寵物多邊形轉(zhuǎn)移(也稱為翹曲,wrapping)到小圖像(中心圖像)上。翹曲后的結(jié)果看起來像右圖

          左圖是這里的輸入,我們使用黃色光盤的小模板圖像在此圖像上進(jìn)行模板匹配,如下圖所示。模板匹配是一種算法,模板圖像從輸入圖像的頂部到底部移動,輸入圖像是我們情況下最左邊的圖像,并在輸入圖像中找到最佳匹配部分。模板匹配的輸出將是中心圖像,因為你可以看到圖像中最亮和閃亮的部分是黃色光盤所在的位置。因此,我們在最右邊的圖像上繪制一個框。

          模板圖片


          人工智能


          如果你選擇硬閾值來檢測“Shimmy”,“Pluto”或黃色圓盤,例如應(yīng)用半自動分割(OpenCV grab cut),模板匹配,決定寵物應(yīng)移動的軌道,則此設(shè)計的系統(tǒng)可能缺乏可擴(kuò)展性或?qū)櫸锷眢w的顏色閾值。你最終可能會創(chuàng)建一個只能識別“Shimmy”和“Pluto”的有偏見系統(tǒng)。

          你將無法將你的CV系統(tǒng)交給世界,以便在不同的狗或貓身上得到相同的結(jié)果,因為規(guī)則和特征只偏向于“Shimmy”和“Pluto”。

          人工智能“救世主”提供圖像處理,計算機(jī)視覺算法和機(jī)器學(xué)習(xí)算法,以幫助你像魔術(shù)一樣推廣系統(tǒng)。

          它是一個像我們的大腦這樣的系統(tǒng),它通過不斷地查看周圍的事物來智能,合理和準(zhǔn)確地采取它所學(xué)習(xí)的任何決策,這只不過是數(shù)據(jù),并且通過隨時間學(xué)習(xí)的反饋和經(jīng)驗來更新所獲得的知識。

          就像你在教育系統(tǒng)中長大的學(xué)習(xí)一樣,你的老師教你用圖像來區(qū)分世俗的東西,給你的大腦喂兩個輸入,一個是圖像,第二個是正確的特征描述,它的外觀和位置在圖片。

          同樣,如果我們想為上述類比構(gòu)建一個AI系統(tǒng),我們需要使用圖像處理算法提供預(yù)處理的圖像,并告訴他們你想要檢測的球,圓盤,蘋果,狗或任何東西的位置并存在于圖像中。

          然后,一旦圖像和圖像的內(nèi)容,信息被提供給系統(tǒng),計算機(jī)視覺就會出現(xiàn)在圖片中。

          AI由多層組成,就像一包面包一樣,每層運行一個計算機(jī)視覺算法,其工作是從圖像中提取特征。

          在前幾層中,我們提取圖像上的直線或曲線邊緣等低級特征,然后在它學(xué)習(xí)檢測眼睛,蘋果,爪子,尾巴以及后來完成的每層中提取所有提取的特征。狗或貓。稍后你將使用這些學(xué)習(xí)卷積核來預(yù)測新數(shù)據(jù)集上的對象,該數(shù)據(jù)集也稱為測試數(shù)據(jù)集。


          以上圖片由https://www.cc.gatech.edu/~hays/compvision/proj6/提供,可以在此處查看圖層的外觀以及每層的特征提取方式。

          當(dāng)然有數(shù)學(xué)方程式。但是,讓我向你保證,他們很容易,你可以做到。

          并且所有的學(xué)習(xí)都保存在模型中,就像我們的學(xué)習(xí)保存在我們的大腦中一樣,它是通用的,可以用于任何其他數(shù)據(jù)。

          構(gòu)建AI解決方案的一個非常關(guān)鍵的輸入是數(shù)據(jù)。想象一下,你需要付出的努力才能創(chuàng)造出一個狗在世界各地玩球的數(shù)據(jù)集(沒有差錯的數(shù)據(jù)集)。

          因此,綜合圖像處理,計算機(jī)視覺和機(jī)器學(xué)習(xí)三個形成了一個你身邊所聽到,看到和體驗到的人工智能系統(tǒng)。


          總結(jié)


          我試圖解決一個非常簡單但非常重要的話題,這個領(lǐng)域的每個初學(xué)者都想要理解。當(dāng)我開始學(xué)習(xí)這個領(lǐng)域時,我總是有這個問題,而且我發(fā)現(xiàn)很少有人明確地回答我的問題。我希望我能幫到你。我強(qiáng)烈建議你為每個部分運行我的代碼。它非常簡單,有助于在你對這些廣泛主題的想法中建立清晰度。


          下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
          在「小白學(xué)視覺」公眾號后臺回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

          下載2:Python視覺實戰(zhàn)項目52講
          小白學(xué)視覺公眾號后臺回復(fù):Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學(xué)校計算機(jī)視覺。

          下載3:OpenCV實戰(zhàn)項目20講
          小白學(xué)視覺公眾號后臺回復(fù):OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。

          交流群


          歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN算法競賽等微信群(以后會逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~


          瀏覽 34
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  在线免费观看黄片小视 | 国产9在线观看 | 国产精品探花熟女AV | 学生妹色视频毛多水多 | 五月激情丁香 |