<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          非常好用的Python圖像增強(qiáng)工具,適用多個(gè)框架

          共 5843字,需瀏覽 12分鐘

           ·

          2021-03-15 10:26

          點(diǎn)擊上方小白學(xué)視覺(jué)”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時(shí)間送達(dá)

          作者:mdbloice

          編譯:ronghuaiyang

          圖像增強(qiáng)是CV領(lǐng)域非常常用的技術(shù),這里找到一個(gè)非常好用的圖像增強(qiáng)的工具,可以用于Pytorch和Keras,而且功能強(qiáng)大,使用簡(jiǎn)單,更重要的是可以成對(duì)的進(jìn)行圖像增強(qiáng),簡(jiǎn)直是實(shí)戰(zhàn)利器,有了這個(gè),媽媽再也不用擔(dān)心我的數(shù)據(jù)不夠了。

          Augmentor是一個(gè)Python的圖像增強(qiáng)庫(kù)。這是一個(gè)獨(dú)立的庫(kù),不依賴(lài)與某個(gè)平臺(tái)或某個(gè)框架,非常的方便,可以進(jìn)行細(xì)粒度的增強(qiáng)控制,而且實(shí)現(xiàn)了大部分的增強(qiáng)技術(shù)。使用了隨機(jī)的方法來(lái)構(gòu)建基礎(chǔ)的模塊,用戶(hù)可以把這些模塊組成pipline使用。

          安裝

          Augmentor是Python寫(xiě)的。還有一個(gè)Julia的版本,鏈接:https://github.com/Evizero/Augmentor.jl

          使用pip安裝:

          pip install Augmentor

          從源碼安裝的話,請(qǐng)看編譯文檔。升級(jí)版本的話:

          pip install Augmentor --upgrade
          文檔

          完整的文檔鏈接: http://augmentor.readthedocs.io

          快速指南和使用

          Augmentor的目的是進(jìn)行自動(dòng)的圖像增強(qiáng)(生成人造數(shù)據(jù))為了擴(kuò)展數(shù)據(jù)集作為機(jī)器學(xué)習(xí)算法的輸入,特別是神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。

          這個(gè)包通過(guò)創(chuàng)建一個(gè)增強(qiáng)的pipeline,即定義一系列的操作。這些操作有比如旋轉(zhuǎn)和變換,一個(gè)加一個(gè)成為一個(gè)增強(qiáng)的pipeline,當(dāng)完成的時(shí)候,pipeline可以執(zhí)行,增強(qiáng)之后的數(shù)據(jù)也創(chuàng)建成功。

          開(kāi)始時(shí),需要初始化pipeline對(duì)象,指向一個(gè)文件夾。

            import Augmentor  p = Augmentor.Pipeline("/path/to/images")

          然后可以在pipeline對(duì)象中添加操作:

          p.rotate(probability=0.7, max_left_rotation=10, max_right_rotation=10p.zoom(probability=0.5, min_factor=1.1, max_factor=1.5)

          每個(gè)函數(shù)需要制定一個(gè)概率,用來(lái)決定是否需要對(duì)這個(gè)圖像進(jìn)行這個(gè)操作。

          一旦你創(chuàng)建了pipeline,可以從中進(jìn)行采樣,就像這樣:

          p.sample(10000)

          這樣會(huì)產(chǎn)生10000個(gè)增強(qiáng)之后的圖像。默認(rèn)會(huì)寫(xiě)到指定文件夾中的名為output的目錄中,這個(gè)指定文件夾就是初始化時(shí)指定的那個(gè)。

          如果你想進(jìn)行一次圖像的增強(qiáng)操作,可以使用process():

          p.process()

          這個(gè)函數(shù)在進(jìn)行數(shù)據(jù)集縮放的時(shí)候會(huì)有用。可以創(chuàng)建一個(gè)pipeline,其中所有的操作的概率都設(shè)置為1,然后使用process()方法。

          多線程

          Augmentor (version >=0.2.1) 現(xiàn)在使用多線程技術(shù)來(lái)提高速度。

          對(duì)于原始圖像非常小的圖像來(lái)說(shuō),某些pipeline可能會(huì)變慢。如果發(fā)現(xiàn)這種情況,可以設(shè)置multi_threaded為False。

          p.sample(100, multi_threaded=False)

          默認(rèn)的情況下,sample()函數(shù)是使用多線程的。這個(gè)只在保存到磁盤(pán)的時(shí)候?qū)崿F(xiàn)。生成器也會(huì)在下個(gè)版本使用多線程。

          Ground Truth數(shù)據(jù)

          圖像可以?xún)蓚€(gè)一組的通過(guò)pipeline,所以ground truth的圖像可以同等的進(jìn)行增強(qiáng)。

          Original image and mask[3]Augmented original and mask images

          為了并行的對(duì)原始數(shù)據(jù)進(jìn)行g(shù)round truth的增強(qiáng),可以使用ground_truth()方法增加一個(gè)ground truth的文件夾到pipeline中:

          p = Augmentor.Pipeline("/path/to/images")# Point to a directory containing ground truth data.# Images with the same file names will be added as ground truth data# and augmented in parallel to the original data.p.ground_truth("/path/to/ground_truth_images")# Add operations to the pipeline as normal:p.rotate(probability=1, max_left_rotation=5, max_right_rotation=5)p.flip_left_right(probability=0.5)p.zoom_random(probability=0.5, percentage_area=0.8)p.flip_top_bottom(probability=0.5)p.sample(50)
          多掩模/圖像增強(qiáng)

          使用DataPipeline類(lèi) (Augmentor version >= 0.2.3),可以對(duì)有多個(gè)相關(guān)的掩模的圖像進(jìn)行增強(qiáng):

          Multiple Mask Augmentation

          任意長(zhǎng)度的圖像列表都可以成組的通過(guò)pipeline,并且使用DataPipeline類(lèi)同樣的進(jìn)行增強(qiáng)。這個(gè)對(duì)于ground truth圖像有好幾個(gè)掩模的時(shí)候非常有用。舉個(gè)例子。

          下面的例子中,圖像和掩模包含在一個(gè)images的數(shù)據(jù)結(jié)構(gòu)中,對(duì)應(yīng)的標(biāo)簽在y中:

          p = Augmentor.DataPipeline(images, y)p.rotate(1, max_left_rotation=5, max_right_rotation=5)p.flip_top_bottom(0.5)p.zoom_random(1, percentage_area=0.5)augmented_images, labels = p.sample(100)

          DataPipeline直接返回圖像,并不存儲(chǔ)在磁盤(pán)中,也不從磁盤(pán)中讀取數(shù)據(jù)。圖像通過(guò)初始化直接傳到DataPipeline中。images的數(shù)據(jù)結(jié)構(gòu)的創(chuàng)建細(xì)節(jié),可以參考https://github.com/mdbloice/Augmentor/blob/master/notebooks/Multiple-Mask-Augmentation.ipynb。

          Keras和Pytorch的生成器

          如果你不想將圖像存儲(chǔ)到硬盤(pán)中,可以使用生成器,generator,使用Keras的情況:

          g = p.keras_generator(batch_size=128)images, labels = next(g)

          返回的圖像的batchsize是128,還有對(duì)應(yīng)的labels。Generator返回的數(shù)據(jù)是不確定的,可以用來(lái)在線生成增強(qiáng)的數(shù)據(jù),用在訓(xùn)練神經(jīng)網(wǎng)絡(luò)中。

          同樣的,你可以使用Pytorch:

          import torchvisiontransforms = torchvision.transforms.Compose([   p.torch_transform(),   torchvision.transforms.ToTensor(),])
          彈性畸變

          使用彈性畸變,一張圖像可以生成許多圖像。

          Input Image
          Augmented Images

          這個(gè)輸入圖像有一個(gè)像素寬的黑邊,表明了在進(jìn)行畸變的時(shí)候,沒(méi)有改變尺寸,也沒(méi)有在新的圖像上進(jìn)行任何的padding。

          具體的功能可以在這里看到:

          Original Image[1]Random distortions applied

          透視變換

          總共有12個(gè)不同類(lèi)型的透視變換。4中最常用的如下:

          Tilt LeftTilt RightTilt ForwardTilt Backward

          剩下的8種透視變換:

          Skew Type 0Skew Type 1Skew Type 2Skew Type 3
          Skew Type 4Skew Type 5Skew Type 6Skew Type 7

          保持大小的旋轉(zhuǎn)

          默認(rèn)保持原始文件大小的旋轉(zhuǎn):

          Original ImageRotated 10 degrees, automatically cropped

          對(duì)比其他軟件的旋轉(zhuǎn):

          Original ImageRotated 10 degrees
          保持大小的剪切

          剪切的同時(shí)也會(huì)自動(dòng)從剪切圖像中裁剪正確的區(qū)域,所以圖像中沒(méi)有黑的區(qū)域或者padding。

          Original imageShear (x-axis) 20 degreesShear (y-axis) 20 degrees

          對(duì)比普通的剪切操作:

          Original imageShear (x-axis) 20 degreesShear (y-axis) 20 degrees
          裁剪

          裁剪同樣也使用了一種更加適合機(jī)器學(xué)習(xí)的方法:

          Original imageRandom crops + resize operation

          隨機(jī)擦除

          隨機(jī)擦除是一種使模型對(duì)遮擋更加魯棒的技術(shù)。這個(gè)對(duì)使用神經(jīng)網(wǎng)絡(luò)訓(xùn)練物體檢測(cè)的時(shí)候非常有用:

          Original image[2]Random Erasing

          Pipeline.random_erasing() 文檔了解更多的用法。

          把操作串成Pipeline

          使用幾個(gè)操作,單個(gè)圖像可以增強(qiáng)成許多的新圖像,對(duì)應(yīng)同樣的label:

          Original imageDistortions + mirroring

          在上面的例子中,我們使用了3個(gè)操作:首先做了畸變操作,然后進(jìn)行了左右的鏡像,概率為0.5,最后以0.5的概率做了上下的翻轉(zhuǎn)。然后從這個(gè)pipeline中采樣了100次,得到了100個(gè)數(shù)據(jù)。

          p.random_distortion(probability=1, grid_width=4, grid_height=4, magnitude=8)p.flip_left_right(probability=0.5)p.flip_top_bottom(probability=0.5)p.sample(100)
          使用生成器和Keras集成
          Augmentor 可以用來(lái)替換Keras中的augmentation功能。Augmentor 可以創(chuàng)建一個(gè)生產(chǎn)器來(lái)產(chǎn)生增強(qiáng)后的圖像,細(xì)節(jié)可以查看下面的notebook:
          • 從本地文件夾中讀取圖像進(jìn)行增強(qiáng),然后使用生成器將增強(qiáng)的圖像流送到卷積神經(jīng)網(wǎng)絡(luò)中,參見(jiàn) https://github.com/mdbloice/Augmentor/blob/master/notebooks/Augmentor_Keras.ipynb

          • 增強(qiáng)內(nèi)存中的圖像,使用生成器將新的圖像送到Keras的網(wǎng)絡(luò)中,參見(jiàn) https://github.com/mdbloice/Augmentor/blob/master/notebooks/Augmentor_Keras_Array_Data.ipynb

          Augmentor 允許每個(gè)類(lèi)定義不同的pipelines,這意味著你可以在分類(lèi)問(wèn)題中為不同的類(lèi)別定義不同的增強(qiáng)策略。

          例子在這里:https://github.com/mdbloice/Augmentor/blob/master/notebooks/Per_Class_Augmentation_Strategy.ipynb

          完整的例子

          我們可以使用一張圖像來(lái)完成一個(gè)增強(qiáng)的任務(wù),演示一下Augmentor的pipeline和一些功能。

          首先,導(dǎo)入包,初始化Pipeline對(duì)象,指定一個(gè)文件夾,這個(gè)文件夾里放著你的圖像。

          import Augmentorp = Augmentor.Pipeline("/home/user/augmentor_data_tests")

          然后你可以在pipeline中添加各種操作:

          p.rotate90(probability=0.5)p.rotate270(probability=0.5)p.flip_left_right(probability=0.8)p.flip_top_bottom(probability=0.3)p.crop_random(probability=1, percentage_area=0.5)p.resize(probability=1.0, width=120, height=120)

          操作添加完了之后,可以進(jìn)行采樣:

          p.sample(100)

          其中的幾個(gè)

          Input Image[3]
          Augmented Images

          增強(qiáng)的圖像對(duì)邊緣檢測(cè)任務(wù)也許很有用。

          下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
          在「小白學(xué)視覺(jué)」公眾號(hào)后臺(tái)回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺(jué)、目標(biāo)跟蹤、生物視覺(jué)、超分辨率處理等二十多章內(nèi)容。

          下載2:Python視覺(jué)實(shí)戰(zhàn)項(xiàng)目52講
          小白學(xué)視覺(jué)公眾號(hào)后臺(tái)回復(fù):Python視覺(jué)實(shí)戰(zhàn)項(xiàng)目,即可下載包括圖像分割、口罩檢測(cè)、車(chē)道線檢測(cè)、車(chē)輛計(jì)數(shù)、添加眼線、車(chē)牌識(shí)別、字符識(shí)別、情緒檢測(cè)、文本內(nèi)容提取、面部識(shí)別等31個(gè)視覺(jué)實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺(jué)。

          下載3:OpenCV實(shí)戰(zhàn)項(xiàng)目20講
          小白學(xué)視覺(jué)公眾號(hào)后臺(tái)回復(fù):OpenCV實(shí)戰(zhàn)項(xiàng)目20講,即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。

          交流群


          歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺(jué)、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱(chēng)+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺(jué)SLAM“。請(qǐng)按照格式備注,否則不予通過(guò)。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~


          瀏覽 52
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩三级视频在线观看 | 大香蕉伊人婷婷 | 特黄特色网站 | 污污网一区二区三区 | 淫色淫色淫色淫色淫色淫色淫 |