青青免费在线观看激情视频,青青草23视频,欧美亚洲国产一区导航,91白丝在线观看,精品久久久久99水蜜桃,一本大道DVD中文字幕,麻豆国产97在线

簡介

隨著數(shù)字圖像數(shù)量的增加，對高質量的圖像需求也在增加。然而，現(xiàn)代相機拍攝的圖像會因噪聲而退化。圖像中的噪聲是圖像中顏色信息的失真，噪聲是指數(shù)字失真。當在夜間拍攝時，圖像變得更嘈雜。該案例研究試圖建立一個預測模型，該模型將帶噪圖像作為輸入并輸出去噪后的圖像。

深度學習的使用

這個問題是基于計算機視覺的，CNN等深度學習技術的進步已經(jīng)能夠在圖像去噪方面提供最先進的性能，用于執(zhí)行圖像去噪的模型是DnCNN（去噪卷積神經(jīng)網(wǎng)絡）。

數(shù)據(jù)集

BSD300和BSD500數(shù)據(jù)集均用作訓練數(shù)據(jù)，BSD68用于驗證數(shù)據(jù)。由于數(shù)據(jù)有限，每個圖像使用了4次，即縮放到[1.0,0.7,0.8,0.7]。

每個縮放圖像被分割成50x50的塊，步幅為20。每個貼片都添加了一個標準偏差在[1,55]之間的高斯噪聲。數(shù)據(jù)生成代碼如下所示：

#Fix Noisestddevs = np.random.uniform(1, 55.0, 125000)[:, np.newaxis, np.newaxis, np.newaxis]noise = np.random.normal(loc = 0, scale=stddevs, size=(125000, 50, 50, 3)).astype(np.float16)
def get_dataset(img_path):def image_generator():        patch_size = 50        stride = 20        index = 0for scale in [1, 0.9, 0.8, 0.7]:for path in img_path:                true_img = cv2.imread(path)for i in range(0, true_img.shape[0] - patch_size + 1, stride):for j in range(0, true_img.shape[1] - patch_size + 1, stride):                        Y = true_img[i:i+patch_size, j:j+patch_size]                        gauss_noise = noise[index].astype(np.float32)                        X = np.clip(Y + gauss_noise, 0, 255.0)                        index = (index + 1)%125000yield (X/255.0,),Y/255.0return tf.data.Dataset.from_generator(image_generator, output_signature=((tf.TensorSpec(shape=(None, None, 3)),),                                                                             (tf.TensorSpec(shape=(None, None, 3)))))

DnCNN體系結構

DnCNN中有三種類型的層：

Conv+ReLU：過濾器大小為3，過濾器數(shù)量為64，跨步為1，使用零填充保持卷積后的輸出形狀，使用ReLU作為激活函數(shù)。輸出為形狀（批量大小，50、50、64）
Conv+批量歸一化+ReLU：過濾器大小為3，過濾器數(shù)量為64，步長為1，使用零填充保持卷積后的輸出形狀，使用批量歸一化層更好地收斂，ReLU作為激活函數(shù)。輸出為形狀（批次大小，50、50、64）。
Conv：濾鏡大小為3，跨步為1，濾鏡數(shù)量為c（彩色圖像為3個，灰度圖像為1個），使用零填充在卷積后保持輸出形狀。輸出形狀為（批次大小，50，50，c）。

DnCNN模型的輸出為殘差圖像。因此，原始圖像=噪聲圖像-殘差圖像。

在DnCNN中，在每層卷積之前填充零，以確保中間層的每個特征貼圖與輸入圖像具有相同的大小。根據(jù)本文，簡單的零填充策略不會導致任何邊界偽影。

本文建議深度為17，但本案例研究適用于深度為12和深度為8。

評價指標

評估指標是PSNR（峰值信噪比）分數(shù)。它只是一個數(shù)值，表示構造的去噪圖像與原始圖像相比有多好。

模型訓練

def get_model(depth, channels):noise_inp = tf.keras.layers.Input(shape = (50, 50, channels), dtype=tf.float32)init = 'Orthogonal'
y = tf.keras.layers.Conv2D(filters = 64, kernel_size = 3, padding = 'same', kernel_initializer=init, use_bias=True)(noise_inp)y = tf.keras.layers.ReLU()(y)for i in range(1, depth-1):y = tf.keras.layers.Conv2D(filters = 64, kernel_size = 3, padding = 'same', kernel_initializer=init, use_bias=True)(y)bn = tf.keras.layers.BatchNormalization(axis=-1, epsilon=1e-5, momentum=0.9)y = bn(y)y = tf.keras.layers.ReLU()(y)residual = tf.keras.layers.Conv2D(filters = channels, kernel_size = 3, padding = 'same', kernel_initializer=init, use_bias=True)(y)
true_img = tf.keras.layers.Subtract()([noise_inp, residual])model = tf.keras.Model(inputs = [noise_inp], outputs=[true_img])model.compile(optimizer=tf.keras.optimizers.Adam(), loss='mse')
return model
def lr_decay(epoch):lr = 1e-3if epoch+1 > 20:lr/=30elif epoch+1 > 10:lr /= 10return lrmodel = get_model(8, 3)lr_callback = tf.keras.callbacks.LearningRateScheduler(lr_decay)dataset = get_dataset(bsd500).shuffle(1000).batch(128).prefetch(tf.data.experimental.AUTOTUNE).repeat(None)model.compile(optimizer=tf.keras.optimizers.Adam(), loss='mse')history = model.fit(x = dataset, steps_per_epoch=2000, epochs=30, shuffle=True,verbose=1,callbacks=[lr_callback])

批量大小=128，每個歷元的步數(shù)=2000，歷元數(shù)=30。

結果

BSD68數(shù)據(jù)集上的峰值信噪比對于標準差25為~28，對于標準差50為~25。

如果深度=12，則BSD68數(shù)據(jù)集上的峰值信噪比對于標準差25為28.30，對于標準差50為26.13。

應用：視頻去噪

我們可以將這個想法擴展到視頻幀，每個幀作為輸入傳遞給DnCNN模型，生成的幀傳遞給視頻編寫器。

import sysimport tensorflow as tfimport numpy as npimport cv2import timeimport matplotlib.pyplot as pltimport osimport globimport seaborn as snbimport refrom skvideo.io import FFmpegWriter

class Denoiser:def __init__(self, merge_outputs):        self.model = tf.keras.models.load_model('./model')        self.merge_outputs = merge_outputs
def get_patches(self, frame):        patches = np.zeros(shape=(self.batch_size, 50, 50, 3))        counter = 0for i in range(0, self.SCALE_H, 50):for j in range(0, self.SCALE_W, 50):                patches[counter] = frame[i:i+50, j:j+50]                counter+=1return patches.astype(np.float32)
def reconstruct_from_patches(self, patches, h, w, true_h, true_w, patch_size):        img = np.zeros((h,w, patches[0].shape[-1]))        counter = 0for i in range(0,h-patch_size+1,patch_size):for j in range(0,w-patch_size+1,patch_size):                img[i:i+patch_size, j:j+patch_size, :] = patches[counter]                counter+=1return cv2.resize(img, (true_w, true_h), cv2.INTER_CUBIC)
def denoise_video(self, PATH):        self.cap = cv2.VideoCapture(PATH)        self.H, self.W = int(self.cap.get(4)), int(self.cap.get(3))        self.SCALE_H, self.SCALE_W = (self.H//50 * 50), (self.W//50 * 50)        self.batch_size = ((self.SCALE_H * self.SCALE_W) // (50**2))
        outputFile = './denoise.mp4'        writer = FFmpegWriter(        outputFile,            outputdict={'-vcodec':'libx264','-crf':'0','-preset':'veryslow'        }        )
while True:            success, img = self.cap.read()if not success:break            resize_img = cv2.resize(img, (self.SCALE_W, self.SCALE_H), cv2.INTER_CUBIC).astype(np.float32)
            noise_img = resize_img/255.0            patches = self.get_patches(noise_img).astype(np.float32)            predictions = np.clip(self.model(patches), 0, 1)            pred_img = (self.reconstruct_from_patches(predictions, self.SCALE_H,                                                      self.SCALE_W, self.H, self.W, 50)*255.0)if self.merge_outputs:                merge = np.vstack([img[:self.H//2,:,:], pred_img[:self.H//2,:,:]])                writer.writeFrame(merge[:,:,::-1])else:                writer.writeFrame(pred_img[:,:,::-1])        writer.close()
PATH = sys.argv[1]print(f"Path is : {PATH}")denoise = Denoiser(merge_outputs = True)x = denoise.denoise_video(PATH)

參考

https://arxiv.org/pdf/1608.03981.pdf
https://www.appliedaicourse.com/

GITHUB代碼鏈接：https://github.com/saproovarun/DnCNN-Keras


往期精彩回顧




適合初學者入門人工智能的路線及資料下載
(圖文+視頻)機器學習入門系列下載
中國大學慕課《機器學習》（黃海廣主講）
機器學習及深度學習筆記等資料打印
《統(tǒng)計學習方法》的代碼復現(xiàn)專輯
AI基礎下載
機器學習交流qq群955171419，加入微信群請掃碼：

【CV】基于DnCNN的圖像和視頻去噪