pytorch: 图像恢复问题的代码实现详解(derain,dehaze,deblur,denoise等通用)

2023年6月17日上午3:56 • 人工智能 • 阅读 89

文章目录

*
–
+ 前言
+ 数据集
+
* 训练数据集
* 评估数据集
* 测试数据集
+ 网络模型
+ 自定义工具包
+ 网络训练和测试
+ 结语

前言

图像恢复是一类图形去噪问题的集合，在深度学习中可以理解为监督回归问题，主要包括图像去雨、图像去雾、图像去噪，图像去模糊和图像去马赛克等内容，但利用 pytorch 实现的代码类似，只是在具体网络结构上略有区别。

以图像去雨为例，之前写过一篇图像去雨的 pytorch 实现文章: https://blog.csdn.net/Wenyuanbo/article/details/116541682，但因当时能力和水平有限，实现逻辑存在问题，最近重新整理分享一下，希望能对大家有所帮助，工程文件如图所示，数据集路径根据自己情况设置。

pytorch: 图像恢复问题的代码实现详解(derain,dehaze,deblur,denoise等通用)

、

; 数据集

利用监督回归方法实现图像去雨时，一般数据集为有雨图和无雨图成对存在，首先我喜欢习惯性的将所有成对数据分别从 0 到结束对应重新排序(这个其实不影响，具体自己设计即可)，诸如 001, 002, 003…。

MyDataset.py

import os
import random
import torchvision.transforms.functional as ttf
from torch.utils.data import Dataset
from PIL import Image

训练数据集

训练数据集是用来整合训练数据的，将有雨图和无雨图分别对应进行剪切，转张量等操作。

class MyTrainDataSet(Dataset):
    def __init__(self, inputPathTrain, targetPathTrain, patch_size=128):
        super(MyTrainDataSet, self).__init__()

        self.inputPath = inputPathTrain
        self.inputImages = os.listdir(inputPathTrain)

        self.targetPath = targetPathTrain
        self.targetImages = os.listdir(targetPathTrain)

        self.ps = patch_size

    def __len__(self):
        return len(self.targetImages)

    def __getitem__(self, index):

        ps = self.ps
        index = index % len(self.targetImages)

        inputImagePath = os.path.join(self.inputPath, self.inputImages[index])
        inputImage = Image.open(inputImagePath).convert('RGB')

        targetImagePath = os.path.join(self.targetPath, self.targetImages[index])
        targetImage = Image.open(targetImagePath).convert('RGB')

        inputImage = ttf.to_tensor(inputImage)
        targetImage = ttf.to_tensor(targetImage)

        hh, ww = targetImage.shape[1], targetImage.shape[2]

        rr = random.randint(0, hh-ps)
        cc = random.randint(0, ww-ps)

        input_ = inputImage[:, rr:rr+ps, cc:cc+ps]
        target = targetImage[:, rr:rr+ps, cc:cc+ps]

        return input_, target

评估数据集

在网络训练中，不一定最后一次训练的效果就是最好的。评估数据集是在每一个 epoch 训练结束后对网络训练的性能进行评估，目的在于将最好的一次训练结果保存。

class MyValueDataSet(Dataset):
    def __init__(self, inputPathTrain, targetPathTrain, patch_size=128):
        super(MyValueDataSet, self).__init__()

        self.inputPath = inputPathTrain
        self.inputImages = os.listdir(inputPathTrain)

        self.targetPath = targetPathTrain
        self.targetImages = os.listdir(targetPathTrain)

        self.ps = patch_size

    def __len__(self):
        return len(self.targetImages)

    def __getitem__(self, index):

        ps = self.ps
        index = index % len(self.targetImages)

        inputImagePath = os.path.join(self.inputPath, self.inputImages[index])
        inputImage = Image.open(inputImagePath).convert('RGB')

        targetImagePath = os.path.join(self.targetPath, self.targetImages[index])
        targetImage = Image.open(targetImagePath).convert('RGB')

        inputImage = ttf.center_crop(inputImage, (ps, ps))
        targetImage = ttf.center_crop(targetImage, (ps, ps))

        input_ = ttf.to_tensor(inputImage)
        target = ttf.to_tensor(targetImage)

        return input_, target

测试数据集

测试数据集的目的是将输入有雨进行去雨得到去雨后的结果，注意输入一般是原图大小，不进行裁剪。

class MyTestDataSet(Dataset):
    def __init__(self, inputPathTest):
        super(MyTestDataSet, self).__init__()

        self.inputPath = inputPathTest
        self.inputImages = os.listdir(inputPathTest)

    def __len__(self):
        return len(self.inputImages)

    def __getitem__(self, index):
        index = index % len(self.inputImages)

        inputImagePath = os.path.join(self.inputPath, self.inputImages[index])
        inputImage = Image.open(inputImagePath).convert('RGB')

        input_ = ttf.to_tensor(inputImage)

        return input_

网络模型

以一个 5 层简单卷积神经网络为例子，具体网络自己设定。
NetModel.py

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.inconv = nn.Sequential(
            nn.Conv2d(3, 32, 3, 1, 1),
            nn.ReLU(inplace=True)
        )
        self.midconv = nn.Sequential(
            nn.Conv2d(3, 32, 3, 1, 1),
            nn.ReLU(inplace=True),
            nn.Conv2d(3, 32, 3, 1, 1),
            nn.ReLU(inplace=True),
            nn.Conv2d(3, 32, 3, 1, 1),
            nn.ReLU(inplace=True),
        )
        self.outconv = nn.Sequential(
            nn.Conv2d(3, 32, 3, 1, 1),
        )

    def forward(self, x):

        x = self.inconv(x)
        x = self.midconv(x)
        x = self.outconv(x)

        return x

自定义工具包

自定义工具包主要是一个计算峰值信噪比(PSNR)的方法用来对训练进行评估。

utils.py

import torch

def torchPSNR(tar_img, prd_img):
    imdff = torch.clamp(prd_img,0,1) - torch.clamp(tar_img,0,1)
    rmse = (imdff**2).mean().sqrt()
    ps = 20*torch.log10(1/rmse)
    return ps

网络训练和测试

main.py

import sys
import time
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt
from tqdm import tqdm, trange
from torch.utils.data import DataLoader
from torchvision.utils import save_image
from torch.autograd import Variable
from torch.optim.lr_scheduler import MultiStepLR
import utils
from NetModel import Net
from MyDataset import *

if __name__ == '__main__':
    EPOCH = 100
    BATCH_SIZE = 18
    LEARNING_RATE = 1e-3
    loss_list = []
    best_psnr = 0
    best_epoch = 0

    inputPathTrain = 'E://Rain100H/inputTrain/'
    targetPathTrain = 'E://Rain100H/targetTrain/'
    inputPathTest = 'E://Rain100H/inputTest/'
    resultPathTest = 'E://Rain100H/resultTest/'
    targetPathTest = 'E://Rain100H/targetTest/'

    myNet = Net()
    myNet = myNet.cuda()
    criterion = nn.MSELoss().cuda()

    optimizer = optim.Adam(myNet.parameters(), lr=LEARNING_RATE)

    datasetTrain = MyTrainDataSet(inputPathTrain, targetPathTrain)

    trainLoader = DataLoader(dataset=datasetTrain, batch_size=BATCH_SIZE, shuffle=True, drop_last=False, num_workers=6, pin_memory=True)

    datasetValue = MyValueDataSet(inputPathTest, targetPathTest)
    valueLoader = DataLoader(dataset=datasetValue, batch_size=16, shuffle=True, drop_last=False, num_workers=6, pin_memory=True)

    datasetTest = MyTestDataSet(inputPathTest)

    testLoader = DataLoader(dataset=datasetTest, batch_size=1, shuffle=False, drop_last=False, num_workers=6, pin_memory=True)

    print('-------------------------------------------------------------------------------------------------------')
    if os.path.exists('./model_best.pth'):
        myNet.load_state_dict(torch.load('./model_best.pth'))

    for epoch in range(EPOCH):
        myNet.train()
        iters = tqdm(trainLoader, file=sys.stdout)
        epochLoss = 0
        timeStart = time.time()
        for index, (x, y) in enumerate(iters, 0):

            myNet.zero_grad()
            optimizer.zero_grad()

            input_train, target = Variable(x).cuda(), Variable(y).cuda()
            output_train = myNet(input_train)

            loss = criterion(output_train, target)

            loss.backward()
            optimizer.step()
            epochLoss += loss.item()

            iters.set_description('Training !!!  Epoch %d / %d,  Batch Loss %.6f' % (epoch+1, EPOCH, loss.item()))

        myNet.eval()
        psnr_val_rgb = []
        for index, (x, y) in enumerate(valueLoader, 0):
            input_, target_value = x.cuda(), y.cuda()
            with torch.no_grad():
                output_value = myNet(input_)
            for output_value, target_value in zip(output_value, target_value):
                psnr_val_rgb.append(psnr(output_value, target_value))

        psnr_val_rgb = torch.stack(psnr_val_rgb).mean().item()

        if psnr_val_rgb > best_psnr:
            best_psnr = psnr_val_rgb
            best_epoch = epoch
            torch.save(myNet.state_dict(), 'model_best.pth')

        loss_list.append(epochLoss)
        torch.save(myNet.state_dict(), 'model.pth')
        timeEnd = time.time()
        print("------------------------------------------------------------")
        print("Epoch:  {}  Finished,  Time:  {:.4f} s,  Loss:  {:.6f}.".format(epoch+1, timeEnd-timeStart, epochLoss))
        print('-------------------------------------------------------------------------------------------------------')
    print("Training Process Finished ! Best Epoch : {} , Best PSNR : {:.2f}".format(best_epoch, best_psnr))

    print('--------------------------------------------------------------')
    myNet.load_state_dict(torch.load('./model_best.pth'))
    myNet.eval()

    with torch.no_grad():
        timeStart = time.time()
        for index, x in enumerate(tqdm(testLoader, desc='Testing !!! ', file=sys.stdout), 0):
            torch.cuda.empty_cache()
            input_test = x.cuda()
            output_test = myNet(input_test)
            save_image(output_test, resultPathTest + str(index+1).zfill(3) + tail)
        timeEnd = time.time()
        print('---------------------------------------------------------')
        print("Testing Process Finished !!! Time: {:.4f} s".format(timeEnd - timeStart))

    plt.figure(1)
    x = range(0, EPOCH)
    plt.xlabel('epoch')
    plt.ylabel('epoch loss')
    plt.plot(x, loss_list, 'r-')
    plt.show()

结语

关于图像恢复特别是图像去雨问题欢迎一起交流学习。

Original: https://blog.csdn.net/Wenyuanbo/article/details/120141926
Author: 听风、
Title: pytorch: 图像恢复问题的代码实现详解(derain,dehaze,deblur,denoise等通用)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628339/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用Python实现图像拼接

利用python语言实现多张图像拼接_小饼干cookie的博客-CSDN博客_python拼接图像主要参考上述博文，只是对于复现过程遇到的小问题的解决做一些补充。拼接程序： f…

人工智能 2023年5月26日
0086
ROS机器视觉自学笔记（1）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、ros中安装Opencv 二、使用HSV通道实现目标检测 * 1.HSV颜色通道简介 2. 安…

人工智能 2023年7月19日
0055
单变量线性回归模型（上）

单变量线性回归即简单线性回归，是一种回归分析方法。回归分析在统计学上用来分析两个或者多个变量之间的相关关系及其程度。比如预测股票，预测产品销量等等。单变量即使用单一…

人工智能 2023年6月17日
0069
三步骤详解张正友标定法

1998年，张正友提出了基于二维平面靶标的标定方法，使用相机在不同角度下拍摄多幅平面靶标的图像，比如棋盘格的图像，然后通过对棋盘格的角点进行计算分析来进行相机标定（求解相机的内外参…

人工智能 2023年7月6日
0092
opencv-python 实时获取摄像头数据并实时显示。

import cv2 camera = cv2.VideoCapture(source) while True: (grabbed, frame) = camera.read() …

人工智能 2023年7月19日
0074
AI创想秀，体验华为云ModelArts平台声音分类

目录一、AI Gallery 社区体验二、通过华为云 ModelArts 平台声音分类三、华为云 ModelArts 总结一、AI Gallery 社区体验 AI Gall…

人工智能 2023年7月2日
0082
Pandas使用操作(二)

获取列名 1、df.columns df.columns[0] 2、list(df) list(df)[0] 3、df.keys() df.keys()[0] 将空字符串替换为na…

人工智能 2023年7月16日
0083
Gensim库的使用——Gensim库的核心概念介绍

Gensim是在做自然语言处理时较为经常用到的一个工具库，主要用来以无监督的方式从原始的非结构化文本当中来学习到文本隐藏层的主题向量表达。主要包括 TF-IDF，LSA，LD…

人工智能 2023年5月28日
0076
最详细的图像傅里叶变换

图像傅里叶变换的理解 1. 傅里叶变换理论层面理解 2. 常见频谱图 3. 傅里叶变换在图像中的应用傅里叶变换理论层面理解 数学&am…

人工智能 2023年6月25日
0087
90+深度学习开源数据集整理｜包括目标检测、工业缺陷、图像分割等多个方向

小目标检测 1.AI-TOD航空图像数据集数据集下载地址：http://m6z.cn/5MjlYk AI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621…

人工智能 2023年5月25日
0067
2023年，前端开发未来可期

☆对于很多质疑，很多不解，本文将从△ 目前企业内前端开发职业的占比；△ 目前业内开发语言的受欢迎程度；△ 近期社区问答活跃度；等维度来说明目前前端这个职业的所处位置。 ☆还有强硬的…

人工智能 2023年7月19日
0062
RGB相机、深度相机以及LiDAR成像原理

RGB相机成像原理相机结构和原理（入门简版）知乎摄像机模型数学推导相机结构成像原理大名鼎鼎的”拜尔滤镜”CMOS滤镜排列像素尺寸、大小关系景深景…

人工智能 2023年7月28日
0087
arm64 虚拟地址物理地址转换

linux5.15 armv8-a arm文档 VMSA章节 D5.2.4 Memory translation granule size A VMSA provides a Me…

人工智能 2023年6月28日
0081
Jetson-Xavier-NX刷机+pytorch环境配置+yolov5运行

前言：最近在使用英伟达的Jetson-Xavier-NX板子，主要用于机器视觉，将配置的过程在这里记录一下。目录一、镜像烧录 1.下载镜像 2.写入镜像 3.开机 4.远程连接…

人工智能 2023年7月23日
0087
python使用numpy求两个数组的并集交集差集（图像）

import numpy as np array1=np.array([3,2,-1,100]) array2=np.array([0,-5,100,20]) "&quo…

人工智能 2023年6月13日
0079
【论文汇总】2D目标检测文章汇总，持续更新

记录自己比较感兴趣的2D目标检测文章 DatePub.TitleCode2022ECCV https://github.com/mohsenzand/objectbox2021MM…

人工智能 2023年7月9日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31