【超分辨率】【深度学习】SRCNN pytorch代码（附详细注释和数据集）

2023年8月2日下午10:14 • Python • 阅读 53

主要改进：

断点恢复，可以恢复训练。
注释掉原test.py的38行才是真正的超分辨率。
即image = image.resize((image.width // args.scale, image.height // args.scale), resample=pil_image.BICUBIC)
其中//代表整除的意思。
model.py存在两个与原论文有出入，请仔细思考，如果想不出来可以联系我，但自己思考更有成就感。

关于第二点的注释可以知道，这份代码更注重于研究图像生成，改善的是图像细节而非分辨率。

这里主要是对代码进行讲解，对SRCNN不了解的同学可以先去参考其他博文。

有问题，不知道如何跑代码的同学联系： 809267697@qq.com

下面是这篇代码的步骤。

首先准备好数据集，这里以img-91作为训练集，Set5作为测试集。

运行prepare.py 将两个数据集转为h5格式。(测试集要在命令加上 –eval)

之后运行train.py

import argparse
import glob
import h5py
import numpy as np
import PIL.Image as pil_image
from utils import convert_rgb_to_y

def train(args):
    h5_file = h5py.File(args.output_path, 'w')

    lr_patches = []
    hr_patches = []

    for image_path in sorted(glob.glob('{}/*'.format(args.images_dir))):

        hr = pil_image.open(image_path).convert('RGB')

        hr_width = (hr.width // args.scale) * args.scale
        hr_height = (hr.height // args.scale) * args.scale

        hr = hr.resize((hr_width, hr_height), resample=pil_image.BICUBIC)

        lr = hr.resize((hr_width // args.scale, hr_height // args.scale), resample=pil_image.BICUBIC)

        lr = lr.resize((lr.width * args.scale, lr.height * args.scale), resample=pil_image.BICUBIC)

        hr = np.array(hr).astype(np.float32)
        lr = np.array(lr).astype(np.float32)
        hr = convert_rgb_to_y(hr)
        lr = convert_rgb_to_y(lr)

        for i in range(0, lr.shape[0] - args.patch_size + 1, args.stride):
            for j in range(0, lr.shape[1] - args.patch_size + 1, args.stride):
                lr_patches.append(lr[i:i + args.patch_size, j:j + args.patch_size])
                hr_patches.append(hr[i:i + args.patch_size, j:j + args.patch_size])

    lr_patches = np.array(lr_patches)
    hr_patches = np.array(hr_patches)

    h5_file.create_dataset('lr', data=lr_patches)
    h5_file.create_dataset('hr', data=hr_patches)

    h5_file.close()

def eval(args):
    h5_file = h5py.File(args.output_path, 'w')

    lr_group = h5_file.create_group('lr')
    hr_group = h5_file.create_group('hr')

    for i, image_path in enumerate(sorted(glob.glob('{}/*'.format(args.images_dir)))):
        hr = pil_image.open(image_path).convert('RGB')
        hr_width = (hr.width // args.scale) * args.scale
        hr_height = (hr.height // args.scale) * args.scale
        hr = hr.resize((hr_width, hr_height), resample=pil_image.BICUBIC)
        lr = hr.resize((hr_width // args.scale, hr_height // args.scale), resample=pil_image.BICUBIC)
        lr = lr.resize((lr.width * args.scale, lr.height * args.scale), resample=pil_image.BICUBIC)
        hr = np.array(hr).astype(np.float32)
        lr = np.array(lr).astype(np.float32)
        hr = convert_rgb_to_y(hr)
        lr = convert_rgb_to_y(lr)

        lr_group.create_dataset(str(i), data=lr)
        hr_group.create_dataset(str(i), data=hr)

    h5_file.close()

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--images-dir', type=str, required=True)
    parser.add_argument('--output-path', type=str, required=True)
    parser.add_argument('--patch-size', type=int, default=32)
    parser.add_argument('--stride', type=int, default=14)
    parser.add_argument('--scale', type=int, default=4)
    parser.add_argument('--eval', action='store_true')
    args = parser.parse_args()

    if not args.eval:
        train(args)
    else:
        eval(args)

之后运行，看不懂注释可以先去其他博文了解SRCNN的网络结构和训练过程。

import argparse
import os
import copy

import numpy as np
from torch import Tensor
import torch
from torch import nn
import torch.optim as optim

import torch.backends.cudnn as cudnn

from torch.utils.data.dataloader import DataLoader

from tqdm import tqdm

from model import SRCNN
from datasets import TrainDataset, EvalDataset
from utils import AverageMeter, calc_psnr

if __name__ == '__main__':

    parser = argparse.ArgumentParser()
    parser.add_argument('--train-file', type=str, required=True)
    parser.add_argument('--eval-file', type=str, required=True)
    parser.add_argument('--outputs-dir', type=str, required=True)
    parser.add_argument('--scale', type=int, default=3)
    parser.add_argument('--lr', type=float, default=1e-4)
    parser.add_argument('--batch-size', type=int, default=16)
    parser.add_argument('--num-workers', type=int, default=0)
    parser.add_argument('--num-epochs', type=int, default=400)
    parser.add_argument('--seed', type=int, default=123)
    args = parser.parse_args()

    args.outputs_dir = os.path.join(args.outputs_dir, 'x{}'.format(args.scale))

    if not os.path.exists(args.outputs_dir):
        os.makedirs(args.outputs_dir)

    cudnn.benchmark = True

    device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

    torch.manual_seed(args.seed)

    model = SRCNN().to(device)

    criterion = nn.MSELoss()

    optimizer = optim.Adam([
        {'params': model.conv1.parameters()},
        {'params': model.conv2.parameters()},
        {'params': model.conv3.parameters(), 'lr': args.lr*0.1}
    ], lr=args.lr)

    train_dataset = TrainDataset(args.train_file)
    train_dataloader = DataLoader(

                dataset=train_dataset,

                batch_size=args.batch_size,

                shuffle=True,

                num_workers=args.num_workers,

                pin_memory=True,

                drop_last=True)

    eval_dataset = EvalDataset(args.eval_file)
    eval_dataloader = DataLoader(dataset=eval_dataset, batch_size=1)

    best_weights = copy.deepcopy(model.state_dict())
    best_epoch = 0
    best_psnr = 0.0

    lossLog=[]
    psnrLog=[]

    for epoch in range(1, args.num_epochs + 1):

        model.train()

        epoch_losses = AverageMeter()

        with tqdm(total=(len(train_dataset) - len(train_dataset) % args.batch_size)) as t:

            t.set_description('epoch:{}/{}'.format(epoch, args.num_epochs))

            for data in train_dataloader:

                inputs, labels = data

                inputs = inputs.to(device)
                labels = labels.to(device)

                preds = model(inputs)

                loss = criterion(preds, labels)

                epoch_losses.update(loss.item(), len(inputs))

                optimizer.zero_grad()

                loss.backward()

                optimizer.step()

                t.set_postfix(loss='{:.6f}'.format(epoch_losses.avg))
                t.update(len(inputs))

        lossLog.append(np.array(epoch_losses.avg))

        np.savetxt("lossLog.txt", lossLog)

        torch.save(model.state_dict(), os.path.join(args.outputs_dir, 'epoch_{}.pth'.format(epoch)))

        model.eval()
        epoch_psnr = AverageMeter()

        for data in eval_dataloader:
            inputs, labels = data

            inputs = inputs.to(device)
            labels = labels.to(device)

            with torch.no_grad():
                preds = model(inputs).clamp(0.0, 1.0)

            epoch_psnr.update(calc_psnr(preds, labels), len(inputs))

        print('eval psnr: {:.2f}'.format(epoch_psnr.avg))

        psnrLog.append(Tensor.cpu(epoch_psnr.avg))
        np.savetxt('psnrLog.txt', psnrLog)

        if epoch_psnr.avg > best_psnr:
            best_epoch = epoch
            best_psnr = epoch_psnr.avg
            best_weights = copy.deepcopy(model.state_dict())

        print('best epoch: {}, psnr: {:.2f}'.format(best_epoch, best_psnr))

        torch.save(best_weights, os.path.join(args.outputs_dir, 'best.pth'))

    print('best epoch: {}, psnr: {:.2f}'.format(best_epoch, best_psnr))

    torch.save(best_weights, os.path.join(args.outputs_dir, 'best.pth'))

之后运行test.py就可以了，其中跟train.py差不多就不注释了。

test.py是放入图片、权重和倍数就行，会生成两张图片。

(a)是原图 (b)是bicubic (c)是SRCNN

Original: https://blog.csdn.net/zhanjuex/article/details/124344864
Author: zhanjuex
Title: 【超分辨率】【深度学习】SRCNN pytorch代码（附详细注释和数据集）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/731649/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

西电-数据可视化-实验五-高维非空间数据可视化（pyecharts）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年8月28日
0062
Python采集古代精品大作，品味古典文学佳作

不，不，不。 [En] No, no, no. 金P梅作为古代精品文学作品，作者的笔功力确实厉害，小弟佩服至极，所以今天来爬一爬，但是不准备看，主要是看不懂。我相信你只是在学习技…

Python 2023年5月24日
0076
python＞＞numpy（第二讲）

第2章科学计算库 NumPy;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;随机数模块;本章主…

Python 2023年8月25日
0041
详解pd.Grouper()以及时间分组groupby()

1.pd.Grouper arrays = [ ["bar", "bar", "baz", "baz&quot…

Python 2023年8月20日
0093
Flask 数据库迁移（详解）

1、使用 Flask-Migrate 实现数据库迁移在开发过程中，随着需求的变化，有可能需要添加或修改表的一些字段，但是原表中的数据不能删除，此时就需要创建新表，并将旧表中的数据…

Python 2023年8月9日
0054
python写一个梭哈纸牌游戏_python 写一个水果忍者游戏

水果忍者的玩法很简单，尽可能的切开抛出的水果就行。今天我们就用python简单的模拟一下这个游戏。在这个简单的项目中，我们用鼠标选择水果来切割，同时炸弹也会隐藏在水果中，如果切开…

Python 2023年9月22日
0059
DRF中的ModelSerializer类的使用

在我们定义的序列化类中,定义一个 Meta内部类,即可通过在类内添加属性来使用 ModelSerializer类自动生成一个序列化器,下面是一些常用属性: model=Model:…

Python 2023年8月6日
0063
【PyCharm中文教程 08】远程代码调试图文教程

一般情况下，我们开发调试都是在个人PC上完成，遇到问题，开一下 Pycharm 的调试器，很快就能找到问题所在。可有些时候，项目代码的运行会对运行环境有依赖，必须在部署了相关依赖…

Python 2023年6月6日
0096
物以类聚人以群分,通过GensimLda文本聚类构建人工智能个性化推荐系统(Python3.10)

众所周知，个性化推荐系统能够根据用户的兴趣、偏好等信息向用户推荐相关内容，使得用户更感兴趣，从而提升用户体验，提高用户粘度，之前我们曾经使用协同过滤算法构建过个性化推荐系统，但基于…

Python 2023年10月29日
0052
Pandas 01 快速入门

Pandas（/ˈpændəz/）是一个开源的、BSD 许可的库，为 Python 编程语言提供高性能、易于使用的数据结构和数据分析工具。 Pandas 适合处理一个规正的二维数据…

Python 2023年8月22日
0035
第六章：django中的cookie与session

系列文章目录第一章：Django安装与配置虚拟环境第二章：django各模块的作用以及参数说明第三章: Django的路由与视图第四章：django请求第五章：djan…

Python 2023年8月4日
0027
FastDDS（3）xml配置文件详解

XML配置文件 eProsima Fast DDS允许加载XML配置文件，每个文件包含一个或多个XML配置。除了用于加载用户XML文件的API函数外，Fast DDS还尝试在初始化…

Python 2023年9月29日
0041
基于python 爬虫的疫情数据可视化系统

文章目录前言 1 课题背景 2 实现效果 * 2.1 整体界面展示 2.2 收集數據 3 實現過程 – 3.1 爬取疫情數據： + 3.1.1 導包 3.1.2 實例…

Python 2023年8月2日
0046
计算机毕业设计Python+Django的旅游信息网站系统(源码+系统+mysql数据库+Lw文档）

项目介绍随着时代的发展，旅游已经成为人们假日中一个很好的消闲娱乐项目了，在阳光明媚的一天中带着老婆孩子到一个山清水秀的地方去度过美好的一天是很多人的理想生活。尤其是在当前全球内卷…

Python 2023年8月4日
0043
DASCTF x SU 三月wp+复现

之前给忘了已经搭建新站很久了~师傅们来找我玩呀因为还没复现完就先放这里了复现完再放新站 ezpop 直接得到源码： class crow { public $v1; publi…

Python 2023年8月13日
0050
数据科学与python语言——Matplotlib数据可视化基础

Matplotlib数据可视化基础一.读取数据与数据处理阶段 * 1.提取指定行中的数据 2.得到>指定数值的数据 3.得到=指定值得数据 4.整体的数据处理：二.画图函…

Python 2023年9月1日
0067

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【超分辨率】【深度学习】SRCNN pytorch代码（附详细注释和数据集）

大家都在看