使用 resnet50 网络训练多分类模型完整代码

2023年6月17日上午12:58 • 人工智能 • 阅读 68

零、导包准备

import torch
from torchvision import datasets, models, transforms
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
import time

import numpy as np
import matplotlib.pyplot as plt
import os
from tqdm import tqdm

一、建立数据集

animals-6
  --train
      |--dog
      |--cat
      ...

  --valid
      |--dog
      |--cat
      ...

  --test
      |--dog
      |--cat
      ...

&#x6211;&#x7684;&#x6570;&#x636E;&#x96C6;&#x4E2D; train &#x4E2D;&#x6BCF;&#x4E2A;&#x7C7B;&#x522B;60&#x5F20;&#x56FE;&#x7247;&#xFF0C;valid &#x4E2D;&#x6BCF;&#x4E2A;&#x7C7B;&#x522B; 10 &#x5F20;&#x56FE;&#x7247;&#xFF0C;test &#x4E2D;&#x6BCF;&#x4E2A;&#x7C7B;&#x522B;&#x51E0;&#x5F20;&#x5230;&#x51E0;&#x5341;&#x5F20;&#x4E0D;&#x7B49;&#xFF0C;&#x4E00;&#x5171; 6 &#x4E2A;&#x7C7B;&#x522B;&#x3002;

数据集路径

在项目根目录下创建一个 data 文件夹（名字可以任意），用来存放数据集。
在 data 文件夹下依次创建 train、valid、test 文件夹（test 文件夹可以没有，依据自己需求确定）
- 在 train 文件夹下创建类别文件夹，如 cat、dog 等
- 在类别文件夹如 cat 下，存放 cat 类别的图片。
- …
- 在 val 文件夹下创建类别文件夹，如 cat、dog 等
- 在类别文件夹如 cat 下，存放 cat 类别的图片。
- …
- …

; 二、数据增强

建好的数据集在输入网络之前先进行数据增强，包括随机 resize 裁剪到 256 x 256，随机旋转，随机水平翻转，中心裁剪到 224 x 224，转化成 Tensor，正规化等。

image_transforms = {
    'train': transforms.Compose([
        transforms.RandomResizedCrop(size=256, scale=(0.8, 1.0)),
        transforms.RandomRotation(degrees=15),
        transforms.RandomHorizontalFlip(),
        transforms.CenterCrop(size=224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406],
                             [0.229, 0.224, 0.225])
    ]),
    'valid': transforms.Compose([
        transforms.Resize(size=256),
        transforms.CenterCrop(size=224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406],
                             [0.229, 0.224, 0.225])
    ])
}

三、加载数据

torchvision.transforms包DataLoader是 Pytorch 重要的特性，它们使得数据增加和加载数据变得非常简单。
使用 DataLoader 加载数据的时候就会将之前定义的数据 transform 就会应用的数据上了。

dataset = 'data'
train_directory = os.path.join(dataset, 'train')
valid_directory = os.path.join(dataset, 'valid')

batch_size = 32
num_classes = 6
print(train_directory)
data = {
    'train': datasets.ImageFolder(root=train_directory, transform=image_transforms['train']),
    'valid': datasets.ImageFolder(root=valid_directory, transform=image_transforms['valid'])
}

train_data_size = len(data['train'])
valid_data_size = len(data['valid'])

train_data = DataLoader(data['train'], batch_size=batch_size, shuffle=True, num_workers=8)
valid_data = DataLoader(data['valid'], batch_size=batch_size, shuffle=True, num_workers=8)

print(train_data_size, valid_data_size)

四、迁移学习

这里使用ResNet-50的预训练模型。

resnet50 = models.resnet50(pretrained=True)

在PyTorch中加载模型时，所有参数的’requires_grad’字段默认设置为true。这意味着对参数值的每一次更改都将被存储，以便在用于训练的反向传播图中使用。这增加了内存需求。由于预训练的模型中的大多数参数已经训练好了，因此将requires_grad字段重置为false。

for param in resnet50.parameters():
    param.requires_grad = False

为了适应自己的数据集，将ResNet-50的最后一层替换为，将原来最后一个全连接层的输入喂给一个有256个输出单元的线性层，接着再连接ReLU层和Dropout层，然后是256 x 6的线性层，输出为 6 通道的softmax层。

fc_inputs = resnet50.fc.in_features
resnet50.fc = nn.Sequential(
    nn.Linear(fc_inputs, 256),
    nn.ReLU(),
    nn.Dropout(0.4),
    nn.Linear(256, 6),
    nn.LogSoftmax(dim=1)
)

resnet50 = resnet50.to('cuda:1')

loss_func = nn.NLLLoss()
optimizer = optim.Adam(resnet50.parameters())

五、训练

def train_and_valid(model, loss_function, optimizer, epochs=25):
    device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
    history = []
    best_acc = 0.0
    best_epoch = 0

    for epoch in range(epochs):
        epoch_start = time.time()
        print("Epoch: {}/{}".format(epoch+1, epochs))

        model.train()

        train_loss = 0.0
        train_acc = 0.0
        valid_loss = 0.0
        valid_acc = 0.0

        for i, (inputs, labels) in enumerate(tqdm(train_data)):
            inputs = inputs.to(device)
            labels = labels.to(device)

            optimizer.zero_grad()
            outputs = model(inputs)
            loss = loss_function(outputs, labels)
            loss.backward()
            optimizer.step()
            train_loss += loss.item() * inputs.size(0)
            ret, predictions = torch.max(outputs.data, 1)
            correct_counts = predictions.eq(labels.data.view_as(predictions))
            acc = torch.mean(correct_counts.type(torch.FloatTensor))
            train_acc += acc.item() * inputs.size(0)

        with torch.no_grad():
            model.eval()

            for j, (inputs, labels) in enumerate(tqdm(valid_data)):
                inputs = inputs.to(device)
                labels = labels.to(device)
                outputs = model(inputs)
                loss = loss_function(outputs, labels)
                valid_loss += loss.item() * inputs.size(0)
                ret, predictions = torch.max(outputs.data, 1)
                correct_counts = predictions.eq(labels.data.view_as(predictions))
                acc = torch.mean(correct_counts.type(torch.FloatTensor))
                valid_acc += acc.item() * inputs.size(0)

        avg_train_loss = train_loss/train_data_size
        avg_train_acc = train_acc/train_data_size

        avg_valid_loss = valid_loss/valid_data_size
        avg_valid_acc = valid_acc/valid_data_size

        history.append([avg_train_loss, avg_valid_loss, avg_train_acc, avg_valid_acc])

        if best_acc < avg_valid_acc:
            best_acc = avg_valid_acc
            best_epoch = epoch + 1

        epoch_end = time.time()

        print("Epoch: {:03d}, Training: Loss: {:.4f}, Accuracy: {:.4f}%, \n\t\tValidation: Loss: {:.4f}, Accuracy: {:.4f}%, Time: {:.4f}s".format(
            epoch+1, avg_valid_loss, avg_train_acc*100, avg_valid_loss, avg_valid_acc*100, epoch_end-epoch_start
        ))
        print("Best Accuracy for validation : {:.4f} at epoch {:03d}".format(best_acc, best_epoch))

        torch.save(model, 'models/'+dataset+'_model_'+str(epoch+1)+'.pt')
    return model, history

num_epochs = 30
trained_model, history = train_and_valid(resnet50, loss_func, optimizer, num_epochs)
torch.save(history, 'models/'+dataset+'_history.pt')

history = np.array(history)
plt.plot(history[:, 0:2])
plt.legend(['Tr Loss', 'Val Loss'])
plt.xlabel('Epoch Number')
plt.ylabel('Loss')
plt.ylim(0, 1)
plt.savefig(dataset+'_loss_curve.png')
plt.show()

plt.plot(history[:, 2:4])
plt.legend(['Tr Accuracy', 'Val Accuracy'])
plt.xlabel('Epoch Number')
plt.ylabel('Accuracy')
plt.ylim(0, 1)
plt.savefig(dataset+'_accuracy_curve.png')
plt.show()

网络训练过程中添加进度条关键代码

for i, (inputs, labels) in enumerate(tqdm(train_data)):

完整代码

import torch
from torchvision import datasets, models, transforms
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
import time

import numpy as np
import matplotlib.pyplot as plt
import os
from tqdm import tqdm

image_transforms = {
    'train': transforms.Compose([
        transforms.RandomResizedCrop(size=256, scale=(0.8, 1.0)),
        transforms.RandomRotation(degrees=15),
        transforms.RandomHorizontalFlip(),
        transforms.CenterCrop(size=224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406],
                             [0.229, 0.224, 0.225])
    ]),
    'valid': transforms.Compose([
        transforms.Resize(size=256),
        transforms.CenterCrop(size=224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406],
                             [0.229, 0.224, 0.225])
    ])
}

dataset = 'data'
train_directory = os.path.join(dataset, 'train')
valid_directory = os.path.join(dataset, 'valid')

batch_size = 32
num_classes = 6
print(train_directory)
data = {
    'train': datasets.ImageFolder(root=train_directory, transform=image_transforms['train']),
    'valid': datasets.ImageFolder(root=valid_directory, transform=image_transforms['valid'])
}

train_data_size = len(data['train'])
valid_data_size = len(data['valid'])

train_data = DataLoader(data['train'], batch_size=batch_size, shuffle=True, num_workers=8)
valid_data = DataLoader(data['valid'], batch_size=batch_size, shuffle=True, num_workers=8)

print(train_data_size, valid_data_size)

resnet50 = models.resnet50(pretrained=True)

for param in resnet50.parameters():
    param.requires_grad = False

fc_inputs = resnet50.fc.in_features
resnet50.fc = nn.Sequential(
    nn.Linear(fc_inputs, 256),
    nn.ReLU(),
    nn.Dropout(0.4),
    nn.Linear(256, 6),
    nn.LogSoftmax(dim=1)
)

resnet50 = resnet50.to('cuda:1')

loss_func = nn.NLLLoss()
optimizer = optim.Adam(resnet50.parameters())

def train_and_valid(model, loss_function, optimizer, epochs=25):
    device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
    history = []
    best_acc = 0.0
    best_epoch = 0

    for epoch in range(epochs):
        epoch_start = time.time()
        print("Epoch: {}/{}".format(epoch+1, epochs))

        model.train()

        train_loss = 0.0
        train_acc = 0.0
        valid_loss = 0.0
        valid_acc = 0.0

        for i, (inputs, labels) in enumerate(tqdm(train_data)):
            inputs = inputs.to(device)
            labels = labels.to(device)

            optimizer.zero_grad()
            outputs = model(inputs)
            loss = loss_function(outputs, labels)
            loss.backward()
            optimizer.step()
            train_loss += loss.item() * inputs.size(0)
            ret, predictions = torch.max(outputs.data, 1)
            correct_counts = predictions.eq(labels.data.view_as(predictions))
            acc = torch.mean(correct_counts.type(torch.FloatTensor))
            train_acc += acc.item() * inputs.size(0)

        with torch.no_grad():
            model.eval()

            for j, (inputs, labels) in enumerate(tqdm(valid_data)):
                inputs = inputs.to(device)
                labels = labels.to(device)
                outputs = model(inputs)
                loss = loss_function(outputs, labels)
                valid_loss += loss.item() * inputs.size(0)
                ret, predictions = torch.max(outputs.data, 1)
                correct_counts = predictions.eq(labels.data.view_as(predictions))
                acc = torch.mean(correct_counts.type(torch.FloatTensor))
                valid_acc += acc.item() * inputs.size(0)

        avg_train_loss = train_loss/train_data_size
        avg_train_acc = train_acc/train_data_size

        avg_valid_loss = valid_loss/valid_data_size
        avg_valid_acc = valid_acc/valid_data_size

        history.append([avg_train_loss, avg_valid_loss, avg_train_acc, avg_valid_acc])

        if best_acc < avg_valid_acc:
            best_acc = avg_valid_acc
            best_epoch = epoch + 1

        epoch_end = time.time()

        print("Epoch: {:03d}, Training: Loss: {:.4f}, Accuracy: {:.4f}%, \n\t\tValidation: Loss: {:.4f}, Accuracy: {:.4f}%, Time: {:.4f}s".format(
            epoch+1, avg_valid_loss, avg_train_acc*100, avg_valid_loss, avg_valid_acc*100, epoch_end-epoch_start
        ))
        print("Best Accuracy for validation : {:.4f} at epoch {:03d}".format(best_acc, best_epoch))

        torch.save(model, 'models/'+dataset+'_model_'+str(epoch+1)+'.pt')
    return model, history

num_epochs = 30
trained_model, history = train_and_valid(resnet50, loss_func, optimizer, num_epochs)
torch.save(history, 'models/'+dataset+'_history.pt')

history = np.array(history)
plt.plot(history[:, 0:2])
plt.legend(['Tr Loss', 'Val Loss'])
plt.xlabel('Epoch Number')
plt.ylabel('Loss')
plt.ylim(0, 1)
plt.savefig(dataset+'_loss_curve.png')
plt.show()

plt.plot(history[:, 2:4])
plt.legend(['Tr Accuracy', 'Val Accuracy'])
plt.xlabel('Epoch Number')
plt.ylabel('Accuracy')
plt.ylim(0, 1)
plt.savefig(dataset+'_accuracy_curve.png')
plt.show()

参考链接：https://cxyzjd.com/article/heiheiya/103028543

训练过程

; 结果曲线图

Loss

Original: https://blog.csdn.net/weixin_46034990/article/details/124859877
Author: 悄悄地努力
Title: 使用 resnet50 网络训练多分类模型完整代码

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627649/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MOEAD原理及Python实现、MOEAD实现、基于分解的多目标进化、切比雪夫方法-（python完整代码）

原文链接：https://www.cnblogs.com/Twobox/p/16416509.html 确定某点附近的点答：每个解对应的是一组权重，即子问题，红点附近的四个点，也…

人工智能 2023年6月4日
0076
神经网络实现文本分类（零基础入门）

目录机器学习基础 1.线性回归梯度下降法代码训练结果拟合效果 2.感知器数据集代码权重损失变化分类效果 sigmoid函数 3.非线性回归激活函数 …

人工智能 2023年7月13日
0068
Spyder故障基本解决方案（包括闪退）-超全版本

这些建议可以解决一部分问题，但往往只是靠自己来解决大多数报告的问题。建议的故障排除步骤重新启动Spyder ，然后再次尝试您以前所做的操作。升级Spyder 到最新版本，您可…

人工智能 2023年7月5日
00207
Python常用模块之 re模块

[ Python_的re _模块_提供了 _正则表达式_相关的操作函数， _包_括： – re.search(pattern, string, flags=0)：在给定…

人工智能 2023年7月5日
0057
神经网络与深度学习理论,tensorflow2.0教程,cnn

人工智能 2023年5月26日
0067
理解super().__init__()

一、写在前面：本文仅为个人的理解，如有错误欢迎指正二、super(). init ()的含义我们都知道是在定义子类的 __init__方法的时候，由于需要继承父类的属性，则我们…

人工智能 2023年7月4日
0050
【读点论文】AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE（ViT）像处理自然语言那样处理图片

虽然Transformer体系结构已经成为自然语言处理任务一种极具代表性的工作成果，但它在计算机视觉中的应用仍然有限。在视觉中，注意力要么与卷积网络结合使用，要么用于替换卷积网络…

人工智能 2023年5月26日
0074
Selenium安装教程-清晰明了(亲测有效)易操作

一、前言今天不讲前言了，直接上步骤。二、实现 1.打开pycharm，点击File，Setting进入配置页面 (没有配置环境的配置一下环境，这里不多说，正常安装python的…

人工智能 2023年7月4日
0074
SIFT算法详解(附有完整代码)

说明：本文旨在给出 SIFT 算法的具体实现，而在 SIFT 详解上只是做出简单介绍，在这里可以给大家推荐一篇好文：https://blog.csdn.net/zddblog/ar…

人工智能 2023年6月18日
0051
深度学习-神经网络CNN-感受野大小的计算公式有哪些？可能会遇到哪些坑？如何理解感受野大小的计算公式？

Reference 下面这个B站视频，属于讲感受野的专栏视频之一，使用的是正向公式，强烈推荐大家观看。深度理解感受野（二）：抓住卷积神经网络的内在特性，学习感受野的计算少不了下…

人工智能 2023年7月14日
0063
三菱FX5U系列PLC中的DSZR机械原点回归指令（带DOG搜索）的详细分析

三菱FX5U系列PLC中的DSZR机械原点回归指令（带DOG搜索）的详细分析前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。首…

人工智能 2023年6月17日
00219
opencv 使用DNN进行物体分类

DNN 使用步骤读取模型，并得到深度神经网络读取图片、视频将图片转为张量，送入深度神经网络进行分析，并得到结果导入模型 readNetFromTensorflow(mod…

人工智能 2023年7月1日
0062
【OpenCV图像处理10】图像直方图

文章目录十、图象直方图 * 1、图像直方图的基本概念 2、使用OpenCV统计直方图 3、使用OpenCV绘制直方图 4、使用掩膜的直方图 5、直方图均衡化十、图象直方图 1、…

人工智能 2023年6月20日
0069
Python中缺失值的填充

0 常用方法在Python中最常用的处理数据格式为DataFrame格式，当数据为其他格式时可以使用pandas包中的.DataFrame方法转化为该格式。此处以原数据…

人工智能 2023年6月19日
0065
基于SpringBoot的协同过滤算法商品推荐系统

末尾获取源码开发语言：JavaJava开发工具：JDK1.8后端框架：SpringBoot前端：采用Vue和HTML技术开发数据库：MySQL5.7和Navicat管理工具结合服务…

人工智能 2023年6月29日
0056
缓存P27，28，29

一级缓存：准备工作：新建一个项目：复制这三个文件。并且再pom.xml中导入lombox的环境。再pojo中新建一个实体类User package com.Li.pojo; …

人工智能 2023年6月30日
0056

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30