pytorch resnet 自定义数据集分类

2023年6月30日下午9:16 • 人工智能 • 阅读 69

pytorch的torchvision内置了resnet主干网络,想要训练自定义分类数据集,只需要将全连接层的替换即可实现自定义数据集分类

本次我们使用的是resnet18 做自定义数据集分类

项目依赖

numpy1.20.3
opencv-contrib-python4.5.3.56
opencv-python4.5.1.48
opencv-python-headless4.5.1.48
Pillow8.2.0
tensorboard2.4.1
tensorboard-plugin-wit1.8.0
torch1.7.1
torchvision0.8.2
tqdm4.60.0

数据集组织形式

我们将需要分类的图像数据放到某个目录下, 每个文件夹代表一个类别(类别使用数值代表)

如下图所示:

; 数据集加载

import glob
import os
from PIL import Image

def default_loader(path):
    with open(path, 'rb') as f:
        with Image.open(f) as img:
            return img.convert('RGB')

class Dataset:

    def __init__(self, image_root_path, data_transforms=None, image_format='png'):
        self.data_transforms = data_transforms
        self.image_root_path = image_root_path
        self.image_format = image_format
        self.images = []
        self.labels = []
        classes_folders = os.listdir(self.image_root_path)
        for cls_folder in classes_folders:
            folder_path = os.path.join(self.image_root_path, cls_folder)
            if os.path.isdir(folder_path):
                images_path = os.path.join(folder_path, "*.{}".format(self.image_format))
                images = glob.glob(images_path)
                self.images.extend(images)

    def __len__(self):
        return len(self.images)

    def __getitem__(self, item):
        image_file = self.images[item]
        label_name = os.path.basename(os.path.dirname(image_file))
        image = default_loader(image_file)
        if self.data_transforms is not None:
            image = self.data_transforms(image)

        return image, int(label_name)

模型训练

import config
import torch
import torch.optim as optim
from torch.optim import lr_scheduler
from torch import nn
import os
from tqdm import tqdm
from torchvision import models, transforms
from torch.utils.tensorboard import SummaryWriter
from dataset import Dataset

def train(model, loss_func, dataset, optimizer, epoch, writer):
    model.train()
    batch_loss = 0
    item = 0
    for batch, (image, label) in tqdm(enumerate(dataset)):
        image = image.to(config.device)
        label = label.to(config.device)
        optimizer.zero_grad()
        output = model(image)
        _, pred = torch.max(output, 1)
        loss = loss_func(output, label)
        loss.backward()
        optimizer.step()
        writer.add_images("train_images", image, epoch)
        writer.add_scalar("train_loss", loss, epoch)
        print("Train Epoch = {} Loss = {}".format(epoch, loss.data.item()))
        batch_loss += loss.data.item()
        item += 1

    return batch_loss / item

def valid(model, loss_func, dataset, epoch, writer):
    model.eval()
    batch_loss = 0
    item = 0
    with torch.no_grad():
        for batch, (image, label) in tqdm(enumerate(dataset)):
            image = image.to(config.device)
            label = label.to(config.device)
            output = model(image)
            loss = loss_func(output, label)
            writer.add_images("valid_images", image, epoch)
            writer.add_scalar("valid_loss", loss, epoch)
            batch_loss += loss.data.item()
            item += 1
            print("Valid Epoch = {} Loss = {}".format(epoch, loss.data.item()))
    return batch_loss / item

def train_model(model, loss_func, optimizer, step_scheduler, num_epochs=config.epoch):
    train_transform = transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])  # &#x5404;&#x901A;&#x9053;&#x989C;&#x8272;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;,&#x7528;&#x4E8E;&#x5F52;&#x4E00;&#x5316;
    ])
    valid_transform = transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.ToTensor(),
        transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])  # &#x5404;&#x901A;&#x9053;&#x989C;&#x8272;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;,&#x7528;&#x4E8E;&#x5F52;&#x4E00;&#x5316;
    ])
    train_dataset = Dataset(config.train_image_path, train_transform, config.image_format)
    valid_dataset = Dataset(config.valid_image_path, valid_transform, config.image_format)

    train_dataloader = torch.utils.data.DataLoader(
        train_dataset, batch_size=config.batch_size,
        shuffle=True, num_workers=config.num_workers,
    )
    valid_dataloader = torch.utils.data.DataLoader(
        valid_dataset, batch_size=config.batch_size,
        shuffle=True, num_workers=config.num_workers
    )
    start_epoch = 0
    # &#x65AD;&#x70B9;&#x7EE7;&#x7EED;&#x8BAD;&#x7EC3;
    if config.resume:
        checkpoint = torch.load(config.chkpt)  # &#x52A0;&#x8F7D;&#x65AD;&#x70B9;
        model.load_state_dict(checkpoint['net'])  # &#x52A0;&#x8F7D;&#x6A21;&#x578B;&#x53EF;&#x5B66;&#x4E60;&#x53C2;&#x6570;
        optimizer.load_state_dict(checkpoint['optimizer'])  # &#x52A0;&#x8F7D;&#x4F18;&#x5316;&#x5668;&#x53C2;&#x6570;
        start_epoch = checkpoint['epoch']  # &#x8BBE;&#x7F6E;&#x5F00;&#x59CB;&#x7684;epoch
    writer = SummaryWriter(log_dir="./runs")
    # images, _ = next(iter(train_dataloader))
    # writer.add_graph(model, images)
    for epoch in range(start_epoch + 1, num_epochs):
        train_epoch_loss = train(model, loss_func, train_dataloader, optimizer, epoch, writer)
        valid_epoch_loss = valid(model, loss_func, valid_dataloader, epoch, writer)
        step_scheduler.step()
        # &#x6A21;&#x578B;&#x4FDD;&#x5B58;
        if epoch % config.save_model_iter == 0:
            checkpoint = {
                "net": model.state_dict(),
                'optimizer': optimizer.state_dict(),
                "epoch": epoch
            }
            save_model_file = os.path.join(config.model_output_dir, "epoch_{}.pth".format(epoch))
            if not os.path.exists(config.model_output_dir):
                os.makedirs(config.model_output_dir)
            torch.save(checkpoint, save_model_file)
        if train_epoch_loss < config.best_loss or valid_epoch_loss < config.best_loss:
            checkpoint = {
                "net": model.state_dict(),
                'optimizer': optimizer.state_dict(),
                "epoch": epoch
            }
            save_model_file = os.path.join(config.model_output_dir, "best_{}.pth".format(epoch))
            if not os.path.exists(config.model_output_dir):
                os.makedirs(config.model_output_dir)
            torch.save(checkpoint, save_model_file)
        if epoch % 10 == 0:
            print("Epoch = {} Train Loss = {} Valid Loss = {}".format(epoch, train_epoch_loss, valid_epoch_loss))
    writer.close()

if __name__ == '__main__':
    backbone = models.resnet18(pretrained=True)
    num_fits = backbone.fc.in_features
    backbone.fc = nn.Linear(num_fits, config.num_classes)  # &#x66FF;&#x6362;&#x6700;&#x540E;&#x4E00;&#x4E2A;&#x5168;&#x8FDE;&#x63A5;&#x5C42;
    model_ft = backbone.to(config.device)
    criterion = nn.CrossEntropyLoss()
    optimizer_ft = optim.Adam(model_ft.parameters(), lr=config.lr)
    scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=10, gamma=0.1)
    train_model(model_ft, criterion, optimizer_ft, scheduler, config.epoch)

模型预测

import glob
import os
import cv2
import config
import torch
import numpy as np
from torch import nn
from PIL import Image
from torchvision import models
import torchvision.transforms as transforms

transform_test = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

def predict_images(image_file, label, model):
    image = Image.open(image_file)
    image = image.convert("RGB")
    numpy_array = np.asarray(image.copy())
    image = transform_test(image)
    image = image.unsqueeze_(0).to(config.device)
    with torch.no_grad():
        outputs = model(image)
        outputs = outputs.to('cpu')
    predict_label = torch.max(outputs, dim=1)[1].data.numpy()[0]
    if predict_label != label:
        print("predict error image = {}".format(image_file))

    print("&#x6D4B;&#x8BD5;&#x7C7B;&#x522B;={}".format(predict_label))
    cv2.imshow("image", numpy_array)
    cv2.waitKey(0)

def get_image_label_to_predict():
    model = models.resnet18(pretrained=False)
    num_fits = model.fc.in_features
    model.fc = nn.Linear(num_fits, config.num_classes)
    model.load_state_dict(torch.load(config.predict_model)['net'])
    model.eval()
    model.to(config.device)
    classes_dir = os.listdir(config.predict_image_path)
    for label in classes_dir:
        label_path = os.path.join(config.predict_image_path, label)
        if os.path.isdir(label_path):
            images = glob.glob(os.path.join(label_path, "*.{}".format(config.image_format)))
            for img in images:
                predict_images(img, int(label), model)

if __name__ == '__main__':
    get_image_label_to_predict()

完整代码项目地址

Github 地址 https://github.com/pythondever/pytorch_resnet18_image_classify

如果您觉得这个项目对您有帮助,欢迎 star

Original: https://blog.csdn.net/lucky404/article/details/122463559
Author: lucky404
Title: pytorch resnet 自定义数据集分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662078/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

给App加上音频编辑功能，让你的用户Show起来

如今短视频当道，BGM无处不在，用户在每个能秀的地方都想要加上个性表达的音频。作为一个开发者，需不断探索和迎合用户的行为喜好，音频编辑功能成为用户在编辑个人信息、内容创作、生活分享…

人工智能 2023年5月27日
00101
【python】牛顿迭代法求解多元函数的最小值–以二元函数为例

目录一元函数到多元函数的牛顿迭代法 python代码实现过程一元函数到多元函数的牛顿迭代法参考多元函数的牛顿迭代和高斯牛顿法怎么推导？一元函数的牛顿迭代公式：多元函数的牛…

人工智能 2023年7月15日
00103
python 安装 cv2 – 已解决

我的网站已上线 http://javapub.net.cn/ 建议收藏 提供多种操作，一定有…

人工智能 2023年7月4日
0068
Python 函数的定义与调用

✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。🍎个人主页：小嗷犬的博客🍊个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。🥭本文内容：P…

人工智能 2023年7月29日
0090
吴恩达深度学习课程-Course 4 卷积神经网络第一周卷积神经网络编程作业（第二部分）

【注意】！！！！这个代码基于tf1，但是笔者装的tf2框架，实在改不动了，1.1和1.2还能勉强跑通，1.3怎么改都报错，所以1.3放的是原始tf1的代码卷积神经网络: 应用 *…

人工智能 2023年5月25日
0083
K210入门使用处理图像畸变方法

K210的入门使用教程（Openmv同适用）在嵌入式开发中通常会使用到视觉方面的硬件做图像识别，经常使用的小型嵌入式图像识别硬件有个K210,Openmv等，这里介绍的是K21…

人工智能 2023年6月18日
00139
图像的梯度

梯度计算 Sobel算子 Scharr算子 laplacian算子三种算子结果比较 Canny边缘检测 * 高斯滤波器梯度和方向非极大值抑制双阈值检测代码 Sobel算子…

人工智能 2023年5月28日
0085
机器学习项目实践——鸢尾花分类

基于SVM算法实现鸢尾花分类摘要：支持向量机，因其英文名为support vector machine，故一般简称SVM，通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间…

人工智能 2023年6月30日
00104
torch 中的 uniform 具体用法

背景在陈云的书上看到这个：下面那几个随机函数rand啥的都好理解，就是不知道 uniform怎么用，查了官方文档写的太简略了，所以找了下例子，总结一下。常见两种用法。先给用例…

人工智能 2023年7月21日
0059
阿里云天池task4

数据分析首先task4是一个项目做一个数据分析的题目是关于2020美国选举的。数据集所有候选人信息 CAND_ID 候选人IDCAND_NAME 候选人姓名CAND_PTY_AF…

人工智能 2023年7月17日
0051
OpenCV 直方图均衡化

文章目录直方图均衡化介绍 * 图像的直方图是什么? – 更形象解释什么是直方图均衡化？直方图均衡化是如何实现的？直方图均衡化的作用直方图均衡化步骤相关API…

人工智能 2023年6月18日
0077
《Convolutional 2D Knowledge Graph Embeddings》论文学习

问题提出背景：知识图谱的链路预测是预测实体之间确实关系的任务，以前的链路任务只集中在比较浅层次的还有快速的模型，这些可以用来扩展到大型知识图谱,但是这些模型比深度多层模型表达的特征…

人工智能 2023年6月10日
0075
BERT 命名实体识别 (pytorch实现)

BERT命名实体识别代码链接： GitHub – kamalkraj/BERT-NER: Pytorch-Named-Entity-Recognition-with-B…

人工智能 2023年5月30日
0079
声音分类及其实战（一）

目录前言音频简介 * WAV是什么？采样率、位深声音处理以及可视化 ; 前言玩过CV的都知道猫狗识别，通过输入一张猫狗图片之后经过神经网络就能知道这张图片属于猫还是狗，图…

人工智能 2023年5月25日
00153
java计算机毕业设计HTML5“牧经校园疫情防控网站”设计与实现源码+数据库+系统+lw文档

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月28日
0085
RabbitMQ—SpringAMQP的使用，五种消息模型的示例

SpringAMQP的使用： SpringAMQP 提供了三个功能：自动声明队列、交换机及其绑定关系基于注解的监听器模式，异步接收消息封装了 RabbitTemplate 工具，…

人工智能 2023年6月30日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31