Pytorch实战[使用VGG16实现图片分类]

2023年6月30日下午7:55 • 人工智能 • 阅读 73

实现Pytorch完成类别分类

Object

基本掌握使用pytorch框架进行神经网络训练任务
使用Pycharm,Google Colab完成代码编写
本次实验只是来熟悉一下训练的流程，因此模型比较简单

1. 编写代码

数据集介绍

CIFAR-10数据集包含6000张大小是(32,32)的图片数据,有10个类别。训练集有5000张，测试集1000张。

; 数据读取以及数据加载


transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])

train_data = torchvision.datasets.CIFAR10("./dataset", train=True, transform=transform,
                                          download=False)

test_data = torchvision.datasets.CIFAR10("./pytorch/dataset", train=False, transform=transform,
                                         download=False)

train_dataloader = DataLoader(train_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)

目录结构

network是写的是vgg16的网络结构

网络的架构如下

代码

import torch
from torch import nn

class VGG16(nn.Module):

    def __init__(self) -> None:
        super().__init__()
        self.model = nn.Sequential(

            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(1024, 64),
            nn.Linear(64, 10)
        )

    def forward(self, input):
        output = self.model(input)
        return output
if __name__ == '__main__':
    mymodel =VGG16()
    input = torch.ones((64,3,32,32))
    output = mymodel(input)
    print(output.shape)

plot_util.py

import matplotlib.pyplot as plt
import seaborn as sns

def plot(train_loss):

    sns.set_style("dark")

    idx_list = [i for i in range(len(train_loss))]

    plt.figure(figsize=(10, 6))
    plt.rcParams["font.size"] = 18
    plt.grid(visible=True, which='major', linestyle='-')
    plt.grid(visible=True, which='minor', linestyle='--', alpha=0.5)

    plt.minorticks_on()

    plt.plot(idx_list, train_loss, 'o-', color='red', marker='*', linewidth=1, fillstyle='bottom')

    plt.title("traning loss")
    plt.xlabel("train times")
    plt.ylabel("train loss")
    plt.legend(["positive", "commend"])
    plt.savefig("train_loss2.png")

    plt.close()

训练

定义参数
加载模型
保存模型
画出train_loss函数
默认每次从model目录下加载出已经训练的模型.pth文件，并选择下标最大的加载

def train(model,maxepoch=20) :
    mynetwork = model

    loss_fn = nn.CrossEntropyLoss().to(device)

    learning_rate = 0.01

    optimizer = torch.optim.SGD(mynetwork.parameters(), learning_rate)

    total_train_step = 0
    total_test_step = 0

    epoch = 0
    max_epoch = maxepoch
    train_loss = []
    test_accuaacy = []
    state = {'model':mynetwork.state_dict(),
             'optimizer':optimizer.state_dict(),
             'epoch':epoch
             }
    model_save_path = './result/model/'
    model_load_path = './result/model/'

    model_files = [file for file in os.listdir(model_load_path) if file.endswith('.pth') ]
    model_files.sort(key =lambda x :int((x.split('.')[0]).split('_')[1]))

    if len(model_files) >0 :
        path = model_load_path+model_files[-1]
        checkpoint = torch.load(path)
        mynetwork.load_state_dict(checkpoint['model'])
        optimizer.load_state_dict(checkpoint['optimizer'])
        epoch = int ((model_files[-1].split('.')[0]).split('_')[1])
        print('----load model -----')

    for i in range(epoch,max_epoch):
        print("[----------- {} epoch train ------------]".format(i + 1))
        mynetwork.train()
        for data in train_dataloader:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            outputs = mynetwork(imgs)
            loss = loss_fn(outputs, targets)

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            total_train_step += 1
            if total_train_step % 100 == 0:
                print("the {} times train and loss : {} ".format(total_train_step, loss.item()))
            train_loss.append(loss.item())

        current_train_model_name = "model_{}.pth".format(i+1)
        torch.save(state,model_save_path+current_train_model_name)

        mynetwork.eval()
        total_test_loss = 0
        total_accuracy = 0
        with torch.no_grad():
            for data in test_dataloader:
                imgs, targets = data
                imgs = imgs.to(device)
                targets = targets.to(device)
                outputs = mynetwork(imgs)

                loss = loss_fn(outputs, targets)
                total_test_loss += loss.item()
                accuracy = (outputs.argmax(1) == targets).sum()
                total_accuracy += accuracy
        print("total loss in test : {} .".format(total_test_loss))
        print("total accuracy in test : {}% ".format(total_accuracy / test_data_size * 100))

        total_test_step += 1
    plot(train_loss)
if __name__ == '__main__':

    mynetwork = VGG16().to(device)

    parser = ArgumentParser()
    parser.add_argument('-e', '--maxepoch', help='train max epoch',
                        default=40, type=int)
    parser.add_argument('-b', '--batch_size', help='Training batch size',
                        default=64, type=int)
    args = parser.parse_args()
    train(mynetwork ,args.maxepoch)
    print("---over---")

测试

import os

import torch
import torchvision
from PIL import Image
from torch import nn
from network.Mynetwork import VGG16

classes = ('airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

img_path = "../images/horse.jpg"
img = Image.open(img_path)

if img_path.endswith(".png"):
    img = img.convert('RGB')
path = r'./result/model/'
transform =torchvision.transforms.Compose([
    torchvision.transforms.Resize((32,32)),
    torchvision.transforms.ToTensor()
])

img = transform(img)

files = [ file for file in os.listdir(path) if file.endswith('.pth') ]
files.sort(key=lambda x :int((x.split('.')[0]).split('_')[1]) )

load_path = path +files[-1]
checkpoint = torch.load(path+files[-1])

model = VGG16()

model.load_state_dict(checkpoint['model'])

img = torch.reshape(img,(1,3,32,32))
model.eval()
with torch.no_grad() :
    output = model(img)

print(classes[output.argmax(1)])

输出 : horse

全部代码

链接: https://pan.baidu.com/s/1cAtTvj_8kYjmU-V42cAApg 密码: 53dv

pos

需要修改路径，dataset按照自己想要将CIFAＲ10下载地址修改
代码是在ubuntu环境下跑的

部署到 goolge cloab

由于要用到显卡训练，白票一下goolge的colab
如果有使用的可以下一个跑一下，没有的话用上面在Pycharm上跑

链接: https://pan.baidu.com/s/1u7ZYaFD3b-4Uu4KkQ4tsDA 密码: 2eur

Original: https://blog.csdn.net/qq_41661809/article/details/124972685
Author: 不想悲伤到天明
Title: Pytorch实战[使用VGG16实现图片分类]

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661954/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数字图像处理之matlab实验（五）：形态学图像处理

常见的形态学处理包括腐蚀、膨胀、开运算、闭运算。不同的操作有不同的作用，同样的操作在不同类型的图片上也有不同效果，具体效果如下表格所示。要求熟练掌握对二值图像的形态学处理。不同操…

人工智能 2023年7月28日
0084
基于时序模式注意力机制（TPA）的长短时记忆（LSTM）网络TPA-LSTM的多变量输入风电功率预测

1、TPA理论注意力机制（Attention mechanism）通常结合神经网络模型用于序列预测，使得模型更加关注历史信息与当前输入信息的相关部分。时序模式注意力机制（Temp…

人工智能 2023年7月27日
0057
超像素学习笔记（1）——概念及判别条件

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、超像素的概念二、超像素判别条件：一般参考三个指标 * 1.Undersegmentation…

人工智能 2023年6月17日
00111
3小时！开发ChatGPT微信小程序

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月29日
0058
猫狗图像识别（卷积神经网络算法，TensorFlow安装）

目录一、tensorflow库安装（1）TensorFlow的历史版本与对应Python版本（2）Python版本查询（3）找到上面的版本框进行对应的TensorFlow下…

人工智能 2023年7月12日
0085
Opencv 霍夫变换霍夫圆检测

霍夫变换是一种特征提取术，在了解霍夫变换霍夫检测之前需要首先明白什么是霍夫空间：以圆形举例子，弄明白形状的原理，直线的变换与检测也就不难理解霍夫空间，是一种三维空间，三个坐标…

人工智能 2023年5月26日
00115
在neo4j中导入csv文件并构建知识图谱

本文csv文件数据来源于openKG中达观的开源知识图谱数据。从开源社区中下载下来的数据文件还是json，先用python把json文件转为csv文件。 import csv i…

人工智能 2023年6月1日
00109
ubuntu20.04安装rocm教程，AMD深度学习，6800xt配置pytorch、CUDA（已更新）本地安装torch

官方文档对应torch下载地址 ROCm安装配置踩坑遇到的问题安装ubuntu系统更新内核，但是在win和Ubuntu双系统的前提下（可能）导致内核更新不成功,我安装成功的内…

人工智能 2023年6月16日
00450
手把手教你win10下安装Anaconda

1.简介： Anaconda简单理解来说，就是一个大的环境池子，池子里面有不同的环境。每个环境用不同的名称进行标识。当我们需要哪个环境时，就在anaconda中激活哪个环境去使用即…

人工智能 2023年6月23日
0094
【论文笔记】TrivialAugment: Tuning-free Yet State-of-the-Art Data Augmentation

论文论文题目：TrivialAugment: Tuning-free Yet State-of-the-Art Data Augmentation 接收： ICCV 2021 O…

人工智能 2023年7月12日
0079
Python数据分析-绘图-2-Seaborn进阶绘图-3-分布图

一、kdeplot 核密度估计用来估计未知的密度函数，是非参数检验之一。直观上来看是平滑后的直方图。核密度估计方法不利用有关数据分布的先验知识，对数据分布不附加任何假定，是一种从数…

人工智能 2023年6月11日
0073
HanLP的分词

加载模型 HanLP的工作流程是先加载模型，模型的标示符存储在 hanlp.pretrained这个包中，按照NLP任务归类。 import hanlp hanlp.pretrai…

人工智能 2023年5月30日
0073
Normalization）是什么？有什么作用

之前我们已经介绍了前处理中的特征缩放方法，包括标准化和归一化。现在我们将重点介绍归一化方法的一种形式，即Normalization（规范化），它是机器学习中一种常用的数据处理手段。…

人工智能 2024年1月1日
0044
常见的多类别分类模型

今天给大家介绍两个多分类任务中的经典网络模型LeNet5和AlexNet。内容源来自”有三AI”，感兴趣的读者可以关注公众号”有三AI&#822…

人工智能 2023年6月16日
0070
什么是知识图谱

1.1 什么是知识图谱知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法[1]。知识图谱由节点和边组成。节点可以是实体，如一个人、一本书等，或是抽象的概念，如…

人工智能 2023年6月1日
0094
python文字转语音输出_Python文字转语音

姓名：刘强【嵌牛导读】在搭建专家系统时，推理机运算往往采用语言变量，那么如何将推理的结果反映给现实世界的人呢？本文介绍了如何使用python将文字转化成语音输出【嵌牛鼻子】 …

人工智能 2023年5月27日
00112

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31