用Pytorch实现水果分类，训练+测试（内附数据集下载，完整代码）

2023年6月30日下午9:37 • 人工智能 • 阅读 74

一.数据集下载

链接: https://pan.baidu.com/s/1_7blbYJc0ouCGmqe8kBnTw 提取码: c6ex 复制这段内容后打开百度网盘手机App，操作更方便哦

二.训练模型

1.定义数据初始化

import torchvision.transforms as transforms
image_size=(224,224)
data_transforms=transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.Resize(image_size ),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),

])

一、裁剪——Crop

1.随机裁剪：transforms.RandomCrop
2.中心裁剪：transforms.CenterCrop
3.随机长宽比裁剪 transforms.RandomResizedCrop
4.上下左右中心裁剪：transforms.FiveCrop
5.上下左右中心裁剪后翻转: transforms.TenCrop
二、翻转和旋转——Flip and Rotation

6.依概率p水平翻转transforms.RandomHorizontalFlip
7.依概率p垂直翻转transforms.RandomVerticalFlip
8.随机旋转：transforms.RandomRotation
三、图像变换

9.resize：transforms.Resize
10.标准化：transforms.Normalize
11.转为tensor：transforms.ToTensor
12.填充：transforms.Pad
13.修改亮度、对比度和饱和度：transforms.ColorJitter
14.转灰度图：transforms.Grayscale
15.线性变换：transforms.LinearTransformation()
16.仿射变换：transforms.RandomAffine
17.依概率p转为灰度图：transforms.RandomGrayscale
18.将数据转换为PILImage：transforms.ToPILImage
19.transforms.Lambda
四、对transforms操作，使数据增强更灵活

20.transforms.RandomChoice(transforms)
21.transforms.RandomApply(transforms, p=0.5)
22.transforms.RandomOrder

二.导入数据集


import torchvision.datasets as datasets
train_data=datasets .ImageFolder (root='fruits-360-original-size/fruits-360-original-size/Training',transform=data_transforms  )
print(train_data.classes)

输出为：

ImageForder函数只能导入 文件夹，不能导入文件。
Classes函数作用是根据分的文件夹的名字来确定的类别。

三.用DataLoader函数处理数据集

from torch.utils.data import DataLoader
batchsize=16
train_loader=DataLoader(train_data,batch_size=batchsize,shuffle=True,num_workers=1)

注意：
1.”batch_size= “一次训练所选取的样本数。
2.”shuffle=”输入一个布尔值来决定是否打乱数据
3.”num_workers= “是服务于多进程(multiprocessing)数据加载的, 用于设置有多少个子进程负责数据加载. num_workers并不是越大越好, 因为过多的子进程会占据 CPU 计算资源, 使得程序中其他在CPU上的计算部分变慢, 导致整体运行时间增加.

一般来说是通过逐步增加尝试来进行设置, 比如当GPU计算利用率已经很饱和时, 说明数据读取足够满足计算需求, 则不必再增加worker数量.

四.导入模型

import torchvision.models as models
AlexNet=models.AlexNet()
model=AlexNet

注意：
torchvision.models里面内置了许多预训练的模型，比如：
AlexNet
VGG
ResNet
SqueezeNet
DenseNet
Inception v3
其中ResNet18和AlexNet可以流畅运行。除了用Pytorch自带的模型也可以从本地导入模型，也可以自己定义模型。

五.权重初始化

import torch.nn.init as init
for name,module in model._modules.items() :
    if (name=='fc'):
        init.kaiming_uniform_(module.weight,a=0,mode='fan_in')

1.均匀分布 torch.nn.init.uniform_(tensor, a=0, b=1) 服从~U(a,b)
2.正太分布 torch.nn.init.normal_(tensor, mean=0, std=1) 服从~ N(mean,std)
3.初始化为常数 torch.nn.init.constant_(tensor, val) 初始化整个矩阵为常数val
4.Xavier
5.kaiming

六.定义优化器

import torch
optimizer=torch.optim .SGD(model.parameters(),lr=0.01 )
StepLR=torch.optim.lr_scheduler .StepLR (optimizer ,step_size= 3,gamma=1 )

注意：
StepLR（）作用是等间隔的调整学习率，调整倍数为gamma倍，调整间隔为step_size。

七.调用GPU


if torch.cuda.device_count()>1:
    model=nn.DataParallel(model)
print(device)

注意：
用GPU训练的模型，测试时只能用GPU测试

八.训练模型


import torch.nn.functional as F

def get_num_correct(outs, label):
    pass

model.to(device)

for epoch in range(10):
    total_loss=0
    print("epoch",epoch,":***************************")

    for batch in train_loader:
        images,labels=batch

        images=images.to(device)　
        labels=labels.to(device)

        outs=model(images)
        loss=F.cross_entropy(outs,labels)
        optimizer.zero_grad()　　
        loss.backward()
        optimizer .step()
        total_loss +=loss.item()
    print('loss',total_loss )

九.保存模型

torch.save(model,'FruitModelGPU.pth')

三.测试模型

1.定义数据初始化

import torchvision.transforms as transforms
image_size=(224,224)
data_transforms=transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.Resize(image_size ),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),

])

2.导入模型

import torch
model=torch.load('/home/ilab/FruitModelCpu4.pth',map_location='cpu')
model=model.module
model.eval()

注意：
因为使用GPU训练的模型，此时我们用CPU来进行测试，因此需要加上map_location=’cpu’，以及另起一行加上model=model.module

3.导入测试集(测试集为文件夹时)

import torchvision.datasets as datasets
test_data=datasets .ImageFolder (root='fruits-360-original-size/fruits-360-original-size/test',transform=data_transforms  )

4.进行测试

batch = next(iter(test_data))
images, labels = batch
out = model(images)
print(out)

注意：当测试集为打乱的文件时，前面的方法就行不通了，可以用下列方法：

1.定义数据初始化

import torchvision.transforms as transforms
image_size=(224,224)
data_transforms=transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.Resize(image_size ),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),

])

2.导入训练集

import torchvision.datasets as datasets
train_data=datasets .ImageFolder (root='/ilab/datasets/local/fruits/train',transform=data_transforms )

3.导入模型

import torch
model=torch.load('/home/ilab/FruitModelCpu4.pth',map_location='cpu')
model=model.module

4.进行测试

from PIL import Image
import os
i=1
sum=22688
root='/ilab/datasets/local/fruits/test'
file_list=os.listdir(root)
model.eval()
with open('/home/ilab/submission','w') as f:
        for filename in file_list:
            filepath = os.path.join(root,filename)
            img=Image.open(filepath)
            x=data_transforms(img).reshape((1,3,224,224))
            y= model(x)
            re=filename+' '+train_data.classes[int(y.argmax(dim=1))]+'\n'
            f.write(re)
            print(re)

5.FruitModelCpu4.pth下载地址：

链接: https://pan.baidu.com/s/17sa4Rda9jLhNRzKVkfsBMA 提取码: 2xv8 复制这段内容后打开百度网盘手机App，操作更方便哦

四.完整代码

"""""""""""""""""""""""定义数据初始化方法"""""""""""""""""""""""
import torch
import torch.nn
import torchvision
import torchvision.transforms as transforms
image_size=(224,224)
data_transforms=transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.Resize(image_size ),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),

])
"""""""""""""""""""""""导入数据集"""""""""""""""""""""""
import torchvision.datasets as datasets
train_data=datasets .ImageFolder (root='fruits-360-original-size/fruits-360-original-size/Training',transform=data_transforms  )
print(train_data.classes)
"""""""""""""""""""""制作DataLoader"""""""""""""""""""""""
from torch.utils.data import DataLoader
batchsize=500
train_loader=DataLoader(train_data,batch_size=batchsize,shuffle=True,num_workers=1)
""""""""""""""""""""""制作模型"""""""""""""""""""""""""""""
import torchvision.models as models
AlexNet=models.AlexNet()
model=AlexNet
"""""""""""""""""""""权重初始化"""""""""""""""""""""""
import torch.nn.init as init
for name,module in model._modules.items() :
    if (name=='fc'):
        init.kaiming_uniform_(module.weight,a=0,mode='fan_in')
"""""""""""""""""""""""定义优化器"""""""""""""""""""""
import torch
optimizer=torch.optim .SGD(model.parameters(),lr=0.01 )
StepLR=torch.optim.lr_scheduler .StepLR (optimizer ,step_size= 3,gamma=1 )
""""""""""""""""""""""调用GPU"""""""""""""""""""""""""""""

if torch.cuda.device_count()>1:
    model=nn.DataParallel(model)
print(device)
"""""""""""""""""""""""""""""""训练"""""""""""""""""""""""""""""""""
import torch.nn.functional as F

def get_num_correct(outs, label):
    pass

model.to(device)

for epoch in range(10):
    total_loss=0
    print("epoch",epoch,":***************************")

    for batch in train_loader:
        images,labels=batch

        images=images.to(device)
        labels=labels.to(device)

        outs=model(images)
        loss=F.cross_entropy(outs,labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer .step()
        total_loss +=loss.item()
    print('loss',total_loss )

""""""""""""""""""""""测试"""""""""""""""""""""""""
""""""""""""""""""""""权重初始化"""""""""""""""""""""""""
import torchvision.transforms as transforms
image_size=(224,224)
data_transforms=transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.Resize(image_size ),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
"""""""""""""""""""""""导入数据集"""""""""""""""""""""""
import os
import torchvision.datasets as datasets
train_data=datasets .ImageFolder (root='/ilab/datasets/local/fruits/train',transform=data_transforms )
"""""""""""""""""""""""导入模型"""""""""""""""""""""""
import torch
model=torch.load('/home/ilab/FruitModelCpu4.pth',map_location='cpu')
model=model.module
"""""""""""""""""""""""测试"""""""""""""""""""""""
 from PIL import Image
import os
i=1
sum=22688
root='/ilab/datasets/local/fruits/test'
file_list=os.listdir(root)
model.eval()
with open('/home/ilab/submission','w') as f:
        for filename in file_list:
            filepath = os.path.join(root,filename)
            img=Image.open(filepath)
            x=data_transforms(img).reshape((1,3,224,224))
            y= model(x)
            re=filename+' '+train_data.classes[int(y.argmax(dim=1))]+'\n'
            f.write(re)
            print(re)

])

Original: https://blog.csdn.net/qq_42548340/article/details/120825453
Author: Tomorrow；
Title: 用Pytorch实现水果分类，训练+测试（内附数据集下载，完整代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662108/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch学习笔记（5）–mnist数据集训练

from __future__ import print_function import os import struct import numpy as np import to…

人工智能 2023年7月14日
0042
墨迹天气语音包_小米有品“智能AI翻译机”评测，还内置了语音助手，随身WiFi功能…

出国旅游时，我们需要面对的最大问题应该就是言语沟通了，毕竟想要掌握一门新的语言不是什么容易的事情。近期，小米科技旗下的小米有品平台上线了一款新品：Langogo智能AI翻译机，对于…

人工智能 2023年5月27日
0068
Python数据分析：删除重复值df.drop_duplicates()

【小白从小学Python、C、Java】【Python-计算机等级考试二级】【Python-数据分析】Python数据分析删除重复值df.drop_duplicates() 选择题…

人工智能 2023年7月6日
0071
计算机视觉中的编码-解码器结构总结（持续更新）

文章目录 NLP领域的编码解码器结构机器学习中的编码器 * 自动编码器视觉领域中的编码解码器结构编码器-解码器结构：编码器原始输入信号转化为中间格式，然后解码器将中间格式转化…

人工智能 2023年6月24日
00188
随想录一刷Day53——动态规划

文章目录 Day53_动态规划 * 44. 最长公共子序列 45. 不相交的线 46. 最大子数组和 Day53_动态规划 44. 最长公共子序列 1143. 最长公共子序列思路：…

人工智能 2023年6月26日
0074
Python3.8安装tensorflow

以下内容是针对安装tensorflow-CPU版本的。 tensorflow已经支持Python3.8版本的安装。可以查看自己的Python版本信息，以及可以支持的tensorf…

人工智能 2023年5月23日
0068
图像恢复(加噪与去噪)

人工智能导论实验导航实验一：斑马问题 https://blog.csdn.net/weixin_46291251/article/details/122246347 实验二：图像…

人工智能 2023年6月18日
0084
用于轨道交通障碍物检测的改进Mask R-CNN

1. 文章信息文章题目为《Improved Mask R-CNN for obstacle detection of rail transit》，是2022年发表在Measure…

人工智能 2023年5月28日
0052
深度学习初级阶段——全连接神经网络（MLP、FNN)

在前面的数学原理篇中，已经提到了各种深度学习的数学知识基本框架，那么从这篇文章开始，我将和大家一起走进深度学习的大门（部分图片和描述取自其他文章）。目录一、首先我们需要知道什么…

人工智能 2023年7月13日
0081
性能监测工具-node-export

1.前言无论是做性能测试或是运维等都会用到对服务的监测，最基本的监测是就是对服务器的基本指标监测，比如：cpu、内存、I/O、网络等。这些其实一般系统自带的都有工具，很方便，比如…

人工智能 2023年6月27日
0077
回归分析模型

目录一、回归分析概述 1.1 确定性关系（函数关系） 1.2 非确定性关系（相关关系） 1.3 回归分析 1.4 最小二乘法二、一元线性回归三、多元线性回归四、回归检验 4…

人工智能 2023年6月18日
0097
pip 安装第三方库报错最全解决方案

我们在使用 Python 开发的时候，通常会用到一些好用的第三方库，推荐用 pip 来安装，比如安装 pandas python -m pip install pandas 一般情…

人工智能 2023年7月5日
00154
【读论文】A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time…

目录 1. 这篇文章的主要研究内容 2. MSCRED Framework * 1. Problem Statement 2. Overview – （1）Charac…

人工智能 2023年7月14日
0066
realsense D455深度相机+YOLO V5结合实现目标检测（二）

realsense D455深度相机+YOLO V5结合实现目标检测（二） 1.代码来源 2.环境配置 3.代码分析： * 3.1 主要展示在将detect.py转换为realse…

人工智能 2023年6月2日
0086
Keras中如何设置学习率和优化器以及两者之间的关系

在集成式机器学习类库Keras中，对优化器和学习率做了很好的封装，以至于很多人搞不清楚怎么设置学习率，怎么使用优化器，两者到底有什么区别。不同的学习率对模型训练过程中的损失值lo…

人工智能 2023年6月15日
0079
Heatmap热力图、pandas.DataFrame.corr()、皮尔森相关系数

Heatmap热力图 Heatmap热力图是一个以颜色变化来显示数据的矩阵。 matplotlib可通过以下两种方法绘制heamap； matplotlib.axes.Axes.i…

人工智能 2023年6月19日
0076

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

用Pytorch实现水果分类，训练+测试（内附数据集下载，完整代码）

一.数据集下载

二.训练模型

1.定义数据初始化

二.导入数据集

三.用DataLoader函数处理数据集

四.导入模型

五.权重初始化

六.定义优化器

七.调用GPU

八.训练模型

九.保存模型

三.测试模型

1.定义数据初始化

2.导入模型

3.导入测试集(测试集为文件夹时)

4.进行测试

1.定义数据初始化

2.导入训练集

3.导入模型

4.进行测试

5.FruitModelCpu4.pth下载地址：

四.完整代码

大家都在看