MindSpore图像分类训练resnet50实现

2023年6月25日上午5:01 • 人工智能 • 阅读 84

一、mindspore简介

MindSpore 是华为开源的全场景深度学习框架，旨在实现易开发、高效执行、全场景覆盖三大目标，其中易开发表现为API 友好、调试难度低，高效执行包括计算效率、数据预处理效率和分布式训练效率，全场景则指框架同时支持云、边缘以及端侧场景。

MindSpore 支持的Windows 和linux 系统，其中Windows 版本仅支持CPU 运行，linux 版本则支持GPU 和NPU （华为昇腾系列处理器）。

MindSpore 官网地址：https://www.mindspore.cn/。官网包含了安装说明、教程、文档、官方开源模型等资源，方便初学者快速入门。

二、训练环境

硬件环境：cpu（i7-1165G7）、内存16G；

软件环境：windows10、python3.7、pycharm、mindspore1.5

三、数据集与数据加载

MindSpore提供API接口直接加载Cirfar10、ImageNet、coco等开源数据集，对图像分类自定义数据集加载也十分方便。这里准备训练一个识别哈士奇和拉布拉多犬的二分类模型，首先需要准备图像并存入对应文件夹。如下：

数据准备：数据集分为训练集和测试集，两种类别的图片数量尽量一致，训练集husky(399)、labrador(400)，验证集：husky(51)、labrador(49)。数据集文件结构：

dataset:

train:

husky:1.jpg…

labrador:1.jpg…

val:

husky:1.jpg…

labrador:1.jpg…

加载数据集：将不同类别图像放在不同文件夹下，mindspore.dataset .ImageFolderDataset()接口可以直接对数据集进行加载和标注。

train_data_path = 'dataset/train'

data_set = ds.ImageFolderDataset(data_path, num_parallel_workers=8, shuffle=True)

图像预处理：图像解码、调整大小、标准化、矩阵转置。

  image_size = [224, 224]

  mean = [0.485 * 255, 0.456 * 255, 0.406 * 255]

  std = [0.229 * 255, 0.224 * 255, 0.225 * 255]

  trans = [

        CV.Decode(),

        CV.Resize(image_size),

        CV.Normalize(mean=mean, std=std),

        CV.HWC2CHW()

    ]

数据增强：如果数据集比较小，为了增强模型泛化能力，可以通过修改tran配置进行数据增强。

trans = [

            CV.RandomCropDecodeResize(image_size, scale=(0.08, 1.0), ratio=(0.75, 1.333)),

            CV.RandomHorizontalFlip(prob=0.5),

            CV.Normalize(mean=mean, std=std),

            CV.HWC2CHW()

        ]

数据的map映射、批量处理和数据重复的操作：

data_set = data_set.map(operations=trans, input_columns="image", num_parallel_workers=8)
&#xA0;&#xA0;&#xA0; data_set=data_set.map(operations=type_cast_op,input_columns="label",num_parallel_workers=8)

data_set = data_set.batch(batch_size, drop_remainder=True)

data_set = data_set.repeat(repeat_num)

四、模型训练和验证

使用MindSpore官方resnet.py脚本构建一个resnet50网络。

net = resnet50(2)

num_epochs=5

定义优化器和损失函数：

opt = nn.Momentum(params=net.trainable_params(), learning_rate=0.1, momentum=0.9)

loss = nn.SoftmaxCrossEntropyWithLogits(sparse=True, reduction='mean')

&#x5B9E;&#x4F8B;&#x5316;&#x6A21;&#x578B;&#xFF1A;

model = Model(net, loss, opt, metrics={"Accuracy": nn.Accuracy()})

&#x6A21;&#x578B;&#x8BAD;&#x7EC3;&#xFF1A;

eval_param_dict = {"model":model,"dataset":val_ds,"metrics_name":"Accuracy"}

eval_cb = EvalCallBack(apply_eval, eval_param_dict,)

model.train(num_epochs,train_ds, callbacks=[eval_cb,TimeMonitor()],dataset_sink_mode=False)

训练过程中，对每一个epoch进行验证，保留验证精度最好的模型参数。

训练结束后，使用训练过程保存的精度最好的参数对验证集进行验证，并对验证结果可视化。

五、迁移学习

MindSpore实现迁移学习流程：定义网络并加载预训练模型；删除预训练模型最后一层参数；给网络加载加载预训练参数；冻结除最后一层外所有参数。

&#x52A0;&#x8F7D;&#x9884;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;

param_dict = load_checkpoint('resnet50.ckpt')

&#x83B7;&#x53D6;&#x6700;&#x540E;&#x4E00;&#x5C42;&#x53C2;&#x6570;&#x7684;&#x540D;&#x5B57;

filter_list = [x.name for x in net.end_point.get_parameters()]

&#x5220;&#x9664;&#x9884;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;&#x6700;&#x540E;&#x4E00;&#x5C42;&#x7684;&#x53C2;&#x6570;

filter_checkpoint_parameter_by_list(param_dict, filter_list)

&#x7ED9;&#x7F51;&#x7EDC;&#x52A0;&#x8F7D;&#x53C2;&#x6570;

load_param_into_net(net, param_dict)

&#x51BB;&#x7ED3;&#x9664;&#x6700;&#x540E;&#x4E00;&#x5C42;&#x5916;&#x7684;&#x6240;&#x6709;&#x53C2;&#x6570;

for param in net.get_parameters():

&#xA0;&#xA0;&#xA0; if param.name not in ["end_point.weight","end_point.bias"]:

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0; param.requires_grad = False

六、模型测试和导出

测试模型：模型训练完成后，通过推理代码和测试集对模型进行评估。

推理实现代码：

import os

import numpy as np

import cv2

import mindspore.nn as nn

from mindspore import dtype as mstype

import mindspore.dataset.vision.c_transforms as CV

from mindspore import Model, Tensor, context, load_checkpoint, load_param_into_net

from resnet import resnet50

#&#x8BBE;&#x7F6E;&#x4F7F;&#x7528;&#x8BBE;&#x5907;&#xFF0C;CPU/GPU/Ascend

context.set_context(mode=context.GRAPH_MODE, device_target="CPU")

def normalize(image):

&#xA0;&#xA0;&#xA0; mean = [0.485 * 255, 0.456 * 255, 0.406 * 255]

&#xA0;&#xA0;&#xA0; std = [0.229 * 255, 0.224 * 255, 0.225 * 255]

&#xA0;&#xA0;&#xA0; image = cv2.resize(image, [224, 224], cv2.INTER_LINEAR)

&#xA0;&#xA0;&#xA0; image = image / 1.0

&#xA0;&#xA0;&#xA0; image = (image[:, :] - mean) / std

&#xA0;&#xA0;&#xA0; image = image[:, :, ::-1].transpose((2, 0, 1))&#xA0; # HWC-->CHW

&#xA0;&#xA0;&#xA0; return image

def pre_deal(data_path):

&#xA0;&#xA0;&#xA0; image = cv2.imread(data_path)

&#xA0;&#xA0;&#xA0; norm_img = normalize(image)

&#xA0;&#xA0;&#xA0; #norm_img = ms_normalize(image)

&#xA0;&#xA0;&#xA0; images = [norm_img]

&#xA0;&#xA0;&#xA0; images = Tensor(images, mstype.float32)

&#xA0;&#xA0;&#xA0; return images

def infer(ckpt_path, data_path, num_class):

&#xA0;&#xA0;&#xA0; image = pre_deal(data_path)

&#xA0;&#xA0;&#xA0; net = resnet50(num_class)

&#xA0;&#xA0;&#xA0; param_dict = load_checkpoint(ckpt_path)

&#xA0;&#xA0;&#xA0; load_param_into_net(net, param_dict)

&#xA0;&#xA0;&#xA0; loss = nn.SoftmaxCrossEntropyWithLogits(sparse=True, reduction='mean')

&#xA0;&#xA0;&#xA0; model = Model(net, loss, metrics={"Accuracy": nn.Accuracy()})

&#xA0;&#xA0;&#xA0; output = model.predict(image)

&#xA0;&#xA0;&#xA0; print(output)

&#xA0;&#xA0;&#xA0; pred = np.argmax(output.asnumpy(), axis=1)

&#xA0;&#xA0;&#xA0; return pred

if __name__ == '__main__':

&#xA0;&#xA0;&#xA0; ckpt_path = 'transfer_best.ckpt'

&#xA0;&#xA0;&#xA0; data_path = 'test'

&#xA0;&#xA0;&#xA0; class_name = {0: 'husky', 1: 'labrador'}

&#xA0;&#xA0;&#xA0; for path in os.listdir(os.path.join(data_path)):

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0; path = os.path.join(data_path) + '/' + path

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0; print(path)

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0; result = infer(ckpt_path, path, 2)

&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0; print(class_name[result[0]])

为了方便推理部署，MindSpore支持导出MINDIR、AIR、ONNX三种格式。

from mindspore import export, load_checkpoint, load_param_into_net

from mindspore import Tensor

import numpy as np

from resnet import resnet50

net = resnet50(2)

&#x5C06;&#x6A21;&#x578B;&#x53C2;&#x6570;&#x5B58;&#x5165;parameter&#x7684;&#x5B57;&#x5178;&#x4E2D;

param_dict = load_checkpoint("best.ckpt")

&#x5C06;&#x53C2;&#x6570;&#x52A0;&#x8F7D;&#x5230;&#x7F51;&#x7EDC;&#x4E2D;

load_param_into_net(net, param_dict)

input = np.random.uniform(0.0, 1.0, size=[1, 3, 224, 224]).astype(np.float32)

#&#x5BFC;&#x51FA;&#x6A21;&#x578B;&#xFF0C;&#x53EF;&#x5BFC;&#x51FA;ONNX&#x3001;MINDIR&#x3001;AIR&#x683C;&#x5F0F;

export(net, Tensor(input), file_name='resnet50_best', file_format='ONNX')

全部实现代码：

https://gitee.com/chen-jian51/mindspore_resnet50_husky_labrador/tree/master

Original: https://blog.csdn.net/jameschen9051/article/details/121565697
Author: 追猫人
Title: MindSpore图像分类训练resnet50实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650287/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一文理解DeepLab V1到DeepLab V3+（超系统、超详细）

文章目录 * – 预备知识 – + 空洞卷积 – 1、DeepLab V1 – + 1.1 基于VGG模型 + 1.2 总体架构 +…

人工智能 2023年6月18日
00184
ios基础（二）

一、swift 类和结构体的区别作为函数参数传递两者的区别值类型传递会copy?每次传递都会复制？对性能消耗有没有影响？区别：1.类属于引用类型，结构体属于值类型2.类允许被…

人工智能 2023年6月28日
0075
SIFT图像拼接

SIFT图像拼接文章目录 * – SIFT图像拼接* 前言* 二、相关工作* – 1.SIFT – 2.RANSAC拟合 – 3单…

人工智能 2023年5月28日
0072
【超简单】利用Python去除图片水印，太神奇了叭，你还不会嘛？（附三种方法）

前言哈喽！我是栗子，今天忙里偷闲给大家更新一下文啦~ 所有文章完整的素材+源码都在👇文末自取哦! 大家是不是经常遇到一些电子版加了一些水印需要去掉才能用的或是需要加一些水印文字的…

人工智能 2023年7月4日
0087
Opencv2与Opencv4共存

//写在前面因为许多代码找到的都是基于 opencv2的，但是在电脑上已经装了 opencv4，查了一下发现是可以共存的，所以就记录一下过程。电脑已经装好了 opencv4.5…

人工智能 2023年7月20日
0083
基于pytorch的yolov5运行报错warnings.warn(‘User provided device_type of ‘cuda‘, but CUDA is not available）

sdk LCS/Telegraphics Wintab Interface Specification 1.1: 16- and 32-bit API Reference By R…

人工智能 2023年7月21日
0073
VIT中提取图像分类特征的详细步骤

图1. VIT结构图 VIT是第一篇纯视觉transformer,被当成了许多网络的backbone。现在自己梳理一下VIT怎么从一张图像中提取特征，最后用于分类的过程。（自己的理…

人工智能 2023年5月28日
0097
图像处理中几何畸变校正,图像纠正的方法有哪些

如何通过人工神经网络实现图像识别。人工神经网络（ArtificialNeuralNetworks）（简称ANN）系统从20世纪40年代末诞生至今仅短短半个多世纪，但由于他具有信…

人工智能 2023年6月18日
0071
张量在神经网络算法中的角色是什么

引言在神经网络算法中，张量（tensor）起着非常重要的作用。它是表示多维数据的方式，可以存储和处理神经网络中的各种数据，并传递给下一层的神经元。本文将详细介绍张量在神经网络算法…

人工智能 2024年1月1日
0051
【机器学习】聚类算法——高斯混合聚类（理论+图解）

🌠 『精品学习专栏导航帖』 🐳最适合入门的100个深度学习实战项目 🐳 🐙【PyTorch深度学习项目实战100例目录】项目详解 + 数据集 + 完整源码 🐙 🐶【机器学习入门项目…

人工智能 2023年6月25日
0079
时间序列模型-ARIMA

一、ARIMA模型基本概念 1.1 自回归模型（AR）描述当前值与历史值之间的关系，用变量自身的历史数据对自身进行预测；自回归模型必须满足平稳性的要求；（何为平稳性：见时间序列…

人工智能 2023年7月25日
0058
Week2 Python之机器学习

1 多项式回归 1.1 生成数据集我们首先通过Numpy的随机采样函数获取数据集，同时添加一定的噪声，并将其保存至文件中。 import numpy as np x = np.r…

人工智能 2023年7月2日
00101
毕设题目：Matlab风电功率预测

1 案例背景提出一种高效准确的风电功率预测方法。将灰色理论预测模型、深度置信网络模型相结合构建风电功率预测组合模型,实现了风电中长期功率的高精度预测。仿真结果表明,选取适当的网络参…

人工智能 2023年6月22日
00104
使用YOLOP进行目标检测和分割

代码：https://github.com/hustvl/YOLOP 论文：https://arxiv.org/abs/2108.11250 目录一.数据处理代码二. 修改YO…

人工智能 2023年5月26日
0099
Gabor特征码分析

转载请注明出处The Gabor filter, named after Dennis Gabor, is a linear filter used in myriad of im…

人工智能 2023年6月22日
0082
Wav2Lip模型——《A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild》论文解读及代码解析

在这篇文档中，我们将研究任意人物的人脸视频与目标音频的口型匹配问题。当前领域能做到对特定训练过的人物进行精准的口型匹配，但在其他未训练的人物上效果不好。我们找到了导致这种问题的主要…

人工智能 2023年5月28日
00104

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

MindSpore图像分类训练resnet50实现

一、mindspore简介

二、训练环境

三、数据集与数据加载

四、模型训练和验证

五、迁移学习

六、模型测试和导出

大家都在看