【图像分类】YOLOv5-6.2全新版本：支持图像分类

2023年7月26日下午3:39 • 人工智能 • 阅读 73

前言

众所周知，YOLOv5是一款优秀的目标检测模型，但实际上，它也支持图像分类。在6.1版本中，就暗留了 classify这个参数，可以在做检测的同时进行分类。

官方仓库地址：https://github.com/ultralytics/yolov5/releases

更新概览

在几天前刚新出的6.2版本中，直接将分类功能单独剥离开来，使其能够直接训练图像分类数据集。

先看看官网公示的更新说明：

分类功能
新增分类功能，并提供各模型在ImageNet上训练过的预训练模型
ClearML日志记录
与开源实验跟踪器ClearML集成。使用pip安装clearml将启用集成，并允许用户跟踪clearml中的每个训练运行。
Deci.ai优化
在Deci上单击一次即可自动编译和量化YOLOv5，从而获得更好的性能
GPU导出基准
可以使用 python utils/benchmarks.py --weights yolov5s.pt --device 0来导出Benchmark (mAP and speed)
训练可完全复现
torch>=1.12.0的单GPU YOLOv5训练现在完全可再现，并且可以使用新的–seed参数（默认seed=0）
优化Apple炼丹体验
Apple Metal Performance Shader(MPS：苹果炼丹工具) 支持Apple M1/M2设备

在这些更新中，我最关注的是图像分类功能，那么本篇就来尝试跑通一下。

分类模型效果

下图是官方贴出来的各分类模型对比图，在可以看到在相同的数据集上，YOLOv5x-cls模型取得了最佳的准确率。下列这些模型官方均提供预训练权重。

; 工程结构

首先看新版本的工程结构，和前几个版本差别不大。主要是多了一个 classify文件夹，包含图像分类训练，验证，检测三个函数。

训练结果会保存在 runs/train-cls文件夹中。

数据集下载

在 train.py中，提供这段数据集下载程序段：


with torch_distributed_zero_first(LOCAL_RANK), WorkingDirectory(ROOT):
    data_dir = data if data.is_dir() else (DATASETS_DIR / data)
    if not data_dir.is_dir():
        LOGGER.info(f'\nDataset not found ⚠️, missing path {data_dir}, attempting download...')
        t = time.time()
        if str(data) == 'imagenet':
            subprocess.run(f"bash {ROOT / 'data/scripts/get_imagenet.sh'}", shell=True, check=True)
        else:
            url = f'https://github.com/ultralytics/yolov5/releases/download/v1.0/{data}.zip'
            download(url, dir=data_dir.parent)
        s = f"Dataset download success ✅ ({time.time() - t:.1f}s), saved to {colorstr('bold', data_dir)}\n"
        LOGGER.info(s)

如果指定的数据集路径下没有数据集，会从官方仓库v1.0的版本中进行下载。这里我建议是手动去进行下载，受限于网络情况，自动下载很容易失败。

可以看到，在官方仓库v1.0版本中的Assets中包含了很多数据集，我下载了最经典的mnist的数据集来做测试。

下载完之后，需要在本地进行解压，解压之后的数据集格式如下图所示：

禁用wandb

训练之前，可以选择禁用wandb，wandb是和tensorboard类似的数据记录平台，为了防止报错，可以用下面的方式进行禁用。

在终端环境中输入 wandb disabled

同时在 utils/loggers/wandb/__init__.py中添加 wandb = None

try:
    import wandb

    assert hasattr(wandb, '__version__')
    if pkg.parse_version(wandb.__version__) >= pkg.parse_version('0.12.2') and RANK in {0, -1}:
        try:
            wandb_login_success = wandb.login(timeout=30)
        except wandb.errors.UsageError:
            wandb_login_success = False
        if not wandb_login_success:
            wandb = None
except (ImportError, AssertionError):
    wandb = None

wandb = None

在 utils/loggers/wandb/wandb_utils.py中同样添加

try:
    import wandb

    assert hasattr(wandb, '__version__')
except (ImportError, AssertionError):
    wandb = None

wandb = None

开始训练

在 train.py中主要修改下面一些超参数，基本和目标检测类似，值得注意的是图像分类训练中，并不需要指定模型结构，模型结构完全包含在了预训练模型中，使用起来更为方便。如果需要深入了解YOLO模型是如何引出分类的，可以导出ONNX模型，再使用netron查看。

训练完成之后，会自动调用测试程序，绘制测试结果。

可以看到，我只使用 YOLOv5-cls模型训练了10个epoch，就在mnist上取得了不错的效果。

; 模型预测

模型预测更简单，指定训练好的权重 weights，输入图像 source，图像尺寸 imgsz即可。

模型会从高到低输出前5个类别的概率值。

代码备份

本次实验代码包含YOLOv5-6.2版本提供的所有预训练权重和mnist数据集。
备份地址：https://pan.baidu.com/s/1msi5qaE82nEbCha641lkPA?pwd=8888

Original: https://blog.csdn.net/qq1198768105/article/details/126432538
Author: zstar-_
Title: 【图像分类】YOLOv5-6.2全新版本：支持图像分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/717058/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

UNet、UNet++、UNet3+系列

一、unet 简介继承FCN的思想，继续进行改进。但是相对于FCN，有几个改变的地方，U-Net是完全对称的，且对解码器（应该自Hinton提出编码器、解码器的概念来，即将图像-…

人工智能 2023年5月28日
0098
如何在M1 MacOS上面安装Centos

本文档主要介绍Mac M1芯片如何通过Vmware虚拟机，安装Centos系统。安装准备安装之前需要下载虚拟机安装包和Centos8镜像。百度云自取链接: https://p…

人工智能 2023年6月4日
00115
关于机器学习分类与回归问题、深度学习各类超参数的简单介绍和网络搭建的简单介绍（学习笔记）

首先，我们了解机器学习的分类与回归问题。（1）什么是机器学习？机器学习，顾名思义就是让机器（计算机）进行学习。首先针对一个任务设计一种算法，再通过投喂计算机数据让它提取数据中蕴…

人工智能 2023年6月17日
0077
一元钱注册 chatGPT账号

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0055
初识人工智能

1、什么是人工智能？先从一部电影谈起！ 2001年好莱坞导演斯皮尔伯格执导的一部科幻电影，就叫《人工智能》。主人公大卫（David），是一个类似人类男孩的人形机器人，他具有人类…

人工智能 2023年7月14日
0064
图像分割的方法

导读：数字图像处理技术是一个跨学科的领域。随着计算机科学技术的不断发展，图像处理和分析逐渐形成了自己的科学体系，新的处理方法层出不穷，尽管其发展历史不长，但却引起各方面人士的广泛关…

人工智能 2023年5月26日
00105
数据挖掘与分析——聚类模型

一、人工数据集使用make_blobs产生3个簇的数据，使用make_moons产生2个簇的数据；分别使用K-means和DBSCAN算法对数据进行聚类。K-means的k值设…

人工智能 2023年6月2日
0089
pyspark DataFrame问题解决

pyspark.sql.DataFrame.dropDuplicates(subset=None) 作用：返回删除重复行的新 DataFrame，可选择仅考虑某些列。 Exampl…

人工智能 2023年7月8日
0075
深度学习笔记（3）——pytorch+TextCNN实现情感分类（外卖数据集）

文章目录 0 前言 1 数据准备 1.1 常量 1.2 加载数据集 2 数据预处理 3 文本表示 4 TextCNN模型 5 模型训练 6 模型评估 7 总览 8 完整代码 0 前…

人工智能 2023年7月3日
00105
Conda虚拟环境用conda和pip安装软件包的路径问题

pip安装路径。参考博客ubunt18.04中pip安装的包和虚拟环境中pip安装的包各自在哪里一：正式环境中 1. pip pip3 安装的包在下面路径（pip指向了pytho…

人工智能 2023年7月29日
0098
MFCC特征提取

在语音识别方面，最常用到的语音特征就是梅尔倒谱系数（Mel-scaleFrequency Cepstral Coefficients，简称MFCC）。 MFCC的提取过程包括预处理…

人工智能 2023年7月28日
0079
深度学习中数据集很小是一种什么样的体验

前言今天提一个比较轻松的话题，简单探讨数据集大小对深度学习训练的影响。不知道大家有没有看过这篇文章：Don’t use deep learning your data…

人工智能 2023年6月4日
0090
GaussDB T 主备搭建切换switchover、failover

整个过程还是很简单的 mkdir -p /gdb/gaussdb/app /gdb/gaussdb/datachown -R omm.dbgrp gaussdb /gdb/soft…

人工智能 2023年6月29日
0079
中值滤波-理论基础

“平滑处理”（smoothing）也称”模糊处理”（bluring），是一项简单且使用频率很高的图像处理方法。平滑处理的用途有很多，…

人工智能 2023年5月26日
00110
Python_数据读取_读取单个csv文件和批量读取csv文件

直接读取单个csv文件通过pd.read_csv()函数直接在指定路径进行文件读取，需要利用Pandas包。其中： 1、路径前的r表示路径符号不转义，window操作系统下不再用…

人工智能 2023年7月7日
0070
多文档的抽取式自动文本摘要

1.抽取式自动文本摘要本文自动文本摘要实现的依据就是词频统计。文章是由句子组成的，文章的信息都包含在句子中，有些句子包含的信息多，有些句子包含的信息少。句子的信息量用&#82…

人工智能 2023年6月1日
00151

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【图像分类】YOLOv5-6.2全新版本：支持图像分类

大家都在看