YOLOv3训练数据集

2023年7月10日下午2:44 • 人工智能 • 阅读 78

这是我第一次尝试用yolo v3训练自己的数据集，以此整理一下来清晰思路，自此便可熟练训练深度学习模型。

电脑配置

系统：Windows10

显卡：GTX 1660ti（6G）

CPU：九代i7

开发环境：pytorch+cuda+cudnn

本次我们使用的是VOC数据集，附下载链接：

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

下载如图所示的前两行数据集。

下载后如图：

我们将其解压打开所在路径：

JPEGImages文件夹存放的便是用于训练的照片，也就是我们此次用到的照片。

Annotations文件夹中放置数据标注后的文件，也就是*.xml文件。

Main文件夹中放置test.txt 、train.txt 、trainval.txt 、val.txt文件。（文件主要是用来训练或测试的图像的名称）

; 数据集处理

1.标注数据集：

将图片用labelImg进行标注，生成的xml文件存放在Annotations文件夹中。

2.转换xml文件到txt文件：
*.xml包含了图像名称、图像路径、图像size和深度、标记框的坐标信息。
.txt*包含了分类种类数、中心点横坐标、中心点纵坐标，宽，高。

转换代码voc_label.py下载链接：https://pjreddie.com/media/files/voc_label.py

下载好后有两处地方需要修改：

sets是需要转换标签的数据集，这里我们只有VOC 2007。
classes 是标注的标签名字，根据需要加入和修改。

运行程序voc_label.py，会生成以下两个txt文件

2007_train.txt为训练数据集图片的路径

相对应的2007_val.txt则为测试集的图片路径。

配置文件修改

修改数据配置文件

我们进入yolo v3中找到如图

custom.data 如图

修改classes为自己需要训练的种类数，train为自己训练集读取文件的路径，valid则为测试集的，这两个文件我们前面已经提到过。

coco.names 你可以在这个文件中修改，也可以新建一个.names的文件，如图

将前面的voc_label.py的classes列表中的种类名写入此文件，注意一定要按顺序写入！

修改cfg配置文件

注意：使用哪个cfg文件就改哪个。

cfg 文件是yolo v3用来存储网络结构的文件，在别的篇章中会详细介绍他各个语句的作用。如图，

它将每一个网络层的参数用如此简洁的方式写出来，可以说十分方便

如图

我们需要将yolo层中的classes改为需要训练的种类数

紧挨着yolo层的最后一个卷积层（convolutional）中的filter修改，具体修改公式：

filter = 3*(5+classes) ，其中3是因为yolo输出的张量（anchor）数量为3个，5是因为特征(x, y, w, h, score)。以此代码中的20分类为例，filter =75

而且我们需要修改三对，原因是yolo层有三个，原理前面也说了。

当然我们也可以选择不修改cfg文件，应该也没啥影响。

下载预训练模型(.weight)

在此文件夹中找到sh文件，也就是shell文件

运行shell脚本，如果没有环境直接粘贴网址下载也行。

; 准备训练

找到train.py中的命令行参数，如图

修改cfg文件和data文件的路径

修改weights文件的路径。

然后运行train.py我们就可以开始训练了。

在这个过程中我们遇到了一个错误，最后记录下：

yolo v3框架并不能读取JPEGImage文件夹，只能读取images。因此我们需要对文件夹名进行修改，虽然感觉很脑瘫但是没有办法。

Original: https://blog.csdn.net/m0_46669342/article/details/123806690
Author: 夙曦呀
Title: YOLOv3训练数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/682998/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

记录若干`tf.py_function`的使用的方式，便于查阅

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月23日
0062
python实现树莓派监控_树莓派上安装pyaudio 及对声音实时监控

在树莓派上最常用的录音是arecord命令，但是功能有限，不能实现检测到声音做出反应。但是pyaudio能。本文实现的功能是在树莓派上监听声音，当分贝超过阈值，将会做出反应，例子…

人工智能 2023年5月27日
00183
FP增长算法

【2021 第一组 FP增长算法】问题描述寻找频繁项是数据挖掘中一个常见问题。比如上图中，输入【数据挖掘】，搜索引擎会自动显示【工具】这个词汇，{数据挖掘，词汇}是搜索引擎记录…

人工智能 2023年7月17日
0046
【阿里云】轻松玩转linux服务器

目录一、概述二、发展三、镜像选择 3.1 应用镜像 3.2 系统镜像 3.3 自定义镜像 3.4 总结四、防火墙五、快照六、监控系统七、远程连接 7.1 浏览器安全连…

人工智能 2023年6月26日
0099
python中dropna函数_【Python】Dataframe删除空值

使用dropna()函数就可以去掉dataframe中的空值。这里就直接用的官方文档里面的例子。 df = pd.DataFrame({“name”: [&…

人工智能 2023年7月7日
0097
Opencv之图像边缘检测：1.Sobel算子（cv2.Sobel）

图像梯度计算的是图像变化的速度。对于图像的边缘部分，其灰度值变化较大，梯度值也较大；相反，对于图像中比较平滑的部分，其灰度值变化较小，相应的梯度值也较小。一般情况下，图像梯度计算的…

人工智能 2023年6月17日
0081
PaddleNLP基于ERNIR3.0文本分类以CAIL2018-SMALL数据集罪名预测任务为例【多标签】

NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等专栏详细介绍：NLP专栏简介：数据增强、智能标注…

人工智能 2023年7月1日
0094
头部姿态估计综述

头部姿态估计（Head P…

人工智能 2023年6月15日
0092
聚类的方法、原理以及一般过程

1.聚类的定义 聚类(Clustering)是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似…

人工智能 2023年6月15日
0091
YOLOv5 神经网络训练（本地训练）

在训练文件train.py中找到main的部分 if __name__ == ‘__main__’: parser = argparse.ArgumentParser() par…

人工智能 2023年7月14日
0059
机器学习强基计划1-1：图文详解感知机算法原理+Python实现

目录 0 写在前面 1 什么是线性模型？ 2 感知机概述 3 手推感知机原理 4 Python实现 * 4.1 创建感知机类 4.2 更新权重与偏置 4.3 判断误分类点 4.4 …

人工智能 2023年7月5日
0078
vscode搭建opencv环境

虽然vs2019和opencv搭配使用挺简单的，但是还是希望能够用轻量级的vscode来实现编程，所以研究了cmkae+vscode配置opencv的开发环境。 opencv的获取…

人工智能 2023年7月20日
0077
python修改wav文件声音大小_Python更改wav文件的音高

由于wav文件基本上是原始音频数据,因此如果没有”原始音频处理”,您将无法更改音高. 这是你能做的. 您将需要wave(标准库)和numpy模块. impo…

人工智能 2023年5月27日
0091
论文笔记：Dual Contrastive Loss and Attention for GANs

目录一.Dual Contrastive Loss and Attention for GANs 是什么？ 1.损失函数 2.网络结构 3.总结二.这项工作主要做了什么？ 1….

人工智能 2023年6月20日
0089
【Python】常用距离计算方法

1. 什么是距离度量 2. 距离度量分类（1）几何距离度量 1）欧氏距离 Euclidean distance Original: https://blog.csdn.net/a…

人工智能 2023年6月27日
0089
论文解读：AdderSR Towards Energy Efficient Image Super-Reso

本文主要介绍的是加法神经网络的超分应用 (CVPR 2021 Oral），这篇是华为诺亚AdderNet的衍生版本，在超分辨率上的应用。 AdderNet显著降低了分类网络的能耗，…

人工智能 2023年7月13日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

YOLOv3训练数据集

电脑配置

; 数据集处理

配置文件修改

; 准备训练

大家都在看