基

2023年5月26日下午7:05 • 人工智能 • 阅读 67

基于colab的yolov3-tensorflow训练自己的数据集（全小白教程）

1.站在巨人的肩上
2.colab的使用
*
1. 创建谷歌账号；
2. 创建云盘；
3.挂载云盘文件夹
3.YOLOV3-Tensorflow
*
1.下载源码
2.下载Labelimg标注工具
3.创建VOC文件夹
4.标注图像
5.分割训练集与测试集
6.放入yolov3.weights文件
7.上传文件夹
4.在colab服务器上进行训练
*
1.服务器基本设置
2.挂载colab文件夹
3.生成tfrecord文件
4.迁移训练
5.测试模型
总结

本文原创：转载请说明来源

1.站在巨人的肩上

github源码：https://github.com/zzh8829/yolov3-tf2

参考B站视频：https://www.bilibili.com/video/BV1YK4y1E7zd（colab使用）
https://www.bilibili.com/video/BV1r5411t7Db?t=1536&p=2（训练）

2.colab的使用

colab是谷歌推出的免费GPU使用的云服务器平台（说实话，用完之后感觉谷歌还是一个良心企业），想深入了解的可以去谷歌官网了解。

1. 创建谷歌账号；

 **&#x524D;&#x60C5;&#x63D0;&#x793A;**&#xFF1A;&#x4F7F;&#x7528;&#x8C37;&#x6B4C;&#x7684;&#x65F6;&#x5019;&#xFF0C;&#x6700;&#x597D;&#x8981;&#x6709;&#x80FD;&#x201C;&#x79D1;&#x5B66;&#x201D;&#x4E0A;&#x7F51;&#x7684;&#x5DE5;&#x5177;&#xFF0C;&#x4E0D;&#x7136;&#x4E2D;&#x95F4;&#x67D0;&#x4E00;&#x6B65;&#x53EF;&#x80FD;&#x5C31;&#x8FDB;&#x884C;&#x4E0D;&#x4E0B;&#x53BB;&#x4E86;&#x3002;
 &#x5927;&#x5BB6;&#x4E0B;&#x8F7D;&#x88C5;&#x597D;&#x8C37;&#x6B4C;&#x6D4F;&#x89C8;&#x5668;&#xFF0C;&#x7136;&#x540E;&#x6CE8;&#x518C;&#x4E00;&#x4E2A;&#x8C37;&#x6B4C;&#x8D26;&#x53F7;&#x5C31;&#x884C;&#xFF0C;&#x8FD9;&#x4E2A;&#x6BD4;&#x8F83;&#x7B80;&#x5355;&#xFF0C;&#x9700;&#x8981;&#x81EA;&#x5DF1;&#x7684;&#x624B;&#x673A;&#x53F7;&#xFF0C;&#x5C31;&#x4E0D;&#x591A;&#x8BF4;&#x4E86;&#x3002;

2. 创建云盘；

登录号账号，可以在谷歌浏览器的右上方你头像的左边按钮里面找到 云端硬盘，点击进去。

在左上方点击新建然后点击 关联更多应用

在搜索里面找到colabratory，安装好后，返回云端硬盘新建，可以直接看到该应用了。

; 3.挂载云盘文件夹

由于colab设计的初衷是供大家短期使用，所以每次使用colab服务器，里面的文件都会被清除。建议大家把工程文件放到云盘，然后进行挂载，不然colab服务器不会保存你的文件。挂载操作我会放到下面一起讲解。

3.YOLOV3-Tensorflow

1.下载源码

本教程使用的源码地址是：https://github.com/zzh8829/yolov3-tf2，大家下载后解压放在一个全英文路径就行了。

2.下载Labelimg标注工具

不会使用的同学，可以参考https://www.jianshu.com/p/ff99d430150f，保证能打开软件界面后，看下面内容。

3.创建VOC文件夹

各位一定要严格按照这样的格式进行创建，不要做修改，直接照着搬就行了。（这里有两个py文件是我写的脚本，后续会说）

yolov3-tf2-master
VOCdevkit
VOC2012
- Annotation
- ImageSets
Main
- JPEGImages

现在文件夹里面的内容都是空的，接下来，把所有需要标注的文件放进JPEGImages里面，注意要是jpg格式的图片。

下面的代码是用于格式化图片名称的，这样方便后续查看。


import os

class ImageRename():
 def __init__(self):
  self.path = 'E:\yolov3-tf2-master\VOCdevkit\VOC2012\JPEGImages'

 def rename(self):
  filelist = os.listdir(self.path)
  total_num = len(filelist)
  i = 0
  for item in filelist:
    if item.endswith('.jpg'):
     src = os.path.join(os.path.abspath(self.path), item)
     dst = os.path.join(os.path.abspath(self.path), '0000' + format(str(i), '0>3s') + '.jpg')
     os.rename(src, dst)
     i = i + 1

if __name__ == '__main__':
 newname = ImageRename()
 newname.rename()

效果就像这样。

4.标注图像

打开labelimg，我们需要注意把第三个圈住的地方改成pascalVOC模式，然后点击open Dir找到刚刚我们的JPEGImages文件夹，然后点Change Save Dir把标注好的xml文件存到Annotation里，然后就是进行标注工作。操作都是图形化的，很简单，能看懂，如果实在不懂的，可以看看这方面的教程，主要是要把路径设置正确。

特别注意：在标注的时候，你的数据集有多少类别，就相应的在data文件夹里，复制voc2012.names文件，然后改成你想要的（我这里改成了face_voc2012.names）,文件里面存放的是你的类，一类一行，本教程用的是一类就是face。（ 在所有操作中，需要注意你的文件名和地址，方面与我的教程有所不同时，自己修改）

标注完成后，会生成这样的xml文件，那就代表完成标注工作了。

; 5.分割训练集与测试集

在ImageSets里的Main里创建py文件，源码我放下面，作用就是分割好训练集与测试集

import os,glob
path = r'E:\yolov3-tf2-master\VOCdevkit\VOC2012\JPEGImages'
path_list = os.listdir(path)
path_list.sort()
print(len(path_list))
with open('train.txt', "w", encoding='utf-8') as f:
    for i in path_list[0:int(len(path_list)*0.8)]:
            sentences = i[:-4]+'\n'
            f.write(sentences)

with open('val.txt', "w", encoding='utf-8') as f:
    for i in path_list[int(len(path_list)*0.8):-1]:
            sentences = i[:-4]+'\n'
            f.write(sentences)

其实这里面存放的就是图片的地址。

6.放入yolov3.weights文件

在https://pjreddie.com/media/files/yolov3.weights下载yolov3.weights放在data文件夹下。

7.上传文件夹

做完上面的步骤，我们把文件夹上传到我的云端硬盘。

; 4.在colab服务器上进行训练

1.服务器基本设置

在云端硬盘新建中选择colab进入服务器，点击左上方修改，点击 笔记本设置，选择GPU。

然后点击右上方 连接到托管的运行时，即可连接使用colab服务器了。

; 2.挂载colab文件夹

需要说明的是：colab服务器使用的是Linux系统，IDE是jupyter notebook，小白的话需要懂一些基础操作。（比如运行代码需要在前面加感叹号）
在界面上方点击+代码，添加代码块，尽量多添加几条。

然后在代码块中键入一下代码，尽量一行一个代码块，方面查看。

import os
from google.colab import drive
drive.mount('/content/drive')

%cd /content/drive

%ls

%cd My\  Drive/

%cd /content/drive/MyDrive/yolov3-tf2-master

!pip install -r requirements-gpu.txt

!python convert.py

3.生成tfrecord文件

这个操作是这个tensorflow版本特有的操作，目的应该是将所有训练集和测试集的地址全部存入一个地址，方便读取。

python tools/voc2012.py   --data_dir ./VOCdevkit/VOC2012  --split train   --output_file   ./data/voc_train.tfrecord --classes ./data/face_voc2012.names
python tools/voc2012.py   --data_dir ./VOCdevkit/VOC2012  --split val   --output_file   ./data/voc_val.tfrecord --classes ./data/face_voc2012.names

执行完后，会在data文件夹下生成voc_train.tfrecord和voc_val.tfrecord，那就代表生成tfrecord文件成功了。

4.迁移训练

下面的代码用于训练，参数较多，不过都应该都可以看懂，一一对应就好。

python train.py --dataset  ./data/voc_train.tfrecord --val_dataset   ./data/voc_val.tfrecord --classes ./data/face_voc2012.names --num_classes 1 --mode fit --transfer darknet --batch_size 32 --epochs 20 --weights ./checkpoints/yolov3.tf --weights_num_classes 80

如果你训练的类目与我有所不同，请修改 num_classes，其他的可以保持不动。
还有一点需要注意的就是：在训练过程中，可以会出现loss还未降到20，就过早停止训练的情况 WARNING:tensorflow:Unresolved object in checkpoint: (root).layer-8 W0428 16:43:05.946897 140396833212224 util.py:150] Unresolved object in checkpoint: (root).layer-8 WARNING:tensorflow:Unresolved object in checkpoint: (root).layer-9 W0428 16:43:05.947242 140396833212224 util.py:150] Unresolved object in checkpoint: (root).layer-9 Epoch 00003: early stopping
这时候我们需要打开train.py进行修改


        callbacks = [
            ReduceLROnPlateau(verbose=1),
            EarlyStopping(patience=3, verbose=1),
            ModelCheckpoint('checkpoints/yolov3_train_{epoch}.tf',
                            verbose=1, save_weights_only=True),
            TensorBoard(log_dir='logs')
        ]

本教程标注了45张人脸作为训练，训练步数epoch设置为了20。用时219秒，loss就降到了73。不得不说这比在darknet上训练快多了，我快感动哭了。。。。
不过大家自己做的时候，要尽量保证loss降到20以下，这样模型才准确。
完成训练后，模型会保存到./checkpoints/，在下面一步会用到

5.测试模型

测试模型用下面的代码，注意有与我不同的地方，请自己修改，比如权重文件地址，和图片地址， 特别注意：这里把threshold设置为 0.3，因为源码的最高分为0.5，所以不设置的话，可能会导致显示不出来。

python detect.py --classes ./data/face_voc2012.names --num_classes 1 --weights ./checkpoints/yolov3_train_20.tf  --image  ./VOCdevkit/VOC2012/JPEGImages/0000016.jpg
--yolo_score_threshold 0.3

本教程测试的效果如下

总结

总的来说，整个流程会有点复杂，但是绝对不难，相信各位仔细操作，就可以跑出结果，对于更高阶的检测，比如连接摄像头和其他，可以看源码的说明文档，由于我目前没有设备所以就没有演示。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/521303/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Dataframe取特定的行/列&按行/列遍历数据的值_python处理Excel入门

文章目录取Dataframe特定的行/列 * 取特定的列 – 按列名选取列取特定的行 – 按行名选取行按数字选取行同时选取行和列 – 按…

人工智能 2023年7月7日
0088
ROS学习——Ubuntu16.04 + ROS Kinetic下语音识别PocketSphinx功能包的安装和使用

1、前言由于pocketsphinx只支持到Ubuntu14.04，ROS Kinetic不支持 sudo apt-get install ros-kinetic-pockets…

人工智能 2023年5月27日
0084
Pytorch模型测试时显存一直上升导致爆显存

首先说明: 由于我的测试集很大, 因此需要对测试集进行分批次推理. 在写代码的时候发现进行训练的时候大概显存只占用了2GB左右, 而且训练过程中显存占用量也基本上是不变的. 而在测…

人工智能 2023年7月13日
0077
Ubuntu22.04 在线安装 LAMP

Ubuntu22.04 在线安装 LAMP Ubuntu22.04 在线安装 MySQL8 MySQL APT存储库的下载页面 wget https://repo.mysql.co…

人工智能 2023年6月28日
0096
新开源基于WEBRTC+讯飞听写API的质检SDK库

大家好，最近我我在gitee 上新开源了基于WEBRTC+讯飞听写API的质检SDK库，欢迎大家访问学习交流。首先你需要在讯飞平台注册，获取AppID，apiKey，apiS…

人工智能 2023年5月25日
0065
自动驾驶－YOLOV5目标检测

1、环境：操作系统：Ubuntu20.04 Python3.9 Pytorch1.10.2 IDE：（本人使用的是ECLIPSE）显卡：NVIDIA GeForce GTX 1…

人工智能 2023年7月10日
0070
第五步：RTX 3060配置CUDA和cuDNN、安装PyTorch

win11，NVIDIA GeForce RTX 3060python 3.7，CUDAv11.1.1，PyTorch 1.9.0author：zoxiii PyCharm配置CU…

人工智能 2023年7月4日
0085
CVPR2022:Generalizable Cross-modality Medical Image Segmentation via StyleAugmentation and Dual Norm

CVPR2022:Generalizable Cross-modality Medical Image Segmentation via StyleAugmentation and…

人工智能 2023年7月28日
0069
基于YOLOv5的中式快餐店菜品识别系统

基于YOLOv5的中式快餐店菜品识别系统[金鹰物联智慧食堂项目] 摘要本文基于YOLOv5v6.1提出了一套适用于中式快餐店的菜品识别自助支付系统，综述了食品识别领域的发展现状，…

人工智能 2023年7月26日
0039
机器学习之KNN算法（python代码实现）

kNN（k-Nearest Neighbors，k近邻）是机器学习中非常基础的一种算法，算法原理简单而且容易实现，结果精度高，无需估计参数，无需训练模型，而且不仅可以用于分类任务，…

人工智能 2023年6月23日
0075
基于最优MobileNet卷积神经网络的植物叶片病害自动检测与分类

农业是印度的主要职业，每年因植物病害损失35%的作物产量。由于实验室设施和专家知识的不当，早期植物病害检测是一个繁琐的过程。自动植物病害检测技术有利于减少监测大型作物农场的繁重任务…

人工智能 2023年7月3日
0073
FairMOT配置（VS2019+Win10+CUDA11.0）

配置环境： Win10 VS2019 CUDA11.0 Pytorch1.7 配置步骤： 1、下载FairMOT： git clone –recursive https://gi…

人工智能 2023年7月22日
0070
Node.js | Express+MongoDB 实现简易用户管理系统（一）（项目搭建 | RESTful API架构 | 前后端交互）

首先，需要安装 MongoDB 数据库和 Node.js 运行环境。然后，创建一个新的文件夹，命名为 myapp，进入该文件夹，打开终端窗口，输入以下命令，初始化项目： npm …

人工智能 2023年7月31日
0072
时序预测涉及的一些pands语法

Python 1、python内置函数 1.1、if name == ‘main‘: 相当于程序入口python.py文件有两种使用方法：①作为脚本直接执行…

人工智能 2023年7月7日
0054
ssm垃圾分类系统设计与实现毕业设计-附源码221511

第三章系统分析 3.1需求分析任何一个项目在开发研究前，都需要对研发系统本身的需求做一个认真的分析，市场的调研是不可忽视的，从实际场景中确定使用人员的功能需求，从而明确目标，对…

人工智能 2023年7月1日
0066
VIm环境配置教程

本文章主要介绍在MacOS环境下面如何配置和使用Vim编辑器。美化工作终端参考[[Centos7安装zsh和oh-my-my-zsh]] Vim是什么？ vim vim是一个历史悠…

人工智能 2023年6月4日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基