利用PaddleDetection 训练自定义VOC数据集进行目标检测

2023年7月9日上午6:10 • 人工智能 • 阅读 65

1.环境配置

操作系统 Windows
python 3.8
paddlepaddle-gpu 2.3.0
CUDA 10.2
cuDNN 7.6.5
ppdet 2.2.4

2.项目结构

3.准备数据集

1、下载源码后，打开项目，在PaddleDetection/dataset目录下新建文件夹 mydata

2、在PaddleDetection/dataset/mydata目录下新建文件夹Annotations、JPEGImages

3、将所有所有标注的XML文件放到dataset/mydata/Annotations目录下如下图

4、将所有标注的图片放到dataset/mydata/JPEGImages目录下，如下图

5.利用 create_data_list.py 来生成对应的文本文件

4.修改指定配置文件

本项目中，使用YOLOv3模型里的configs/yolov3/yolov3_mobilenet_v1_270e_voc.yml 训练
从上图看到yolov3_mobilenet_v1_270e_voc.yml 配置需要依赖其他的配置文件。该例子依赖：

在修改文件之前，先给大家解释一下各依赖文件的作用：

①’ …/datasets/voc.yml’主要说明了训练数据和验证数据的路径，包括数据格式(coco、voc等)
②’…/runtime.yml’,主要说明了公共的运行状态，比如说是否使用GPU、迭代轮数等等
③’_base/optimizer_270e.yml’,主要说明了学习率和优化器的配置，以及设置epochs。在其他的训练的配置中，学习率和优化器是放在了一个新的配置文件中。 ‘base/yolov3_mobilenet_v1.yml’,主要说明模型、和主干网络的情况说明.。。。
④’_base/yolov3_reader.yml’, 主要说明了读取后的预处理操作，比如resize、数据增强等等。

请保证PaddleDetection环境配置好之后按照如下图示修改即可：

voc.yml

runtime.yml

optimizer_270e.yml 和 yolov3_mobilenet_v1.yml 无需进行修改，默认即可！

yolov3_reader.yml

4.开始训练

PaddleDetection提供了单卡/多卡训练模式，满足用户多种训练需求

（1）单卡训练

export CUDA_VISIBLE_DEVICES=0 #windows&#x548C;Mac&#x4E0B;&#x4E0D;&#x9700;&#x8981;&#x6267;&#x884C;&#x8BE5;&#x547D;&#x4EE4;
python tools/train.py -c configs/yolov3/yolov3_mobilenet_v1_270e_voc.yml

python tools/train.py -c configs/yolov3_mobilenet_v1_270e_voc.yml --eval

首先指定CUDA的环境变量
其中 -c 后边代表指定配置文件的路径

（2）多卡训练

export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 #windows&#x548C;Mac&#x4E0B;&#x4E0D;&#x9700;&#x8981;&#x6267;&#x884C;&#x8BE5;&#x547D;&#x4EE4;
python -m paddle.distributed.launch --gpus 0,1,2,3,4,5,6,7 tools/train.py -c configs/yolov3/yolov3_darknet53_270e_voc.yml

（3）训练过程图示

create_data_list:

import os
import random
import xml.etree.ElementTree
from tqdm import tqdm

打乱数据
def shuffle_data(data_list_path):
    with open(data_list_path, 'r', encoding='utf-8') as f:
        lines = f.readlines()
        random.shuffle(lines)
    with open(data_list_path, 'w', encoding='utf-8') as f:
        f.writelines(lines)

生成图像列表
def create(images_dir, annotations_dir, train_list_path, test_list_path, label_file):
    f_train = open(train_list_path, 'w', encoding='utf-8')
    f_test = open(test_list_path, 'w', encoding='utf-8')
    f_label = open(label_file, 'w', encoding='utf-8')
    label = set()
    images = os.listdir(images_dir)
    i = 0
    for image in tqdm(images):
        i += 1
        annotation_path = os.path.join(annotations_dir, image[:-3] + 'xml').replace('\\', '/')
        image_path = os.path.join(images_dir, image).replace('\\', '/')
        if not os.path.exists(annotation_path):
            continue
        root = xml.etree.ElementTree.parse(annotation_path).getroot()
        for object in root.findall('object'):
            label.add(object.find('name').text)
        if i % 20 == 0:
            f_test.write("%s %s\n" % (image_path[image_path.find('/') + 1:], annotation_path[annotation_path.find('/') + 1:]))
        else:
            f_train.write("%s %s\n" % (image_path[image_path.find('/') + 1:], annotation_path[annotation_path.find('/') + 1:]))
    for l in label:
        f_label.write("%s\n" % l)
    f_train.close()
    f_test.close()
    f_label.close()

    # 打乱训练数据
    shuffle_data(train_list_path)
    print('create data list done!')

if __name__ == '__main__':
    create('./JPEGImages', './Annotations', './trainval.txt', './test.txt', './label_list.txt')

Original: https://blog.csdn.net/weixin_50016546/article/details/126469095
Author: NCUTer
Title: 利用PaddleDetection 训练自定义VOC数据集进行目标检测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/680144/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas实现筛选功能方式

1 筛选出数据的指定几行数据 data=df.loc[2:5] #这里的[2:5]表&amp…

人工智能 2023年6月15日
0084
3. 梯度提升决策树（GBDT）详解

一、提升树以决策树为基函数的提升方法称为提升树。其中，分类问题采用二叉分类树，回归问题采用二叉回归树。sklearn中的提升树采用的是CART树。模型可以表示为决策树的加法模型：…

人工智能 2023年6月16日
0043
强化学习之 PPO 算法

简述 PPO PPO 算法是一种基于策略的、使用两个神经网络的强化学习算法。通过将”智体”当前的”状态”输入神经网络，最终会得到相…

人工智能 2023年6月16日
0094
魔改WeNet导出Onnx

ONNX Quick start 配置好examples/onnx/run_onnx.sh里面的config,checkpoint,output_dir 默认使用transform…

人工智能 2023年5月25日
0056
Python 如何写入同一Excel的多张Sheet表单

如何用python将数据存入同一个excel文件的多张sheet表单? 使用to_excel()保存表单时发生覆盖: 本想把三个数据表格保存到同一个excel的三个表单，只写了这三…

人工智能 2023年7月18日
0072
2021-AAAI-KCGN-面向社会推荐的知识感知耦合图神经网络

标题：Knowledge-aware Coupled Graph Neural Network for Social Recommendation翻译：《面向社会推荐的知识感知耦合…

人工智能 2023年6月1日
0064
BERT模型实体关系抽取实战(医学领域)

项目部署 Pycharm、TensorFlow 1.11.0和、Python2 和或Python3（TensorFlow 1.12.0、python3.6实测可运行） –Enti…

人工智能 2023年5月30日
0074
Win10+Python3.10+OpenCV4.6.0加载显示图片

1 前言上一篇介绍了在WIN10上，用VS2022编写C++测试程序，调用OpenCV库加载显示图片，本篇我们接着看一下，使用Python如何调用OpenCV库接口，加载显示图片…

人工智能 2023年7月19日
0069
数据分析—开发环境

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
0069
《统计学习方法（第2版）》李航第十二章监督学习方法总结思维导图笔记

; 适用问题监督学习主要包括分类、标注、回归问题。标注问题是从观测序列到标记/状态序列的过程，相比二分类问题，其数目上是指数级区别。模型非概率模型，是指直接由输入X得到输出Y…

人工智能 2023年5月30日
0053
引力搜索算法极限学习机GSA-ELM回归预测及其MATLAB代码实现

[ 引力搜索算法（Gravitational Search Algorithm， GSA）是一种基于引力_模拟的优化算法，它模拟天体之间的 _引力_作用，并通过 _引力_和质量…

人工智能 2023年6月29日
0084
pytorch双线性插值

1、单线性插值化简得：重要公式将y视为像素值的函数； ; 2、双线性插值问题：求P点的像素值？ ; 根据单线性插值公式： 1、得到R1和R2点的像素值： ; 2、然后通过R1和…

人工智能 2023年7月27日
0061
WTK6900H语音识别单芯片实现智能语音识别蓝牙耳机方案设计

一、简介随着智能手机的普及，越来越多的用户使用蓝牙耳机，尤其是骑行或步行的用户。由于蓝牙耳机体积小，按键少，部分蓝牙耳机需要按组合键才能完成相应的操作，因此蓝牙耳机的操作较为复杂…

人工智能 2023年5月25日
0061
图像视频去噪论文Learning Deformable Kernels for Image and Video Denoising阅读笔记

论文链接：1904.06903.pdf (arxiv.org) 论文来源：TIP2020 作者：商汤 Abstract 大多数经典的去噪方法都是通过选择和平均噪声输入中的像素来恢复…

人工智能 2023年5月30日
0078
Pandas与GUI界面的超强结合

pandasgui安装与简单使用根据作者的介绍，pandasgui是用于分析 Pandas DataFrames的GUI。这个属于第三方库，使用之前需要安装。 pip insta…

人工智能 2023年7月7日
0076
推荐系统 — 数据工程 — 用户画像 — 概述

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0049

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31