YOLOFastestv2 训练自己的数据集—辛酸仨小时

2023年6月29日下午8:41 • 人工智能 • 阅读 65

首先下载YOLOFastestv2：https://github.com/dog-qiuqiu/FastestDet

我是训练的行人目标检测。
yolofastestv2需要数据集格式如下图所示：

.
├── category.names
├── train
│   ├── 000001.jpg
│   ├── 000001.txt
│   ├── 000002.jpg
│   ├── 000002.txt
│   ├── 000003.jpg
│   └── 000003.txt
├── train.txt
├── val
│   ├── 000043.jpg
│   ├── 000043.txt
│   ├── 000057.jpg
│   ├── 000057.txt
│   ├── 000070.jpg
│   └── 000070.txt
└── val.txt

一般我们的数据集是voc样式的数据集即文件夹中只有这两个文件：

train和val文件夹内的 0001.txt为yolo数据集的格式，其内容如下：

0 0.344192634561 0.611 0.416430594901 0.262
1 0.509915014164 0.51 0.974504249292 0.972

首先我们将xml转成这个格式的，在Annotations和JPEGImages的同级路径下创建一个py文件：


import xml.etree.ElementTree as ET
import os

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h

def convert_annotation(xml_file, txt_path, filename):
    in_file = open('{}/{}.xml'.format(xml_file, filename), encoding='UTF-8')
    out_file = open('{}/{}.txt'.format(txt_path, filename), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):

        if obj.find('difficult'):
            difficult = obj.find('difficult').text
        else:
            difficult = 0
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b

        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

classes = ["person"]

xml_path = 'Annotations'
txt_path = 'txt'
if not os.path.exists(txt_path):
    os.makedirs(txt_path)

xml_files = os.listdir(xml_path)
for xml_file in xml_files:
    print(xml_path + '/' + xml_file)
    convert_annotation(xml_path, txt_path, xml_file[:-4])

然后得到一个txt文件，里面就是存放所有已转换的txt

第二步就是将文件分成train和test

import os
import shutil
import random

all_txt = os.listdir('txt')
random.shuffle(all_txt)

trainf = all_txt[:1316]
vlaf = all_txt[1317:]

i = 1
for trainimg in trainf:
    try:
        shutil.copy(os.path.join('JPEGImages',trainimg[:-3]+'png'),'train')
        shutil.copy(os.path.join('txt', trainimg), 'train')
        print(i)
        i += 1
    except:
        print('no such file ',os.path.join('JPEGImages',trainimg[:-3]+'jpg'))
j = 1

for valimg in vlaf:
    try:
        shutil.copy(os.path.join('JPEGImages',valimg[:-3]+'png'),'v')
        shutil.copy(os.path.join('txt', valimg), 'v')
        print(j)
        j += 1

    except:
        print('no such file ',os.path.join('JPEGImages',valimg))

注意自己创建号train和val文件夹，修改train和val文件的个数。
这样就生成了下面这样的文件

├── train
│   ├── 000001.jpg
│   ├── 000001.txt
│   ├── 000002.jpg
│   ├── 000002.txt
│   ├── 000003.jpg
│   └── 000003.txt
└── val
    ├── 000043.jpg
    ├── 000043.txt
    ├── 000057.jpg
    ├── 000057.txt
    ├── 000070.jpg
    └── 000070.txt

然后将所有文件读入txt中：

import os

traintxt = open('train.txt','a')
val = open('val.txt','a')
for img in os.listdir('train'):
    if "png" in img:
        traintxt.write(os.path.join('INRIAPerson-823/train',img)+'\n')
        print(img)

    else:
        print(img,'error')
for img in os.listdir('val'):
    if "png" in img:
        valtxt.write(os.path.join('INRIAPerson-823/val',img)+'\n')
        print(img)
    else:
        print(img,'error')
valtxt.close()
traintxt.close()

先跑下这个：

python3 genanchors.py --traintxt ./train.txt

会得到anchors数据

然后修改data下的.data文件
anchors替换成上面的，train,val,names对应的路径，自己修改

然后就是训练了：

python3 train.py --data data/coco.data

下不了的关注我公众号：猛男技术控，回复 yolofastest 可以提供代码、数据、以及我训练的权重。

Original: https://blog.csdn.net/weixin_45755332/article/details/127810479
Author: 猛男技术控
Title: YOLOFastestv2 训练自己的数据集—辛酸仨小时

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/659920/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Streamlit库入门级教程（一）——基本介绍和使用方式

Streamlit库入门级教程（一）——基本介绍和使用方式最近做比赛了解到了Streamlit这个库，花了几天时间浅浅入门了一下，官网虽有完整的API文档等教程，但是纯英文版的，…

人工智能 2023年6月15日
0077
【python】数字图像处理

目录基本概念图像增强 * 整体代码线性变换分段线性变换对数变换幂律变换直方图图像滤波 * 平滑图像锐化图像基本概念 数&#x5B5…

人工智能 2023年6月17日
0079
目标检测2020-2021

【前言】近几年目标检测的落地越发成熟，新的sota网络同样层出不穷，不断刷新着coco的记录。本文盘点截止2019-2021年，在coco test-dev上霸榜，且知名度较广的…

人工智能 2023年7月11日
0063
Pandas数据分析—使用stack和pivot实现数据透视

15.Pandas使用stack和pivot实现数据透视文章目录 15.Pandas使用stack和pivot实现数据透视前言一、经过统计得到多维度指标数据二、使用unst…

人工智能 2023年7月7日
0056
Pandas 面板Panel

一、Panel介绍 Pandas 面板(Panel)是3维数据的存储结构，相当于一个存储 DataFrame 的字典，有3个轴（ axis），分别给出描述涉及面板数据的操作的一些语…

人工智能 2023年7月9日
0066
如何高效地存储与检索大规模的图谱数据？

本文分享自华为云社区《知识图谱的存储与检索》，原文作者：JuTzungKuei 。 1、概述背景：随着互联网的发展与普及，一个万物互联的世界正在成型。与此同时，数据呈现出爆炸式的…

人工智能 2023年6月1日
0086
python知识推理知识图谱_一文了解知识图谱常见的知识表示，图谱存储和查询方法…

对于知识图谱构建，有两个问题是永远绕不掉的。一个是知识图谱的知识表示，一个是知识图谱的存储方式。这两个问题大家也比较关注，而且知识图谱的表示跟知识图谱的存储还是有一定的相关性。知识…

人工智能 2023年6月1日
0075
【无标题】Torch_geometric安装教程，问题汇总详解。

前情提要：本文只谈通过pip方式安装，conda安装的方式博主没有试过，感兴趣的小伙伴可以参考本文自己尝试一下。首先，在核心上，Torch_geometric的安装方法几乎和py…

人工智能 2023年7月22日
0057
记录最近使用的几段好用的小代码：进度条，语音播报（摸鱼神器）

进度条不知道自己运行到第几个循环了，使用print显示每次循环的结束还是不直观。使用python库tqdm解决这几个小问题。对于一个循环 from tqdm import tq…

人工智能 2023年5月25日
00103
Android录音-音频基础知识

音频基本概念：采样率、采样位深、比特率、声道、PCM 采样率（也称为采样速度或者采样频率）定义了每秒从连续信号中提取并组成离散信号的采样个数，它用赫兹（Hz）来表示。采样率是指将模…

人工智能 2023年5月23日
0087
Matlab：Matlab编程语言应用之二维绘图可视化(基础知识点&基本函数&绘图基础&增强控制)的使用方法简介、案例实现(绘制sin函数&同画板多图像&同窗口多画板&&坐标轴&极坐标&离散数据等)

Matlab：Matlab编程语言应用之二维绘图可视化(基础知识点&基本函数&绘图基础&增强控制)的使用方法简介、案例实现(绘制sin函数&同画板多…

人工智能 2023年6月20日
0075
opencv canny+findcontours 检测边缘

检测的步骤相信大家很熟悉了，我今天在这里是要说一个大坑。首先，常见的步骤如下： edge = cv2.Canny(img, low, high) contours, hier = …

人工智能 2023年7月18日
0056
行列式与矩阵分类

行列式分类（一个数值）—行列地位等同定义：n*n个数值，按n行n列排值=符号为-1的逆序数次方的不同行不同列的数值相乘累加和。 1.一般行列式如爪形，行和相等型等…

人工智能 2023年7月2日
0063
【目标检测论文泛读】SSPnet (Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition）

文章目录 R-CNN模型回顾 * 为什么R-CNN要求固定输入？ SSPnet模型提出背景作者改进的思路和方法 SPP为什么能输出固定的长度？ SPP模型训练过程小总结 R-C…

人工智能 2023年7月9日
0074
Seq2Seq+Attention生成式文本摘要

任务描述: 自动摘要是指给出一段文本，我们从中提取出要点，然后再形成一个短的概括性的文本。自动的文本摘要是非常具有挑战性的，因为当我们作为人类总结一篇文章时，我们通常会完整地阅读它…

人工智能 2023年5月27日
0087
面向对象(九) 多态接口

1、C# 中的访问修饰符① public：公开的公共的；② private:私有的，只能在当前类的内部访问；③ protected:受保护的，只能在当前类的内部以及该类的子类中访问…

人工智能 2023年6月28日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

YOLOFastestv2 训练自己的数据集—辛酸仨小时

大家都在看