COCO数据集训练TPH-YoloV5

2023年7月21日上午9:14 • 人工智能 • 阅读 57

设备：rtx 3060

环境要求：torch >= 1.8.1

其他环境按照源代码的readme安装即可

github地址：

本文用COCO数据集来进行训练，TPH-YOLO作者给出了coco.yaml文件来进行coco数据集的训练，但为了与其他版本的Yolo进行兼容，我在这里使用了脚本，将coco格式的数据集转成了yolo的txt格式， 即COCO转YOLO格式。

import os
import json
from tqdm import tqdm
import argparse

parser = argparse.ArgumentParser()
这里根据自己的json文件位置，换成自己的就行
parser.add_argument('--json_path',
                    default='xxx.json', type=str,
                    help="input: coco format(json)")
这里设置.txt文件保存位置
parser.add_argument('--save_path', default='xxxx', type=str,
                    help="specify where to save the output dir of labels")
arg = parser.parse_args()

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = box[0] + box[2] / 2.0
    y = box[1] + box[3] / 2.0
    w = box[2]
    h = box[3]
    # round函数确定(xmin, ymin, xmax, ymax)的小数位数
    x = round(x * dw, 6)
    w = round(w * dw, 6)
    y = round(y * dh, 6)
    h = round(h * dh, 6)
    return (x, y, w, h)

if __name__ == '__main__':
    json_file = arg.json_path  # COCO Object Instance 类型的标注
    ana_txt_save_path = arg.save_path  # 保存的路径

    data = json.load(open(json_file, 'r'))
    if not os.path.exists(ana_txt_save_path):
        os.makedirs(ana_txt_save_path)

    id_map = {}  # coco数据集的id不连续！重新映射一下再输出！
    with open(os.path.join(ana_txt_save_path, 'classes.txt'), 'w') as f:
        # 写入classes.txt
        for i, category in enumerate(data['categories']):
            f.write(f"{category['name']}\n")
            id_map[category['id']] = i
    # print(id_map)
    # 这里需要根据自己的需要，更改写入图像相对路径的文件位置。
    list_file = open(os.path.join(ana_txt_save_path, 'val.txt'), 'w')
    for img in tqdm(data['images']):
        filename = img["file_name"]
        img_width = img["width"]
        img_height = img["height"]
        img_id = img["id"]
        head, tail = os.path.splitext(filename)
        ana_txt_name = head + ".txt"  # 对应的txt名字，与jpg一致
        f_txt = open(os.path.join(ana_txt_save_path, ana_txt_name), 'w')
        for ann in data['annotations']:
            if ann['image_id'] == img_id:
                box = convert((img_width, img_height), ann["bbox"])
                f_txt.write("%s %s %s %s %s\n" % (id_map[ann["category_id"]], box[0], box[1], box[2], box[3]))
        f_txt.close()
        # 将图片的相对路径写入train2017或val2017的路径
        list_file.write('xxxxxxxx/%s.jpg\n' % (head))
    list_file.close()

注：这个脚本参考CSDN其他博主的代码，是直接可用的，感谢他人的分享，链接我找不到了，如有不妥，请联系我删除。

第一步，找到data文件夹下的coco.yaml,将nc、names改成你自己的分类数和类别标签（默认就是coco数据集的80，我用的自己的数据集），然后再把path,train,val,test改成自己的文件路径和txt路径。如果你使用自己的数据集或者已经下载了coco数据集，就把names下边的download内容全部注释。

第二步，找到model文件夹下的yolov5l-xs-tph.yaml文件，将第一个参数nc改成你的类别数（默认就是coco的80）

好了，修改到这，就可以按照readme中的运行命令进行运行了

第三步，修改train.py文件，为了python train.py运行指定程序

parser.add_argument('--weights', type=str, default=ROOT / 'yolov5l.pt', help='initial weights path')
    parser.add_argument('--cfg', type=str, default='/yolov5l-xs-tph.yaml', help='model.yaml path')
    parser.add_argument('--data', type=str, default=ROOT / 'coco.yaml', help='dataset.yaml path')
    parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch.yaml', help='hyperparameters path')
    parser.add_argument('--epochs', type=int, default=100)
    parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')
    parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')

这里主要修改weight、cfg、data文件，我选择固定的方式运行，也可以按照readme命令运行。

–hyp参数是超参数设置，可以不修改，也可以找到对应的文件进行调参。

参考：1.TPH-YOLO作者建议使用1536的图片尺寸进行训练，我在rtx 3060 上，bs设置为1，仍然爆显存，大家根据硬件调整吧；

2.自己数据集有5000张图片，用3060，img_size设置为768（1536的一半）bs设置为2，一个epochs需要25分钟。大家可以做一个时间参考。

和yolo系列一样，在runs文件夹下有train文件夹来保存训练数据，测试时使用保存的最好的权重文件，使用detect.py文件测试即可，测试完毕在runs文件夹中会有detect的文件，保存测试结果。

5.swin-yolo正在跑，跑完就更新

欢迎交流！

Original: https://blog.csdn.net/qq_41660112/article/details/125294837
Author: & Tom
Title: COCO数据集训练TPH-YoloV5

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/706740/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【论文阅读】Deep Learning for Encrypted Traffic Classification: An Overview（深度学习方法进行加密流量分类综述）

原文：Deep Learning for Encrypted Traffic Classification: An Overview Abstract 在abstract中，作者指…

人工智能 2023年7月3日
00110
TypeScript由浅到深

基本类型介绍声明:类型 = 类型对应变量 let flag:boolean = true let age: number = 21; let name: string = &qu…

人工智能 2023年6月29日
0081
Swin Transformer详解

Swin Transformer详解一、Overall Architecture 二、Swin Transformer * 1. Patch Partition & Li…

人工智能 2023年6月17日
0081
linux下的opencv-4.5.5 及 opencv_contrib 扩展模块安装

适用于ubuntu(20.04)下安装opencv-4.5.5 以及opencv_contrib 扩展模块一并安装，如果已经安装了opencv-4.5.5，需要安装扩展模块的话，…

人工智能 2023年7月28日
0067
通过torch vision调用vgg16实现图像分类

1.dataset代码 import random from torchvision import datasets,transforms from torchvision.tra…

人工智能 2023年7月1日
0095
决策树学生成绩python_基于Python数据分析之pandas统计分析

pandas模块为我们提供了非常多的描述性统计分析的指标函数，如总和、均值、最小值、最大值等，我们来具体看看这些函数： 1、随机生成三组数据 import numpy as np …

人工智能 2023年7月8日
0064
pandas库之DataFrame滑动窗口（rolling window）(官网介绍）

提供滑动窗口计算，可用于时间序列（时间和日期）数据 DataFrame.rolling(window, min_periods=None, center=False, win_ty…

人工智能 2023年7月7日
0075
核函数支持向量回归机的预测 matlab_第七章支持向量机（第3节非线性支持向量机与核函数第1小节核技巧）…

三、非线性支持向量机与核函数终于到了第3重境界的修炼了~ 通过前面的学习，我们知道，对解线性分类问题（线性可分与线性不可分），线性分类支持向量机是一种非常有效的方法。但是有时分类…

人工智能 2023年6月18日
0087
Resource stopwords not found. Please use the NLTK Downloader to obtain the resource的解决

文章目录 * – + 引言 + 第一种下载方式 + 第二种下载方式 + 总结引言这个问题出现的原因是因为缺失 corpora/stopwords文件，所以我们要做的…

人工智能 2023年5月30日
00199
R语言逻辑操作符：&、|、！&&、||

C程序设计语言C语言精典版本目录译者序序第1版序前言第1章基本概念 1.1 入门 1.2 变量与算术表达式 1.3 for语句 1.4 符号常量 1.5 字符输入输…

人工智能 2023年5月30日
0078
意念打字登Nature封面！每分钟写90个字符，准确率超99%，网友：我打的都比它慢…

杨净梦晨发自凹非寺量子位报道 | 公众号 QbitAI 万万没想到，脑机接口这么快就有了重大突破！甚至还登上了 Nature封面。一位截瘫患者，正在用”…

人工智能 2023年5月27日
00109
什么是卷积神经网络（CNN）

什么是卷积神经网络（CNN）？卷积神经网络（Convolutional Neural Network，简称CNN）是一种用于处理具有类似网格结构数据的深度学习模型。它广泛应用于计…

人工智能 2024年1月1日
0048
DBNet实战：详解DBNet训练与测试（pytorch）

论文连接：https://arxiv.org/pdf/1911.08947.pdf github链接：github.com 网络结构首先，图像输入特征提取主干，提取特征；其次，…

人工智能 2023年7月27日
0099
全连接神经网络 MLP

全连接神经网络–MLP 全连接神经网络，又叫多层感知机，是一种连接方式较为简单的人工神经网络，是前馈神经网络的一种。 MLP的神经网络架构网络架构为：通过输入层，隐藏层，输出层…

人工智能 2023年6月16日
0073
【数值预测案例】(5) LSTM 时间序列气温数据预测，附TensorFlow完整代码

大家好，今天和各位分享一下如何使用循环神经网络 LSTM 完成有多个特征的气温预测。上一节中我介绍了 LSTM 的单个特征的预测，感兴趣的可以看一下：https://blog.cs…

人工智能 2023年5月26日
00136
AI芯片的分类及应用

目前，人工智能芯片按照技术路线划分，主要分为GPU、FPGA以及ASIC三大类，三类芯片的特点如下表所示。 AI 芯片技术特点 GPU GPU称为图形处理器，它是显卡的核心单元，…

人工智能 2023年7月1日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

COCO数据集训练TPH-YoloV5

大家都在看