Deformable DETR 实战（训练及预测）

2023年7月28日上午9:09 • 人工智能 • 阅读 88

开源地址：
https://github.com/fundamentalvision/deformable-detr

超级小白，摸索了几天，感谢批评指正！！！

一、数据集准备

1.下载数据集：

train_2017：

http://images.cocodataset.org/zips/train2017.zip

val_2017：

http://images.cocodataset.org/zips/val2017.zip

2.下载标注文件（instances_train2017.json instances_val2017.json）

http://images.cocodataset.org/annotations/annotations_trainval2017.zip

3.数据集文件夹

二、环境配置（命令）

创建python环境：

conda create -n deformable_detr python=3.7 pip

激活环境：

conda activate deformable_detr

PyTorch>=1.5.1, torchvision>=0.6.1，自行配置，不赘述

安装必要的包：

pip install -r requirements.txt

编译cuda操作：

cd ./models/ops

sh ./make.sh

编译成功后可 pip list结果如下：

有 MultiScaleDeformableAttention 包

测试 pyt hon test.py （可省略）：

运行test.py的时间太长，我直接Kill了

运行 python main.py

也可以使用官方给的命令：

GPUS_PER_NODE=8 ./tools/run_dist_launch.sh 8 ./configs/r50_deformable_detr.sh

进行修改，如两张卡进行训练：

GPUS_PER_NODE=2 ./tools/run_dist_launch.sh 2 ./configs/r50_deformable_detr.sh

（我的环境是Linux，此处会出现chmod文件权限问题，百度即可自行解决，用到了chmod 777）

训练过程：训练Epoch：[0] 结束后会进行Test，然后接着Epoch：[1]训练

三、预测

由于训练时间太长，我直接Kill了，使用官方给的权重进行预测

下载权重文件：r50_deformable_detr-checkpoint.pth

如图点击model下载（需要梯子）

https://drive.google.com/file/d/1nDWZWHuRwtwGden77NLM9JoWe-YisJnA/view

待预测图片及其位置：

(我自己从COCO数据集随机复制的几张图片)

运行如下代码 predict.py（代码非原创，参考网上修改）：

import cv2
from PIL import Image
import numpy as np
import os
import time

import torch
from torch import nn
import torchvision.transforms as T
from main import get_args_parser as get_main_args_parser
from models import build_model

torch.set_grad_enabled(False)

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("[INFO] 当前使用{}做推断".format(device))

图像数据处理
transform = T.Compose([
    T.Resize(800),
    T.ToTensor(),
    T.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])

plot box by opencv
def plot_result(pil_img, prob, boxes, save_name=None, imshow=False, imwrite=False):
    opencvImage = cv2.cvtColor(np.array(pil_img), cv2.COLOR_RGB2BGR)
    LABEL =['N/A', 'person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus',
            'train', 'truck', 'boat', 'traffic light', 'fire hydrant', 'N/A',
            'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse',
            'sheep', 'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'N/A', 'backpack',
            'umbrella', 'N/A', 'N/A', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis',
            'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove',
            'skateboard', 'surfboard', 'tennis racket', 'bottle', 'N/A', 'wine glass',
            'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple', 'sandwich',
            'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake',
            'chair', 'couch', 'potted plant', 'bed', 'N/A', 'dining table', 'N/A',
            'N/A', 'toilet', 'N/A', 'tv', 'laptop', 'mouse', 'remote', 'keyboard',
            'cell phone', 'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'N/A',
            'book', 'clock', 'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush']
    for p, (xmin, ymin, xmax, ymax) in zip(prob, boxes):
        cl = p.argmax()
        label_text = '{}: {}%'.format(LABEL[cl], round(p[cl] * 100, 2))

        cv2.rectangle(opencvImage, (int(xmin), int(ymin)), (int(xmax), int(ymax)), (255, 255, 0), 2)
        cv2.putText(opencvImage, label_text, (int(xmin) + 10, int(ymin) + 30), cv2.FONT_HERSHEY_SIMPLEX, 1,
                    (255, 255, 0), 2)

    if imshow:
        cv2.imshow('detect', opencvImage)
        cv2.waitKey(0)

    if imwrite:
        if not os.path.exists("./result/pred"):
            os.makedirs('./result/pred')
        cv2.imwrite('./result/pred/{}'.format(save_name), opencvImage)

将xywh转xyxy
def box_cxcywh_to_xyxy(x):
    x_c, y_c, w, h = x.unbind(1)
    b = [(x_c - 0.5 * w), (y_c - 0.5 * h),
         (x_c + 0.5 * w), (y_c + 0.5 * h)]
    return torch.stack(b, dim=1)

def rescale_bboxes(out_bbox, size):
    img_w, img_h = size
    b = box_cxcywh_to_xyxy(out_bbox)
    b = b.cpu().numpy()
    b = b * np.array([img_w, img_h, img_w, img_h], dtype=np.float32)
    return b

def load_model(model_path , args):
    model, _, _ = build_model(args)
    model.cuda()
    model.eval()
    state_dict = torch.load(model_path) #  prob_threshold

    probas = probas.cpu().detach().numpy()
    keep = keep.cpu().detach().numpy()

    # convert boxes from [0; 1] to image scales
    bboxes_scaled = rescale_bboxes(outputs['pred_boxes'][0, keep], im.size)
    end = time.time()
    return probas[keep], bboxes_scaled, end - start

if __name__ == "__main__":

    main_args = get_main_args_parser().parse_args()
    # 加载模型
    dfdetr = load_model('DDETR/r50_deformable_detr-checkpoint.pth',main_args) #

预测结果及预览：

使用Deformable DETR进行预测：

参考：

https://www.jianshu.com/p/b364534fd0a7

Windows下运行Deformable-DETR_harold_du的博客-CSDN博客_deformable detr

Deformable DETR环境配置和应用_Alaso_soso的博客-CSDN博客

DETR导出onnx模型，并进行推理（cpu环境）_athrunsunny的博客-CSDN博客

Original: https://blog.csdn.net/dystsp/article/details/125949720
Author: dystsp
Title: Deformable DETR 实战（训练及预测）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/720163/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据挖掘框架（结构化数据）

数据量数据缺失情况描述性统计特征理解特征分布周期性分析对比分析相关性分析训练集和测试集的分布一致性缺失值处理异常值处理内存优化数据增强欠采样/过采样 1.ID特征处理需要考虑训练…

人工智能 2023年7月18日
0077
pytorch 笔记：tensorboardX

1 SummaryWriter 1.1 创建首先，需要创建一个 SummaryWriter 的示例： from tensorboardX import SummaryWriter…

人工智能 2023年6月18日
00106
ElasticSearch从入门到精通–第七话（自动补全、拼音分词器、自定义分词、数据同步方案）

ElasticSearch从入门到精通–第七话（自动补全、拼音分词器、自定义分词、数据同步方案）使用拼音分词可以引入elasticsearch的拼音分词插件，地址:https:…

人工智能 2023年6月28日
00109
机器学习之KNN算法（python代码实现）

kNN（k-Nearest Neighbors，k近邻）是机器学习中非常基础的一种算法，算法原理简单而且容易实现，结果精度高，无需估计参数，无需训练模型，而且不仅可以用于分类任务，…

人工智能 2023年6月23日
0082
气温和降水空间栅格数据下载RS123

中国1980-2015逐年年降水量空间插值数据集介绍中国1980年以来逐年年平均气温、年降水量空间插值数据集是基于全国2400多个气象站点日观测数据，通过整理、计算和空间插值处…

人工智能 2023年6月15日
00100
Tableau联动之筛选器联动

系列文章目录 Tableau联动之图表标题联动Tableau联动之工作表联动Tableau联动之筛选器联动文章目录系列文章目录前言一、添加筛选器二、设置筛选器控制范围三…

人工智能 2023年7月15日
0087
聚类调整标准误笔记

1. 何为聚类标准误标准误在统计推断中发挥着至关重要的作用，直接影响着系数的显著性和置信区间，并最终影响到假设检验的结论。因此，正确地估计标准误在实证分析的过程中显得尤为重要。当…

人工智能 2023年6月20日
00166
Kinetics-400数据集简介及下载

1、Kinetics-400数据集简介 Kinetics-400是一个大规模，高质量的YouTube视频网址数据集，其中包含各种以人为本的行动。该数据集包含 400 个人类动作类，…

人工智能 2023年6月17日
0087
如何在PyTorch中计算两个张量的点积（do

问题背景在机器学习和深度学习中，我们经常需要计算两个张量的点积。点积也被称为内积或数量积，它是两个向量的对应元素的乘积之和。在PyTorch中，我们可以使用torch.dot()…

人工智能 2024年1月3日
0067
《动手学深度学习》（一）– 线性神经网络

1 线性回归 1. 导入需要的库 import random import torch from d2l import torch as d2l 2. 生成数据集这里将根据带有噪…

人工智能 2023年6月18日
0071
Yolov5 lite 重新训练COCO数据（只训练COCO含Person部分，其他当负样本）

一、数据准备一、修改文件 1. 我们把数据集划分好了以后，并且放在了你一般放数据集的地方后，我们需要去修改一些配置文件，让我们训练的时候可以找到这些数据集。我们下载好yolo项…

人工智能 2023年7月9日
0061
体验ChatGpt

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0067
python 读csv 数据丢失_通过pandas的read_csv（）读取数据时丢失“秒”信息

我试图读取一个简单的数据，其中几乎只有两列：id和timestamp 因为我的时间戳有秒，所以我想保存这些信息。所以我读了很多文章，比如：还有更多。。。。在以下是我在阅读完这里…

人工智能 2023年7月8日
00155
三子棋游戏的实现

目录一、问题描述二、基本流程三、流程四、结果演示 *五、代码实现一、问题描述用C语言实现三子棋游戏。二、基本流程 1.菜单界面选择开始或者退出游戏。2.创建棋盘并初始…

人工智能 2023年7月16日
0067
dirsearch安装+使用+运行问题（小宇特详解）

dirsearch安装+使用+运行问题（小宇特详解）前几天电脑坏了重新安装了一下dirsearch，却发现好多问题今天写个文章说一下在这里，我将重点介绍我跑步时出现的问题。 […

人工智能 2023年5月23日
00101
什么是 Python 编程语言？

Python：是世界上最流行的解释型编程语言之一。Python 由 Guido van Rossum 设计，作为”ABC”编程语言的继承者，于 1991 年…

人工智能 2023年7月17日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Deformable DETR 实战（训练及预测）

大家都在看