Yolov5 tensorrt C++部署 + FPS实现

2023年7月27日下午8:07 • 人工智能 • 阅读 49

作者：QiuYu Yolo交流QQ群：936625049

B站视频地址：https://www.bilibili.com/video/BV1n3411u7sk?spm_id_from=333.999.list.card_archive.click&vd_source=2b18a0f07e4a10bede9a22eb3ab4c397

本文面向有一定python/C++基础的同学，本教程内容仅供学习使用。

环境搭建部分(目前不打算细讲，博客比较详细了)

1、Python/Pytorch/Cuda环境搭建

具体参考这篇博客

https://blog.csdn.net/weixin_44791964/article/details/120668551?spm=1001.2014.3001.5502

tip:如果之后在权重训练时，缺少部分包，百度包名然后导入即可

2、权重训练

可以参考这位up主的视频，训练完毕后得到.pt权重文件

https://space.bilibili.com/14796576/?spm_id_from=333.999.0.0

; 3、C++环境搭建

具体参考下面这篇博客

https://blog.csdn.net/weixin_45747759/article/details/124076582?spm=1001.2014.3001.5501

tip: CMake编译的时候如果找不到Cuda，可能是Cuda安装的时候没选VS的那个包，重新单独勾选VS的包安装一遍也许可以解决。

注意这部分是必须的，后面部分需要这部分作为前置

; FPS实践部分

如果你完成了环境搭建那么恭喜你，已经完成了最难熬的部分

1、tensorrt基本框架搭建

首先当然是导入头文件了

#include
#include
#include
#include "cuda_utils.h"
#include "logging.h"
#include "common.hpp"
#include "utils.h"
#include "calibrator.h"
#include "preprocess.h"
#include
#include "atlstr.h"
#include
#include "stdafx.h"
#include "kmbox.cpp"

#include
#include
#include
#include

#include

#define KEY_DOWN(VK_NONAME) ((GetAsyncKeyState(VK_NONAME) & 0x8000) ? 1:0)

#define USE_FP16
#define DEVICE 0
#define NMS_THRESH 0.1
#define CONF_THRESH 0.6
#define BATCH_SIZE 1
#define MAX_IMAGE_INPUT_SIZE_THRESH 1000 * 1000

#pragma comment(lib, "d3d11.lib")
#pragma comment(lib, "dxgi.lib")

写入tensorrt的初始化部分，这里需要把model_path换成你在第三步得到的engine模型地址

char *model_path = "C:\\Users\\QiuYuSY\\Desktop\\yolov5-6.1_tensorrt_CFHD\\yolov5s.engine";

cudaSetDevice(DEVICE);

char *trtModelStream{ nullptr };
size_t size_e{ 0 };
std::string engine_name = model_path;
std::ifstream file(engine_name, std::ios::binary);
Yolov5TRTContext * trt = new Yolov5TRTContext();
if (file.good()) {
    file.seekg(0, file.end);
    size_e = file.tellg();
    file.seekg(0, file.beg);
    trtModelStream = new char[size_e];
    assert(trtModelStream);
    file.read(trtModelStream, size_e);
    file.close();
}

trt->runtime = createInferRuntime(gLogger);
assert(trt->runtime != nullptr);
trt->engine = trt->runtime->deserializeCudaEngine(trtModelStream, size_e);
assert(trt->engine != nullptr);
trt->context = trt->engine->createExecutionContext();
assert(trt->context != nullptr);

assert(trt->engine->getNbBindings() == 2);
trt->data = new float[BATCH_SIZE * 3 * INPUT_H * INPUT_W];
trt->prob = new float[BATCH_SIZE * OUTPUT_SIZE];
trt->inputIndex = trt->engine->getBindingIndex(INPUT_BLOB_NAME);
trt->outputIndex = trt->engine->getBindingIndex(OUTPUT_BLOB_NAME);
assert(trt->inputIndex == 0);
assert(trt->outputIndex == 1);

CUDA_CHECK(cudaMalloc(&trt->buffers[trt->inputIndex], BATCH_SIZE * 3 * INPUT_H * INPUT_W * sizeof(float)));
CUDA_CHECK(cudaMalloc(&trt->buffers[trt->outputIndex], BATCH_SIZE * OUTPUT_SIZE * sizeof(float)));

CUDA_CHECK(cudaStreamCreate(&trt->stream));

2、Dxgi截图传入模型推导

把以下几个方法放到main函数前面

完整方法以及项目群文件取 936625049

然后在main函数之前填写的下面加入如下行,进行dxgi初始化截图


ID3D11Device* device = nullptr;
ID3D11DeviceContext* deviceContext = nullptr;
initDXGIResources(&device, &deviceContext);

IDXGIOutputDuplication* desktopDupl = nullptr;
UINT output = 0;
initDuplication(device, &desktopDupl, output);

DXGI_OUTDUPL_FRAME_INFO frameInfo;

ID3D11Texture2D* acquiredDesktopImage = nullptr;
bool timeOut;

while (true) {

    HRESULT ret = getFrame(desktopDupl, &frameInfo, &acquiredDesktopImage, &timeOut);

    if (timeOut || ret < 0)
    {
        continue;
    }
    cv::Mat img = cv::Mat(640, 640, CV_8UC4);

    saveDesktopImage(acquiredDesktopImage, device, deviceContext, &img);

    doneWithFrame(desktopDupl);
    if (acquiredDesktopImage)
    {
        acquiredDesktopImage->Release();
        acquiredDesktopImage = nullptr;
    }

    cv::cvtColor(img, img, cv::COLOR_RGBA2RGB);

    cv::resize(img, img, cv::Size(640, 640));

    cv::namedWindow("Display", CV_WINDOW_AUTOSIZE);

    cv::imshow("Display", img);

    cv::waitKey(0);
}

clearDuplication(desktopDupl);
clearDXGIResources(device, deviceContext);

然后我们把图片放入模型进行推理，位置在resize后面


int i = 0;
for (int row = 0; row < INPUT_H; ++row) {
    for (int col = 0; col < INPUT_W; ++col) {
        trt->data[i] = img.at<cv::Vec3b>(row, col)[0] / 255.0;
        trt->data[i + INPUT_H * INPUT_W] = img.at<cv::Vec3b>(row, col)[1] / 255.0;
        trt->data[i + 2 * INPUT_H * INPUT_W] = img.at<cv::Vec3b>(row, col)[2] / 255.0;
        ++i;
    }
}

doInference(*trt->context, trt->stream, trt->buffers, trt->data, trt->prob, BATCH_SIZE);
std::vector<std::vector<Yolo::Detection>> batch_res(1);
auto& res = batch_res[0];
nms(res, &trt->prob[0 * OUTPUT_SIZE], CONF_THRESH, NMS_THRESH);
int len = res.size();

float(*res_array)[6] = new float[len][6];

for (size_t j = 0; j < res.size(); j++) {
    cv::Rect r = get_rect(img, res[j].bbox);
    res_array[j][0] = r.x;
    res_array[j][1] = r.y;
    res_array[j][2] = r.width;
    res_array[j][3] = r.height;

    res_array[j][5] = res[j].conf;
}

此时我们便得到了图片中每个对象的信息，并放入了res_array数组中

那么截图推理部分到此结束！

剩余部分文档在群文件中

Original: https://blog.csdn.net/QiuYuSy/article/details/125375273
Author: QiuYuSy
Title: Yolov5 tensorrt C++部署 + FPS实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719053/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch权重转wts格式，用于tensorrt权重加载

若使用tensorrt加载wts格式，需将模型训练的pt、pth、ckpt等格式权重转换为wts，其代码细节如下： def checkpint2wts(model, wts_fil…

人工智能 2023年6月4日
0061
知识图谱de构建与应用（七）：大规模知识图谱预训练

7.1 知识预训练概述 7.1.1 预训练语言模型 7.1.2 知识图谱中的结构化上下文信息 7.1.3 基于知识增强的预训练模型 7.1.4 预训练知识图谱模型与预训练语言模型的…

人工智能 2023年6月10日
0049
【数据结构】单链表定义的介绍及增删查改的实现

目录前言结点的初始化增删打印查找在指定位置后的插入删除指定位置下一个结点的数据销毁与顺序表的对比总结源码前言相信很多人都像我一样，在正式学习链表之前就已经…

人工智能 2023年6月29日
0057
YOLOv5+TensorRT+Win11(Python版)

快速上手YOLOv5 快速上手YOLOv5 * 一、YOLOv5算法 – 1. 算法对比 + （1）传统目标检测方法（2）基于深度学习的目标检测算法（2-1）Two…

人工智能 2023年6月25日
0066
数据科学必备Pandas实操数据处理加速技巧汇总

大家好，我是Mr数据杨。想象一下三国时代，郭嘉如何制定天下大计，周瑜如何破敌一击，他们都不是一步步走来的，而是精心准备、周全考虑的。同样，在Python中，数据准备也是至关重要的第…

人工智能 2023年7月17日
0048
无人驾驶领域的3D目标检测综述

论文阅读笔记《3D Object Detection for Autonomous Driving: A Review and New Outlooks》github链接：http…

人工智能 2023年7月10日
0052
堪称经典，一个非常适合初学者的机器学习实战案例

大家好，今天我给大家介绍一个非常适合新手的机器学习实战案例。这是一个房价预测的案例，来源于 Kaggle 网站，是很多算法初学者的第一道竞赛题目。该案例有着解机器学习问题的完…

人工智能 2023年7月4日
0058
pytorch 深度学习最简单的分类预测

用pytorch写一个最基本的分类模型，这里分类的数据是二维的[x1,x2]，假设为一类，为第二类。其实就是用一个圆将平面上的数据分为两类，圆内一类，圆外一类。预测时候给任意一个数…

人工智能 2023年7月2日
0090
深度学习-语义分割前言

1.什么是语义分割：常见的分割任务：语义分割（semantic segmentation）：对比分类任务，对图片中的每个像素进行分类。FCN 实例分割（Instance seg…

人工智能 2023年5月28日
0062
Suspense组件

先上官网：https://cn.vuejs.org/guide/built-ins/suspense.html 注意一下 <suspense></suspense…

人工智能 2023年7月29日
0054
YOLOv5(6.1)安卓端部署记录

分享一下yolov5自己的模型部署到安卓端的踩坑记录，这里跳过yolov5训练部分（这部分网上很多教程），直接说重点。训练得到的为.PT模型，要部署到安卓端首先要转换为onnx模型…

人工智能 2023年6月17日
00111
卷积神经网络（CNN）——快速导读

一、认识卷积神经网络输入层：代表要素结点输入每个像素 [En] input layer: input each pixel on behalf of a feature node…

人工智能 2023年5月24日
0074
YOLOv5的Tricks | 【Trick14】YOLOv5的val.py脚本的解析

如有问题，恳请指出。这篇可能是这个系列最后的一篇了，最后把yolov5的验证过程大致的再介绍介绍，基本上把yolov5的全部内容就稍微过了一遍了，也是我自己对这个项目学习的结束。…

人工智能 2023年7月26日
0033
图像分割之Swin-Unet分享

基于CNN的图像/语义分割算法主要有Unet FCN PSPnet DAnet DeepLabV3+,HRnet+OCR等，去年年底基于Transform的各类CV算法（如ViT，…

人工智能 2023年5月26日
00125
数据分析案例-航空公司客户价值分析（聚类）

目录项目背景原始数据情况挖掘目标分析方法与过程加载数据数据预处理构建模型项目背景在企业的客户关系管理中，对客户分类，区分不同价值的客户。针对不同价值的客户提供个性…

人工智能 2023年7月14日
0062
卡尔曼滤波04_2 Sage-Husa自适应滤波

Sage-Husa自适应滤波自适应滤波的状态空间模型为：自适应滤波适用的系统为噪声和噪声的方差未知，且不是零均值。由于噪声未知，噪声参数的不准确可能会影响系统输出，此时自适应滤波…

人工智能 2023年6月15日
0066

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Yolov5 tensorrt C++部署 + FPS实现

目录

环境搭建部分(目前不打算细讲，博客比较详细了)

1、Python/Pytorch/Cuda环境搭建

2、权重训练

; 3、C++环境搭建

; FPS实践部分

1、tensorrt基本框架搭建

2、Dxgi截图传入模型推导

大家都在看