TensorRT8——ONNX转trt（C++)

2023年6月2日上午2:01 • 人工智能 • 阅读 103

TensorRT安装

首先需要确保正确安装CUDA，安装后通过nvcc -V验证是否安装。

下载TensorRT
网址：https://developer.nvidia.com/nvidia-tensorrt-8x-download，下载最新版解压

tar -xzvf TensorRT-8.4.0.6.Linux.x86_64-gnu.cuda-11.6.cudnn8.3.tar.gz

为了节省根目录的内存，TensorRT我放在home下，添加环境变量

sudo vim ~/.bashrc
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/3D/TensorRT-8.4.0.6/lib
source ~/.bashrc

接着，我们通过样例程序判断TRT能否正常工作。我们先是将sampleMNIST源码进行编译，此时会在bin目录生成可执行文件，我们切换过去直接执行。

cd ~/3D/TensorRT-8.4.0.6/samples/sampleMNIST
make
cd ../../bin/
./sample_mnist

如果输出如下内容，最后显示PASSED，表明样例运行通过。

python支持

在上一部分中，虽然我们已经安装了TensorRT，但是我们的Python环境还不能通过import tensorrt导入，所以需要通过安装对应的.whl来实现。

pip install ../TensorRT-8.4.0.6/python/tensorrt-8.4.0.6-cp37-none-linux_x86_64.whl

ONNX部署

TensorRT是nvidia公司针对nvidia显卡训练的模型在特定平台进行加速的推理优化库，是一个c++库，仅支持推理，不支持训练；

进行推理，需要先创建IExecutionContext对象，要创建这个对象，就需要先创建一个ICudaEngine的对象（engine），两种创建engine的方式：

使用模型文件创建engine，并可把创建的engine序列化后存储到硬盘以便后面直接使用；
使用之前已经序列化存储的engine，这种方式比较高效些，因为解析模型并生成engine还是挺慢的。

C++

TensorRT版本改动挺多的，大家可以直接查看API文档

#include "NvInfer.h"
#include "NvOnnxParser.h"
#include "NvInferRuntimeCommon.h"
#include
#include
#include

class Logger : public nvinfer1::ILogger
{
public:
  Logger(Severity severity = Severity::kWARNING) : reportableSeverity(severity)
  {
  }

  void log(Severity severity, char const* msg) noexcept

  {

    if (severity > reportableSeverity)
      return;

    switch (severity)
    {
      case Severity::kINTERNAL_ERROR:
        std::cerr << "INTERNAL_ERROR: ";
        break;
      case Severity::kERROR:
        std::cerr << "ERROR: ";
        break;
      case Severity::kWARNING:
        std::cerr << "WARNING: ";
        break;
      case Severity::kINFO:
        std::cerr << "INFO: ";
        break;
      default:
        std::cerr << "UNKNOWN: ";
        break;
    }
    std::cerr << msg << std::endl;
  }

  Severity reportableSeverity;
};

static Logger g_logger_;

void onnxToTRTModel(const std::string &model_file,
                    nvinfer1::IHostMemory *&trt_model_stream)
{
  int verbosity = (int)nvinfer1::ILogger::Severity::kWARNING;

  nvinfer1::IBuilder* builder = nvinfer1::createInferBuilder(g_logger_);

  nvinfer1::INetworkDefinition* network = builder->createNetworkV2(1U <<static_cast<uint32_t>(nvinfer1::NetworkDefinitionCreationFlag::kEXPLICIT_BATCH));

  auto parser = nvonnxparser::createParser(*network, g_logger_);

  if (!parser->parseFromFile(model_file.c_str(), verbosity))
  {
    std::string msg("failed to parse onnx file");
    g_logger_.log(nvinfer1::ILogger::Severity::kERROR, msg.c_str());
    exit(EXIT_FAILURE);
  }

  builder->setMaxBatchSize(1);

  nvinfer1::IBuilderConfig* iBuilderConfig = builder->createBuilderConfig();

  iBuilderConfig ->setMaxWorkspaceSize(1 << 20);

  nvinfer1::ICudaEngine* engine = builder->buildEngineWithConfig(*network,*iBuilderConfig);

  trt_model_stream = engine->serialize();

  std::ofstream p("../model.trt", std::ios::binary);
  if (!p) {
      std::cerr << "could not open plan output file" << std::endl;
  }
  p.write(reinterpret_cast<const char *>(trt_model_stream->data()), trt_model_stream->size());
  parser->destroy();
  engine->destroy();
  network->destroy();
   builder->destroy();
   iBuilderConfig->destroy();
}

int main() {
    nvinfer1::IHostMemory *trt_model_stream;
    onnxToTRTModel("../../config/pfe.onnx", trt_model_stream);
}

CMakeLists.txt

cmake_minimum_required(VERSION 3.10)
project(onnxToTensorRT)
find_package(CUDA)

SET(TENSORRT_PATH /home/xiaohu/3D/TensorRT-8.4.0.6/)
SET(TENSORRT_LIB_PATH /home/xiaohu/3D/TensorRT-8.4.0.6/lib)

include_directories(
   include
   ${TENSORRT_PATH}/include
   ${CUDA_INCLUDE_DIRS}
)

set(SOURCE_FILES
   onnxToTensorRT.cpp
)

file(GLOB TENSORRT_LIBS "${TENSORRT_LIB_PATH}/*.so")
cuda_add_executable(${PROJECT_NAME} ${SOURCE_FILES})
target_link_libraries(
   ${PROJECT_NAME}
   ${TENSORRT_LIBS}
   ${CUDA_LIBRARIES}
)

python


import sys
import os
import argparse
import tensorrt as trt

EXPLICIT_BATCH = 1 << (int)(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH)

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="PyTorch Object Detection Inference")
    parser.add_argument("--onnx_path", type=str,
                        default='static_sim.onnx')
    parser.add_argument("--trt_path", type=str,
                        default='static_sim.trt')
    args = parser.parse_args()
    onnx_file_path = args.onnx_path
    engine_file_path = args.trt_path
    print('get start')
    TRT_LOGGER = trt.Logger()
    with trt.Builder(TRT_LOGGER) as builder, builder.create_network(EXPLICIT_BATCH) as network, trt.OnnxParser(network, TRT_LOGGER) as parser:
        config = builder.create_builder_config()
        config.max_workspace_size =( 1 << 30 ) * 2
        builder.max_batch_size = 16
        config.set_flag(trt.BuilderFlag.FP16)

        print('Loading ONNX file from path {}...'.format(onnx_file_path))
        with open(onnx_file_path, 'rb') as model:
            print('Beginning ONNX file parsing')
            if not parser.parse(model.read()):
                print ('ERROR: Failed to parse the ONNX file.')
                for error in range(parser.num_errors):
                    print (parser.get_error(error))

        print(f"raw shape of {network.get_input(0).name} is: ", network.get_input(0).shape)
        print(f"raw shape of {network.get_input(1).name} is: ", network.get_input(1).shape)
        print(f"raw shape of {network.get_input(2).name} is: ", network.get_input(2).shape)

        print('Completed parsing of ONNX file')
        print('Building an engine from file {}; this may take a while...'.format(onnx_file_path))
        engine = builder.build_engine(network,config)
        print("Completed creating Engine")
        with open(engine_file_path, "wb") as f:
            f.write(engine.serialize())

trtexec

TensorRT-8.4.3.1/targets/x86_64-linux-gnu/bin/trtexec --onnx=static_sim.onnx --explicitBatch --saveEngine= static_sim.trt --workspace=1024

欢迎大家关注笔者，你的关注是我持续更博的最大动力

Original: https://blog.csdn.net/weixin_42905141/article/details/124452516
Author: 令狐少侠、
Title: TensorRT8——ONNX转trt（C++)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/559236/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍

【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍文章目录【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍 * 一、Gaz…

人工智能 2023年7月26日
0062
Python neo4j建立知识图谱，药品知识图谱，neo4j知识图谱，知识图谱的建立过程，智能用药知识图谱，智能问诊必备知识图谱

一、知识图谱概念知识图谱的概念是由谷歌公司在2012年5月17日提出的，谷歌公司将以此为基础构建下一代智能化搜索引擎，知识图谱技术创造出一种全新的信息检索模式，为解决信息检索问题…

人工智能 2023年7月27日
0094
【python量化】将Transformer模型用于股票价格预测

前言下面的这篇文章主要教大家如何搭建一个基于Transformer的简单预测模型，并将其用于股票价格预测当中。原代码在文末进行获取。 ; 1、Transformer模型 Tran…

人工智能 2023年7月14日
00150
Win11一些问题以及解决方案

以下方法均在Win11 22H2上成果使用以管理员身份运行CMD，并一次运行下列3行代码。 reg add HKCU\Software\Classes\CLSID\{86ca1a…

人工智能 2023年6月28日
0092
关于新版本selenium定位元素报错：‘WebDriver‘ object has no attribute ‘find_element_by_id‘等问题

由于一段时间没有使用Selenium，当再次使用时发现之前写的Selenium元素定位的代码运行之后会报错，发现是Selenium更新到新版本（4.x版本）后，以前的一些常用的代码…

人工智能 2023年6月23日
00101
pandas数据的合并concat()和merge()

import pandas as pd 轴向连接(concatenation): pd.concat() 可以沿一个轴将多个DataFrame对象连接在一起, 形成一个新的Data…

人工智能 2023年7月9日
0071
【音视频】实操YUV与RGB互转（planar模式 YUV420、YUV422、YUV444与RGB888）

前言 提示：书写目的&am…

人工智能 2023年6月18日
0077
浅谈 USB Audio（1）—— Feedback端点作用

前不久有网友和同行问我关于 usb audio feedback 端点的种种问题，于是笔者在这里总结一下。 1.Feedback 端点描述符在Audio1.0和 Audio2.0…

人工智能 2023年5月25日
0078
TensorBoard 遇到的坑

[主要参考](https://zhuanlan.zhihu.com/p/42438077) …

人工智能 2023年5月25日
0091
spark dataframe 类型转换

读一张表，对其进行二值化特征转换。可以二值化要求输入类型必须double类型，类型怎么转换呢？直接利用spark column 就可以进行转换： DataFrame datase…

人工智能 2023年6月2日
0070
pandas使用HYPERLINK追加写入超链接-url、文件、图片

pandas使用HYPERLINK追加写入超链接-url、文件、图片使用HYPERLINK即可达到目的，可以写url、文件、图片、各种你自己能访问的路径注意：HYPERLINK…

人工智能 2023年7月17日
0059
机器学习 Pytorch实现案例 LSTM案例（航班人数预测）

Pytorch学习案例之一。step 1、确定数据来源数据来源于seaborn的内置数据集 import torch import torch.nn as nn import se…

人工智能 2023年6月16日
00134
Android studio安装教程

Android studio安装教程傻瓜式教程如果想要彻底重装Android studio可以删除目录C:\Users\用户名中的以下几个文件夹。.android.gradl…

人工智能 2023年5月30日
00101
matlab实现nc文件批量转tif文件

（1）成功运行例子：（PM1） MATLAB：读取nc文件并将nc文件转为tif文件输出_BetterQ.的博客-CSDN博客_nc文件转tif clc clear %% 批读取N…

人工智能 2023年6月11日
00169
SpringBoot自定义错误页

一、概述在处理异常时，开发者可以根据实际情况返回不同的页面，这种异常处理方式一般用来处理应用级别的异常。但是，有一些容器级别的错误就处理不了，例如 Filter中抛出异常，使用 …

人工智能 2023年6月29日
0066
Anaconda安装与配置Python环境

因为需要配置airsim环境，本来决定在命令行直接安装python的，但是有个包的下载始终有问题，想把python的版本换了试试，但cmd操作太麻烦，于是萌生了使用Anaconda…

人工智能 2023年7月30日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TensorRT8——ONNX转trt（C++)

C++

python

trtexec

大家都在看