TensorRT入门(Windows上安装与VisualStudio项目配置)

2023年5月23日下午6:56 • 人工智能 • 阅读 74

下载地址：NVIDIA TensorRT 8.x Download，选择对应的版本下载下来
解压出来得到 TensorRT-8.x.x.x，并放置到一个目录下作为安装目录 <install_path></install_path>
将 <install_path>/lib</install_path>写入 PATH变量，如 D:\deploy_tools\TensorRT-8.4.0.6\lib
打开 <install_path>/python</install_path>目录，里面有很多 whl文件，选择python对应版本的 whl使用 pip进行安装

cd /d D:\deploy_tools\TensorRT-8.4.0.6\python
pip install tensorrt-8.4.0.6-cp37-none-win_amd64.whl

这里安装了python3.7版本的，如果是使用其他的python版本应当替换文件名。

完成以上步骤安装就可以了。这个时候可以使用 <install_path>/sample/sampleMNIST</install_path>这个项目试验一下，打开文件夹下面的 .sln文件，使用Visual Studio生成一下文件即可。生成得到的可执行文件放在了 <install_path>/bin</install_path>文件夹下。可以尝试执行一下，得到类似如下的信息就表示安装成功了。

&&&& RUNNING TensorRT.sample_mnist [TensorRT v8400] # sample_mnist.exe
[03/02/2022-16:35:11] [I] Building and running a GPU inference engine for MNIST
[03/02/2022-16:35:11] [I] [TRT] [MemUsageChange] Init CUDA: CPU +246, GPU +0, now: CPU 3815, GPU 2013 (MiB)
[03/02/2022-16:35:12] [I] [TRT] [MemUsageSnapshot] Begin constructing builder kernel library: CPU 3877 MiB, GPU 2013 MiB
[03/02/2022-16:35:12] [I] [TRT] [MemUsageSnapshot] End constructing builder kernel library: CPU 3890 MiB, GPU 2013 MiB
[03/02/2022-16:35:12] [W] [TRT] TensorRT was linked against cuBLAS/cuBLAS LT 10.2.2 but loaded cuBLAS/cuBLAS LT 10.0.0
[03/02/2022-16:35:12] [I] [TRT] [MemUsageChange] Init cuBLAS/cuBLASLt: CPU +113, GPU +34, now: CPU 3957, GPU 2047 (MiB)
[03/02/2022-16:35:12] [I] [TRT] [MemUsageChange] Init cuDNN: CPU +206, GPU +68, now: CPU 4163, GPU 2115 (MiB)
[03/02/2022-16:35:12] [W] [TRT] TensorRT was linked against cuDNN 8.3.2 but loaded cuDNN 8.0.5
[03/02/2022-16:35:12] [I] [TRT] Local timing cache in use. Profiling results in this builder pass will not be stored.

[03/02/2022-16:35:13] [I] [TRT] Detected 1 inputs and 1 output network tensors.

[03/02/2022-16:35:13] [I] [TRT] Total Host Persistent Memory: 10784
[03/02/2022-16:35:13] [I] [TRT] Total Device Persistent Memory: 1024
[03/02/2022-16:35:13] [I] [TRT] Total Scratch Memory: 0
[03/02/2022-16:35:13] [I] [TRT] [MemUsageStats] Peak memory usage of TRT CPU/GPU memory allocators: CPU 1 MiB, GPU 886 MiB
[03/02/2022-16:35:13] [I] [TRT] [BlockAssignment] Algorithm ShiftNTopDown took 0.0757ms to assign 3 blocks to 11 nodes requiring 57860 bytes.

[03/02/2022-16:35:13] [I] [TRT] Total Activation Memory: 57860
[03/02/2022-16:35:13] [I] [TRT] [MemUsageChange] TensorRT-managed allocation in building engine: CPU +0, GPU +4, now: CPU 0, GPU 4 (MiB)
[03/02/2022-16:35:13] [I] [TRT] [MemUsageChange] Init CUDA: CPU +0, GPU +0, now: CPU 4238, GPU 2121 (MiB)
[03/02/2022-16:35:13] [I] [TRT] Loaded engine size: 1 MiB
[03/02/2022-16:35:13] [I] [TRT] [MemUsageChange] TensorRT-managed allocation in engine deserialization: CPU +0, GPU +1, now: CPU 0, GPU 1 (MiB)
[03/02/2022-16:35:13] [I] [TRT] [MemUsageChange] TensorRT-managed allocation in IExecutionContext creation: CPU +0, GPU +0, now: CPU 0, GPU 1 (MiB)
[03/02/2022-16:35:13] [I] Input:
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@=   ++++#++=*@@@@@
@@@@@@@@#.            *@@@@@
@@@@@@@@=             *@@@@@
@@@@@@@@.   .. ...****%@@@@@
@@@@@@@@: .%@@#@@@@@@@@@@@@@
@@@@@@@%  -@@@@@@@@@@@@@@@@@
@@@@@@@%  -@@*@@@*@@@@@@@@@@
@@@@@@@#  :#- ::. ::=@@@@@@@
@@@@@@@-             -@@@@@@
@@@@@@%.              *@@@@@
@@@@@@#     :==*+==   *@@@@@
@@@@@@%---%%@@@@@@@.  *@@@@@
@@@@@@@@@@@@@@@@@@@+  *@@@@@
@@@@@@@@@@@@@@@@@@@=  *@@@@@
@@@@@@@@@@@@@@@@@@*   *@@@@@
@@@@@%+%@@@@@@@@%.   .%@@@@@
@@@@@*  .******=    -@@@@@@@
@@@@@*             .#@@@@@@@
@@@@@*            =%@@@@@@@@
@@@@@@%#+++=     =@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@

[03/02/2022-16:35:13] [I] Output:
0:
1:
2:
3:
4:
5: **********
6:
7:
8:
9:

&&&& PASSED TensorRT.sample_mnist [TensorRT v8400] # sample_mnist.exe

在这里遇到一个问题，我这边电脑是安装了cuda10的,并且cuda的路径是在 PATH中的，但是当我第一次执行 sample_mnist.exe文件的时候发现报错 Unable to load library:cublas64_10.dll。也就是说没有找到 cublas64_10.dll，于是我进入了 <path_cuda>/v10.0/bin</path_cuda>目录下，发现有一个 cublas64_100.dll文件，应该就是需要的 cublas64_10.dll文件，于是复制了一个新的 cublas64_100.dll，并且重命名为了 cublas64_10.dll。就不报这个错误了。

&&&& RUNNING TensorRT.sample_mnist [TensorRT v8400] # sample_mnist.exe
[03/02/2022-16:40:37] [I] Building and running a GPU inference engine for MNIST
[03/02/2022-16:40:37] [I] [TRT] [MemUsageChange] Init CUDA: CPU +254, GPU +0, now: CPU 5106, GPU 2013 (MiB)
[03/02/2022-16:40:37] [I] [TRT] [MemUsageSnapshot] Begin constructing builder kernel library: CPU 5171 MiB, GPU 2013 MiB
[03/02/2022-16:40:37] [I] [TRT] [MemUsageSnapshot] End constructing builder kernel library: CPU 5175 MiB, GPU 2013 MiB
[03/02/2022-16:40:37] [E] [TRT] 6: [libLoader.h::nvinfer1::rt::DynamicLibrary::DynamicLibrary::49] Error Code 6: Internal Error (Unable to load library: cublas64_10.dll)
[03/02/2022-16:40:37] [E] [TRT] 2: [builder.cpp::nvinfer1::builder::Builder::buildSerializedNetwork::619] Error Code 2: Internal Error (Assertion engine != nullptr failed. )
&&&& FAILED TensorRT.sample_mnist [TensorRT v8400] # sample_mnist.exe

这里的8.4.0.6版本的TensorRT需要cuda10.2+cudnn8的环境。很遗憾我这边电脑之前装的是cuda10.0+cudnn7的环境，还缺 cudnn64_8.dll，我发现 <path_cuda>/v10.0/bin</path_cuda>里面有一个 cudnn64_7.dll，尝试了一下将 cudnn64_7.dll复制一个重命名为 cudnn64_8.dll也是可以的，在运行的时候会有信息提醒，但是可以运行下去。

sample_mnist是使用caffe框架模型进行的，配置好以上信息应该是没有问题了，但是如果使用其他框架的模型，如tensorflow，则可能出现无法加载 cublasLt64_10.dll的情况。不太清楚是不是由于cuda版本的原因，在网上下载了一个这个文件，也是放到 <path_cuda>/v10.0/bin</path_cuda>就可以了。在这个地址下载就好：dll4free

另外一个小问题是发现这个 sampleMNIST项目打了断点也没有调试，还是直接运行完了项目，打开项目 项目属性-> 链接器 -> 调试 -> 生成调试信息中的false修改为优化以便于调试(/DEBUG)就好了。这样就可以慢慢研究tensorRT是如何进行的了。

如果需要使用到Tensorflow或者PyTorch框架的话，需要使用到 uff, graphsurgeon和 onnx_graphsurgeon的库文件，需要额外安装一下对应的 .whl文件：

python3 -m pip install <install_path>\graphsurgeon\graphsurgeon-0.4.5-py2.py3-none-any.whl
python3 -m pip install <install_path>\uff\uff-0.6.9-py2.py3-none-any.whl
python3 -m pip install <install_path>\onnx_graphsurgeon\onnx_graphsurgeon-0.3.12-py2.py3-none-any.whl
</install_path></install_path></install_path>

在Visual Studio项目中创建自己的项目可以尝试将 samples文件夹下的项目复制一个后来修改，也可以从零开始创建。无非就是将需要的 include和 lib添加进去。

将 <install_path>/lib</install_path>和 $(CUDA_PATH)\lib\x64添加到 VC++ Directories > Executable Directories
将 <install_path>/include</install_path> 添加到 C/C++ > General > AdditionalDirectories
在 Linker > Input > Additional Dependencies中添加以下所有的库文件：
nvinfer.lib
nvinfer_plugin.lib
nvonnxparser.lib
nvparsers.lib
cudnn.lib
cublas.lib
cudart.lib
(Optional) 完成以上配置后将 sample_mnist.cpp文件内容复制到项目中发现有一些include问题，这个时候如果需要使用到他们的一些函数作为支持的话，还需要在 C/C++ > General > AdditionalDirectories中添加：
<install_path>/samples/common</install_path>
<install_path>/samples/common/windows</install_path>
$(CUDA_PATH)\include
(Optional)使用 sample_mnist.cpp时候，由于使用到了 logger.h和 getopt.h中的相关函数实现，需要将 logger.cpp以及 getopt.c文件添加到项目的 源文件中。
(Optional)编译 sample_mnist.cpp的时候报 localtime不安全的问题，在 C/C++ > 预处理器 > 预处理器定义中添加 _CRT_SECURE_NO_WARNINGS即可
(Optional)编译 sample_mnist.cpp的时候报 无法从const char* 转化为LPCWSTR的问题，将 常规 > 字符集修改为 <从父级项目或默认设置继承>，点击应用后应该显示一个空的格子，既不要是Unicode,也不要是多字节字符。

Original: https://blog.csdn.net/sinat_18131557/article/details/123237148
Author: sinat_18131557
Title: TensorRT入门(Windows上安装与VisualStudio项目配置)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/497464/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测后处理中检测框不稳定的处理方式

前言经历了场景需求调研，方案技术路线。下面开始时间算法开发： ; 一、目标检测框不稳定类型 1.目标检测框的宽高比不稳定2.目标检测框的中心坐标稳定3.目标检测框连续若干帧检测不…

人工智能 2023年7月9日
00112
YOLOV5-断点训练/继续训练

YOLOV5-断点训练/继续训练情况：1.训练过程中中断了，继续训练2.训练完了，但是未收敛，在这个基础上，还想用这个权重、学习率等参数继续训练多一些批次 1. 训练过程中中断了…

人工智能 2023年7月26日
0068
密度图+回归线，相关图这样画？seaborn中 joinplot 结合核密度图和回归图（KDE+regplot）

因为jointplot就是联合绘图，通常边缘上绘制分布图，中间绘制其它的（比如核密度图），所以如何去除边缘的分布图，再叠加一条回归线呢,可以用于替换常规散点图表示相关图的方式，如下…

人工智能 2023年7月16日
0081
训练集（离线）与测试集（上线）效果差距很大怎么办？

相信各位童鞋在跑模型的时候时不时会遇到一个尴尬的现象，就是你在训练集或者验证集的模型效果好到令人发指，一时间以为”哼~就这？🤨游戏结束”，结果当你在测试集或…

人工智能 2023年6月19日
00210
【目标检测】YOLOv5遇上知识蒸馏

前言模型压缩方法主要4种：网络剪枝(Network pruning) 稀疏表示(Sparse representation) 模型量化(Model quantification…

人工智能 2023年6月30日
0067
目标检测中的mAP+PyTorch实现

mAP mAP，全称为mean Average Precision，在目标检测任务中被用于衡量检测器的好坏。本文第一部分讲解mAP的概念以及计算过程，第二部分专注于用代码实现mAP…

人工智能 2023年7月12日
0056
基于神经网络的实时文本检测(自用代码+注释)

环境：Pycharm + python3.7 + opencv 目录 1. 准备工作： 1.1 添加相关库 2. 主要代码 2.1 导入相关库 2.2 导入数据图片及其标签，并检测…

人工智能 2023年7月14日
0071
基于TADK的应用分类

基于TADK的应用分类 Traffic Analytics Development Kit (TADK) 是Intel 推出的针对IA平台高度优化的流量分析开发套件。其核心模块流特…

人工智能 2023年7月2日
00142
Deepin20.6 RTX3080 安装显卡驱动510.60.02、CUDA11.6、PyTorch1.11

Deepin20.6 RTX3080 安装显卡驱动510.60.02、CUDA11.6、PyTorch1.11 0 前言 1 准备工作 2 清理环境 3 安装显卡驱动 4 安装Py…

人工智能 2023年7月23日
00211
基于句式元学习的Twitter分类

关注微信公众号：人工智能技术与咨询。了解更多咨询！基于句式元学习的Twitter分类人工智能技术与咨询本文来自《北京大学学报(自然科学版)》，作者闫雷鸣等摘要针对多类别的…

人工智能 2023年6月1日
0078
Ubuntu Qt5 Firebird 数据库驱动安装

Ubuntu Qt5 Firebird 数据库驱动安装 apt install libqt5sql5-ibase Original: https://www.cnblogs.com…

人工智能 2023年6月4日
0086
监督学习的训练过程中可能会面临的问题有哪些？如何解决这些问题

监督学习中可能遇到的问题在监督学习的训练过程中，我们可能会面临以下几个问题：欠拟合（Underfitting）：模型复杂度不够，无法捕捉到数据中的关键模式和规律。过拟合（Ov…

人工智能 2024年1月2日
0061
yolov5检测框显示中文标签

目录前言 1、有中文标签的数据集 2、yolov5代码修改为支持中文标签前言很多人在训练yolov5目标检测的时候，标签只能显示英文的。怎么样才可以训练一个可以检测物体并且显…

人工智能 2023年7月13日
0086
新手入门保姆级教程，Linux平台和手机端SDK，基于Opencv、MNN、NCNN

一 MNN编译动态库环境要求 cmake（建议使用3.10或以上版本） protobuf（使用3.0或以上版本） gcc（使用4.9或以上版本） MNN官方Git：GitHub …

人工智能 2023年7月19日
00154
Python图像处理丨基于OpenCV和像素处理的图像灰度化处理

摘要：本篇文章讲解图像灰度化处理的知识，结合OpenCV调用cv2.cvtColor()函数实现图像灰度操作，使用像素处理方法对图像进行灰度化处理。本文分享自华为云社区《[Pyt…

人工智能 2023年6月19日
0083
大数据可以应用在哪些行业？

大数据被应用较多的领域有哪些？疫情期间大数据技术对于疫情的防控发挥了巨大的作用，抗疫期间多家互联网企业纷纷加强大数据在疫情防控中的应用。小到社区大到部委相关部门都将大数据作为不可…

人工智能 2023年7月17日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TensorRT入门(Windows上安装与VisualStudio项目配置)

大家都在看