CUDA-Z工具分析Nvidia显卡算力信息

2023年5月24日下午7:24 • 人工智能 • 阅读 80

类似于Windows下使用CPU-Z工具查看CPU信息，Linux下也可以使用CUDA-Z工具来查看显卡资源/支持信息。

CUDA-Z运行需要主机首先已经安装CUDA和N卡驱动为前提，具体步骤可参考博客:

Darknet CUDA/CUDANN环境的快速安装_tugouxp的专栏-CSDN博客

然后，您可以开始执行以下步骤：

[En]

You can then begin the following steps:

下载cuda-z

cuda-z在sourceforge上开源，主页地址:CUDA-Z

按照主页提示转到下载页面：

[En]

Follow the home page prompts to go to the download page:

下载后得到文件CUDA-Z-0.10.251-64bit.run

运行：

CUDA-Z-0.10.251-64bit.run是个绿色程序，添加可执行属性后直接运行即可,界面如下:

核心信息：

显存信息：

不过NVIDIA 2G的显存并没有映射到BAR上。

算力信息,1TFLOPS=1000GFLOPS,所以这里单精度浮点算力为1.2TFLOPS左右。
Single Precision Float 1192.48 Gflop/s Double Precision Float 20.6227 Gflop/s 64-Bit Integer 23.0647 Giop/s 32-Bit Integer 398.375 Giop/s 24-Bit Integer 289.689 Giop/s

GPU算力特点，和CPU相比的不同：

CPU除了负责浮点整形运算外，还有很多其他的指令集的负载，比如像多媒体解码，硬件解码等，因此CPU是多才多艺的。CPU注重的是单线程的性能，要保证指令流不中断，需要消耗更多的晶体管和能耗用在控制部分，于是CPU分配在浮点计算的功耗就会变少。

GPU基本上只做浮点运算的，设计结构简单，也就可以做的更快。GPU注重的是吞吐量，单指令能驱动更多的计算，相比较GPU消耗在控制部分的能耗就比较少，因此可以把电省下来的资源给浮点计算使用。

工具信息：

Windows下的GPU-Z

Windows下还有另外一款GPU分析工具叫做GPU-Z，估计是模仿CPU-Z起的名字，GPUZ不但可以分析N卡，还能对其它厂家的显卡比如英特尔的集成显卡进行分析，从下拉列表中选择你想获取信息的显卡，界面将会自动刷新。

N卡信息：

英特尔显卡：

从对CUDA的支持可以看出两类显卡的一个明显差异。

再来看一个AMD的显卡，可以看到不支持CUDA，不支持光追。

对比可以发现，AMD的显卡全面优于INTEL的集成显卡。

GPU性能测速

使用gpu-burn测试GPU 单精度，双精度以及tensor core的计算能力.

1.下载gpu-burn

$ git clone https://github.com/wilicc/gpu-burn

2.编译

$ cd gpu-burn
$ make

3.测试

测试单精度

zlcao@zlcao-RedmiBook-14:~/gpu/gpu-burn$ ./gpu_burn 60
Burning for 60 seconds.

GPU 0: NVIDIA GeForce MX250 (UUID: GPU-657800de-5f00-da64-7c46-68e7e31fcae1)
Initialized device 0 with 2001 MB of memory (1878 MB available, using 1690 MB of it), using FLOATS
Results are 16777216 bytes each, thus performing 103 iterations
13.3%  proc'd: 412 (1022 Gflop/s)   errors: 0   temps: 44 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:31:36 CST

25.0%  proc'd: 721 (1020 Gflop/s)   errors: 0   temps: 48 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:31:43 CST

36.7%  proc'd: 1236 (1018 Gflop/s)   errors: 0   temps: 55 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:31:50 CST

48.3%  proc'd: 1648 (1021 Gflop/s)   errors: 0   temps: 58 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:31:57 CST

60.0%  proc'd: 2060 (1013 Gflop/s)   errors: 0   temps: 61 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:32:04 CST

71.7%  proc'd: 2472 (1013 Gflop/s)   errors: 0   temps: 62 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:32:11 CST

83.3%  proc'd: 2781 (1013 Gflop/s)   errors: 0   temps: 63 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:32:18 CST

95.0%  proc'd: 3296 (1012 Gflop/s)   errors: 0   temps: 65 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:32:25 CST

100.0%  proc'd: 3605 (1009 Gflop/s)   errors: 0   temps: 66 C
Killing processes.. Freed memory for dev 0
Uninitted cublas
done

Tested 1 GPUs:
    GPU 0: OK

测试双精度

./gpu_burn -d 60
Burning for 60 seconds.

GPU 0: NVIDIA GeForce MX250 (UUID: GPU-657800de-5f00-da64-7c46-68e7e31fcae1)
Initialized device 0 with 2001 MB of memory (1878 MB available, using 1690 MB of it), using DOUBLES
Results are 33554432 bytes each, thus performing 50 iterations
36.7%  proc'd: 50 (39 Gflop/s)   errors: 0   temps: 47 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:36:51 CST

50.0%  proc'd: 50 (39 Gflop/s)   errors: 0   temps: 49 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:36:59 CST

66.7%  proc'd: 50 (39 Gflop/s)   errors: 0   temps: 51 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:37:09 CST

83.3%  proc'd: 100 (39 Gflop/s)   errors: 0   temps: 52 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:37:19 CST

100.0%  proc'd: 100 (39 Gflop/s)   errors: 0   temps: 54 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:37:29 CST

100.0%  proc'd: 100 (39 Gflop/s)   errors: 0   temps: 54 C
Killing processes.. Freed memory for dev 0
Uninitted cublas
done

Tested 1 GPUs:
    GPU 0: OK

测试tensor core

./gpu_burn -tc 60
Burning for 60 seconds.

GPU 0: NVIDIA GeForce MX250 (UUID: GPU-657800de-5f00-da64-7c46-68e7e31fcae1)
Initialized device 0 with 2001 MB of memory (1878 MB available, using 1690 MB of it), using FLOATS, using Tensor Cores
Results are 16777216 bytes each, thus performing 103 iterations
11.7%  proc'd: 412 (1025 Gflop/s)   errors: 0   temps: 59 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:16 CST

23.3%  proc'd: 824 (1025 Gflop/s)   errors: 0   temps: 61 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:23 CST

35.0%  proc'd: 1236 (1018 Gflop/s)   errors: 0   temps: 63 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:30 CST

46.7%  proc'd: 1648 (1014 Gflop/s)   errors: 0   temps: 64 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:37 CST

58.3%  proc'd: 1957 (1013 Gflop/s)   errors: 0   temps: 65 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:44 CST

70.0%  proc'd: 2472 (1015 Gflop/s)   errors: 0   temps: 67 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:51 CST

81.7%  proc'd: 2884 (1017 Gflop/s)   errors: 0   temps: 67 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:38:58 CST

91.7%  proc'd: 3193 (1015 Gflop/s)   errors: 0   temps: 68 C
    Summary at:   2023&#x5E74; 01&#x6708; 28&#x65E5; &#x661F;&#x671F;&#x516D; 19:39:04 CST

100.0%  proc'd: 3605 (1015 Gflop/s)   errors: 0   temps: 69 C
Killing processes.. Freed memory for dev 0
Uninitted cublas
done

Tested 1 GPUs:
    GPU 0: OK

得到的数据和上面cuda-z得到的还是非常接近的。

-tc指定tensor core上跑的原理是会导致cublasSetMathMode的执行。

其中的参数 CUBLAS_TENSOR_OP_MATH 根据官方文档，表达让GPU尽可能的利用tensor core去完成计算。

结束！

Original: https://blog.csdn.net/tugouxp/article/details/122796855
Author: papaofdoudou
Title: CUDA-Z工具分析Nvidia显卡算力信息

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/509027/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

从零在AutoDL调试一份目标检测代码

训练yoloV3，强烈建议3090，而且类别检测不要太多，否则会很难达到预期的效果，如下是你遇到的问题，训练深度学习强烈建议高显存显卡。一. 预备工作参考博客 pycharm远…

人工智能 2023年7月12日
0036
HDFS_06_HDFS服务器节点的分类

HDFS_06_HDFS服务器节点的分类持续更新 大数据 文章… 1. HDFS服务器节点的分类 ⭐…

人工智能 2023年7月2日
0038
R语言Kaplan-Meier绘制生存分析、Log-rank假设检验、Cox回归曲线实战案例：恶性黑色素瘤的术后数据生存分析

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月17日
0046
关系抽取信息抽取知识图谱

20210629 http://cmekg.pcl.ac.cn/cmekg 知识图谱，关系抽取 20210628 https://www.cnblogs.com/robert-dl…

人工智能 2023年6月1日
0070
opencv-python和yolo5(torch)实现实时检测

先下载yolo5项目： https://github.com/ultralytics/yolov5 用pycharm新建一个项目勾选Inherit global site-pack…

人工智能 2023年7月20日
0066
Pandas进阶之DataFrame多级索引

多级索引：在一个轴上有多个(两个以上）的索引，能够以低维度形式来表示高维度的数据。单级索引是Index对象，多级索引是MultiIndex对象。一、创建多级索引方法一：隐式创建…

人工智能 2023年6月2日
0065
深入理解深度学习——图嵌入（Graph Embedding）

分类目录：《深入理解深度学习》总目录前面的文章介绍了由Word Embedding延伸出的Item Embedding等，这些延伸都建立在它们有序列特性的基础上。其实，可延伸的领…

人工智能 2023年6月25日
0087
论文阅读《PTR: Prompt Tuning with Rules for Text Classification》

PTR: Prompt Tuning with Rules for Text Classification 提出背景 Prompt-oriented fine-tuning加速收敛…

人工智能 2023年6月1日
0059
Python3.8安装tensorflow

以下内容是针对安装tensorflow-CPU版本的。 tensorflow已经支持Python3.8版本的安装。可以查看自己的Python版本信息，以及可以支持的tensorf…

人工智能 2023年7月4日
0071
pytorch——mnist手写数据识别

目录 1、pytorch自带的数据集 1.1 torchvision.datasets 1.2 MNIST数据集的介绍 2、使用Pytorch实现手写数字识别 2.1思路和流程分析…

人工智能 2023年6月16日
0056
Python数据分析入门笔记5——数据预处理之异常值

系列文章目录 Python数据分析入门笔记1——学习前的准备Python数据分析入门笔记2——pandas数据读取Python数据分析入门笔记3——数据预处理之缺失值Python数…

人工智能 2023年7月6日
0085
一种不太聪明的电话语音识别方案

现如今ASR(语音识别技术)发展到什么阶段我不清楚，但识别率肯定是达不到100%的，识别率跟你所采用的识别模型，声音样本丰富程度，和语音文件的音质有关。如果普通话标准，且语音文件…

人工智能 2023年5月25日
0060
人工智能在无人驾驶领域有哪些方面的运用和应用

人工智能的应用领域有哪些？人工智能的应用领域有哪些？人工智能主要应用领域 1、农业：农业中已经用到很多的AI技术，无人机喷撒农药，除草，农作物状态实时监控，物料采购，数据收集，…

人工智能 2023年6月19日
0061
Cartographer实时建图（个人定制版）

在先前已经完成了Cartographer离线建图，离线建图方案是，先在底盘主机中录制bag包，包括/scan、/odom、/tf话题，然后将bag包拷贝到从机中，也就是自己的电脑，…

人工智能 2023年7月28日
0044
Excel基础教程（2）——函数与公式

=G12+H12 =G13&H13 文本不可直接求和，加0或者乘以1后，会转为数值，可以求和。在一个单元格中填写公式后，点击单元格右下角拖拽或在此直接双击可以填充…

人工智能 2023年7月16日
0063
YOLO系列损失函数详解

YOLOV1 YOLOV1最后生成7×7的网格(grid cell)，每个grid cell会产生两个预测框(bounding box)，每个grid cell产生的两个预测框只能…

人工智能 2023年7月6日
0081

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

CUDA-Z工具分析Nvidia显卡算力信息

下载cuda-z

运行：

工具信息：

Windows下的GPU-Z

GPU性能测速

结束！

大家都在看