GPU运行Tensorflow详细教程及错误解决

2023年5月26日下午4:43 • 人工智能 • 阅读 166

GPU运行Tensorflow详细教程及错误解决

前提条件
配置GPU运行
确认是否成功配置
出现的错误及解决方案

前提条件

最重要的一点：CUDA与tensorflow的版本一点要对应，不然用不了！
首先在系统搜索NVIDIA进入该控制面板，查看驱动版本

之后进入官网下载CUDA与CUDnn（这两个是配套的，都要安装CUDNN下载回比较麻烦，需要注册）
CUDA官网下载地址：
https://developer.nvidia.com/cuda-toolkit-archive
CUDNN官网下载地址：https://developer.nvidia.com/rdp/cudnn-archive

下载后安装CUDA，需要注意第一个安装界面出现的文件路径是解压路径（如下图），这个不用改，安装结束后系统会自动删除

而文件真正的安装路径在我们后续选择安装的项目才出现（这时一般会弹出三个路径，可以改也可以不改，我个人是把它改了，改完后要记住这个路径，后续可能会用到），到选择安装那一步时只需要选择CUDA这个选项即可，其他都不用选。

安装完毕后解压下载的CUDNN，里面会有以下几个文件

复制这几个文件，直接粘贴到CUDA的安装文件夹下，粘贴时系统提示有重复文件就直接选择替换文件

然后在命令行输入nvcc -V，有出现以下的版本信息就OK了，若没有出现则是环境变量没有配置好

若系统没有知道配置好则需要手动配置，在系统环境变量PATH添加以下几个，其中画黄线的部分就是刚刚CUDA的安装路径（系统默认的安装路径为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA）
GPU运行Tensorflow详细教程及错误解决

配置完成后在运行nvcc -V就发现可以了

接着打开命令行，若下载cpu版本则输入：pip inatall tensorflow
gpu版本则输入：pip install tensorflow-gpu
等待安装完毕后在命令行输入python，接着输入import tensorflow，系统出现下图中的这行文字未报错，或是什么提示都没有就说明安装成功了。

; 配置GPU运行

在运行的代码前面加上以下代码

import os
os.environ["CUDA_DEVICES_ORDER"] = "PCI_BUS_IS"
os.environ["CUDA_VISIBLE_DEVICES"] = "0"

若在终端与运行可以打开文件所在路径然后输入以下代码运行

CUDA_VISIBLE_DEVICES=1,2  python XXX.py

确认是否成功配置

1.打开python编译器，或者命令行输入python，然后输入以下代码

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

系统既有CPU又有GPU信息说明配置成功。

打开命令行输入nvidia-smi命令就可以查看当前CPU与GPU信息了，一般在运行过程中我们会输入nvidia-smi –l命令让其默认没5秒刷新一次，查看程序运行过程中系统的变化（可按Ctrl+C停止）。

其他命令：nvidia-smi –l xxx（指定刷新频率，单位为S）
nvidia-smi –f xxx（将查询的信息输出到具体的文件中，不在终端显示）

查看python路径：where python
查看python版本：python -V 或 python –version
查看tensorflow版本与路径：

import tensorflow as tf
print(tf.__version__)
print(tf.__path__)

出现的错误及解决方案

1.仍然运行很慢，仔细检查会发现在运行窗口中有如下错误：
tensorflow-keras: Layer lstm will not use cuDNN kernel since it doesn’t meet the cuDNN kern
这是由于不符合LSTM网络的gpu运行规范所导致的，基础题规范见下图

由于其中大多数参数不填默认为标准值，只有recurrent_activation与activation参数经常会被修改，因此我们要将代码中的LSTM网络这些参数进行修改或直接删除，如下，只保留输出维度与激活函数，这样就不会报错了，可以正常GPU运行了。

tf.keras.layers.LSTM(16,recurrent_activation='sigmoid')

Original: https://blog.csdn.net/qq_43605229/article/details/118423613
Author: Lin-CT
Title: GPU运行Tensorflow详细教程及错误解决

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/520586/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

YOLOv5的Tricks | 【Trick12】YOLOv5使用的数据增强方法汇总

如有错误，恳请指出。时隔两个多月重新看yolov5的代码显然开始力不从心，当时应该一鼓作气的整理完的。在专栏前面的内容一直介绍的是yolov5训练时候使用的一些技巧，这里用这篇…

人工智能 2023年6月26日
0072
4、docker 容器保存加载和退出

1、容器保存为镜像文件 docker commit将容器提交为镜像。容器本身只是内存对象，容器关闭后，里面的内容不保存。所以，要保存容器内配置，需将容器存为镜像文件，需要的时候再加…

人工智能 2023年7月27日
0053
如何在PyTorch中保存和加载训练好的模型

介绍在机器学习领域，很常见的一个需求是将训练好的模型保存下来，以便将来进行预测或使用。在使用PyTorch框架进行模型训练时，我们可以使用torch.save()函数将训练好的模…

人工智能 2024年1月4日
0035
spyder/conda安装包报错：conda info could not be constructed. KeyError: ‘pkgs_dirs‘

打开conda，报错特征如下：报错信息打开powershell，输入conda info一通报错。 (base) PS C:\Users\Administrator> c…

人工智能 2023年7月5日
00169
5000张高清壁纸大图（手机用），用Python在法律的边缘又试探了一把

[removed][removed] [removed] $(function () { $(“#search”).click(function () { …

人工智能 2023年7月5日
0080
python实现卷积操作

前言卷积神经网络与全连接神经网络类似, 可以理解成一种变换, 这种变换一般由卷积、池化、激活函数等一系列操作组合而成. 本文就”卷积”部分稍作介绍. 卷积…

人工智能 2023年7月12日
0035
集成学习（Ensemble learning）

1.集成学习简介集成学习是通过构建并结合多个学习器来完成学习任务，这些学习器被称为” 个体学习器“，不同的个体学习器和这些个体学习器的不同的集成方式决…

人工智能 2023年6月4日
0080
go每日一题——内嵌，json.Marshal函数

以下代码输出什么？ package main import ( "encoding/json" "fmt" "time"…

人工智能 2023年6月27日
0073
深度学习之图像分类（十八）– Vision Transformer(ViT)网络详解

深度学习之图像分类（十八）Vision Transformer(ViT)网络详解目录 * – 深度学习之图像分类（十八）Vision Transformer(ViT)…

人工智能 2023年7月27日
0074
利用opencv实现图像马赛克处理的三种方法

前言：本文就图像的马赛克处理，基于opencv提出了三种解决方案，并详细地介绍了三种方法的原理、示例、问题及问题的解决方案。方法一原理介绍：利用resize()将图片先缩小，再…

人工智能 2023年6月18日
0074
论文阅读笔记：Link Prediction Based on Graph Neural Networks

文章目录说明 Abstract 1 Introduction 2 Preliminaries * Notations Latent features and explicit f…

人工智能 2023年7月16日
0081
Pytorch输出网络中间层特征可视化

Pytorch输出网络中间层特征可视化本文主要介绍了如何提取特定层的特征，然后对它进行可视化。最后给出了不同网络的应用案例。推荐一个GITHUN实现可视化的工具地址整体步骤加…

人工智能 2023年5月28日
00110
目标检测：Faster-RCNN算法细节及代码解析

** Faster-RCNN是多阶段目标检测算法RCNN系列中的集大成者，下面来看看分别看看这个系列的算法细节。代码github地址：https://github.com/che…

人工智能 2023年7月21日
0047
TensorRT(二)TensorRT使用教程（Python版）

一、前言 1.1 本文目标本文主要是宏观地阐述一下如何使用TensorRT来部署深度学习模型以实现对模型的加速，从而提高深度学习模型运行的效率，根据我自己的实测，确实可以达到官方…

人工智能 2023年7月5日
0096
（免费分享）基于springboot财务管理系统

开发工具IDEA,数据库mysql5.7 源码获取：关注文末gongzhonghao，输入006领取下载链接 package com.bjpowernode.finance.con…

人工智能 2023年6月26日
0075
论文阅读2–《融合多因素的短时交通流预测研究》

1.问题的提出现有的交通流预测研究大多为常态下的预测，而未考虑天气、节假日等外部因素的影响。 2.交通流预测相关工作（1）传统的短时交通流研究方法：卡尔曼滤波模型、历史平均模型…

人工智能 2023年5月30日
0083

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

GPU运行Tensorflow详细教程及错误解决

GPU运行Tensorflow详细教程及错误解决

大家都在看