windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程

1. 如何彻底的卸载anaconda(包括配置文件)

  1. 安装 Anaconda-Clean package
    打开 Anaconda Prompt, 输入如下命令:
conda install anaconda-clean
  1. 输入如下命令卸载
anaconda-clean --yes
  1. 直接运行安装目录下的 Uninstall-Anaconda3.exe 即可。

2. windows10下CUDA11.1、cuDNN11.1、tensorflow-gpu2.4.1安装教程

2.1. 版本逻辑链tensorflowgpu版本—>cuda版本—>cudnn版本

  1. 看了其他人好多博客,总结下来一个核心问题是要求 版本对应,发现大家都是这样教的,以这样一个顺序来建立版本对应关系, 显卡型号—>cuda版本—>cudnn版本—>tensorflowgpu版本
    但是安装完后,还是有一些dll文件找不到。
  2. 应该 先看tensorflowgpu版本,再找到兼容的cuda版本到cudnn。pip或conda安装一定是最新的(当然你离线下载旧的whl用当我没说),可最新的tensorflow和稍旧点的CUDA、cuDNN匹配时就很容易出问题。
  3. 最后就是由于你的tensorflow是安最新的,所以CUDA也安最新并支持你的显卡的,只要不是太太太太老旧都会支持的,然后找相应这个CUDA的cuDNN。

    参考别人的链接:

  4. cudnn-11.1-windows-x64-v8.0.4.30
    链接:https://pan.baidu.com/s/1aqedvmiMXANVQqV5NPm7Yw
    提取码:3ccj
  5. cuda_11.1.0_456.43_win10
    链接:https://pan.baidu.com/s/1KnhrYxptLQohVQ5Atql4sA
    提取码:1td5

2.2 CUDA安装

最好先自己更新一下显卡驱动,这样就不用CUDA的显卡驱动了

  1. 执行cuda.exe
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  2. 不要改路径就默认
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  3. 点”自定义”安装
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  4. 注意

  5. 不点C U D A → V S \color{red}CUDA \rightarrow VS C U D A →V S那个选项。

  6. 取消勾选D r i v e r c o m o n e n t s \color{red}Driver comonents Dr i v erco m o n e n t s,D i s p l a y D r i v e r \color{red}Display\;Driver D i s pl a y Dr i v er这一行,前面显示的是Cuda本身包含的驱动版本是411.31。

    如果你电脑目前安装的驱动版本号新于Cuda本身自带的驱动版本号,那一定要把这个勾去掉。否则会安装失败(相同的话,就不用去取勾了)。

    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  7. 安装位置默认,大约要10G空间

  8. 完成后关闭,这两项不用管,不用点
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程

; 2.3 配置环境变量

电脑——>属性——>高级系统设置——>环境变量
在系统变量里多了这两项

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  1. 但是这还不够,我们还需要再添加 五个系统变量(根据实际安装版本和路径添加,一样版本和默认路径的可直接复制粘贴)前面是变量名字后面是路径:
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64

CUDA_BIN_PATH = %CUDA_PATH%\bin

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
2.在 系统变量Path里添加变量,双击Path添加如下变量(同样根据实际路径填)
%CUDA_LIB_PATH%

%CUDA_BIN_PATH%

%CUDA_SDK_LIB_PATH%

%CUDA_SDK_BIN_PATH%

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\lib\x64

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1\common\lib\x64

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1\bin\win64

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
3. 点完三个确定就ok了
4. 多版本cuda问题
由于我安了三个版本的cuda,CUDA文件夹下有三个版本,它们可以兼容安装。
windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
由于安装的了旧的版本cuda后有问题,所以你想安装新的cuda,安装后,需要把旧版本的环境变量其中包括CUDA_PATH更改为新版本的环境变量,比如把之前的9.0全改为11.1,然后PATH里的把新版本的放到旧版本的上面。并且,NVCUDASAMPLES_ROOT改成CUDA11.1(即新版本)的路径。

最后你可以到cmd中输入nvcc –version来查看是否更改过来,这个命令之所以可用就是因为你已经配置了环境变量。

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  1. 检查是否成功
    在cmd中,切换到这个目录下执行两个exe
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\extras\demo_suite

分别 运行

bandwidthTest.exe
deviceQuery.exe

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程

2.4 CUDNN安装

解压程序包并打开它,会出现一个如下所示的目录。

[En]

Unpack the package and open it, and a directory like this appears.

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
之后全选复制到你的CUDA目录下,(有时得复制两次)以管理员身份:

目录为:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\V11.1

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程

复制过去这便完成了,注意的是cudnn与cuda的版本对应

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程

比如这个显然这个cudnn版本是8.0,对应的是cuda11.1,以及windows系统。cudnn自己的版本可以随便,但对应11.1这个是必须要求的。

; 2.5 tensorflow-gpu2.0安装

安这些最好先安好anaconda便于管理

  1. 打开 Anaconda Prompt
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  2. 在命令窗口输入命令创建环境
    我的是python3.8,你可以自己看自己的python版本
conda create -n tf-gpu python=3.8

这里如果出现了HTTP000或404啥的错误就是得把conda的源改为国内源的问题
解决方法:进入到这个目录下C:\Users\26503下,26503是我的名字,你进入你自己的目录下便好找到一个叫.condarc的文件用记事本打开,换成下面的内容便好:

channels:
  - http:
  - http:
  - http:
  - http:
  - http:
show_channel_urls: true
ssl_verify: false
  1. 指令 \color{red}指令指令
  2. conda create 命令创建虚拟环境
conda create --name tensorflow python==3.8
  1. 命令中的 tensorflow 是你新创建的环境的名字,你也可以改成其他名字例如 tf2,new_env 等等。
  2. 根据官网的指示,使用 tensorflow2 的 python 版本应当大于 3.5
  3. 如果使用 python 3.8,那么 Tensorflow 版本要大于 2.2
  4. 退出当前虚拟环境
conda deactivate
  • 查看所有环境
conda info --envs
  • 删除环境
conda remove --name tensorflow --all
  1. 激活tf-gpu环境,进行安装
activate tf-gpu
  1. pip安装
pip install --ignore-installed --upgrade tensorflow==2.5.0 --user
  1. tensorflow==2.4.1 对应的keras版本是2.4.3。如果需要安装keras: pip install keras==2.4.3 --user
  2. tensorflow==2.5.0 对应的tensorflow_probability版本是 tensorflow_probability==0.13.0 最后出现:
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  3. 验证
  4. 输入 python
  5. 输入 import tensorflow as tf
  6. 输入 tf.__version__查看版本
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
    输入 tf.test.is_gpu_available()查看tensorflow-gpu是否可用
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
    返回了True从便证明可用

2.6 pycharm配置

由于之前已经配置过cpu版的tensorflow,现在只是重新加载新的python解释器
File ->Settings

windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
  • 点向下的小三角,再show all,点加号添加
  • 由于我pycharm是用的conda环境解释的,点conda environment,然后点下面的existing environment,
  • 再选择anaconda下的envs的tf-gpu中的python,最后apply但完成了。

; 3. 安装torch和检查

  1. 进入Pytorch官方网站
    windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程
    根据自己的python版本和电脑配置选择安装版本,即输入:
pip3 install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio===0.9.0 -f https:
  1. 检查
  2. 首先在终端敲一下:
python3
  1. 进入python命令行后,执行以下命令。如果不报错就说明安装成功了。
import torch
x = torch.empty(5, 3)
print(x)

如果报告错误,十有八九是环境变量配置不正确。

[En]

If you report an error, nine times out of ten, the environment variable is not configured properly.

常见错误

  1. 运行时出现
PyTorch AttributeError: module 'torch._C' has no attribute '_cuda_setDevice'

解决方法:

  • 进入环境,然后进入python
  • import torch
  • torch.cuda.is_available()

    检测自己的的cuda是否可用,也就是GPU版本是否存在,(严谨的说应该是检测GPU版本是否安装成功)。

  • 要么下载GPU版本,要么在你执行代码时加上将GPU设置成-1。 torch.cuda.set_device(-1)

    如果你用命令行执行python文件,那么在最后加上 python train.py --你的GPU的设置对应形参 -1
    你的GPU设置对应形参,是你的Python文件中应该会有一个arg是用来设置要使用GPU的编号的,与1同理。

参考:

  1. windows10下CUDA11.1、cuDNN8.0、tensorflow-gpu2.4.1安装教程以及问题解决方法
  2. 清华大学开源软件镜像站

Original: https://blog.csdn.net/huang1024rui/article/details/118751189
Author: Paul-Huang
Title: windows10下CUDA11.1、CUDNN11.1、tensorflow-gpu 2.4.1和torch安装教程

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/514808/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球