基于docker搭建conda深度学习环境（支持GPU加速）

2023年9月8日下午12:50 • Python • 阅读 45

前言

在Ubuntu系统，创建一个docker，然后搭建conda深度学习环境，这样可以用conda或pip安装相关的依赖库了。

一、创建一个docker

为了方便开发，在Docker Hub官方中选择一个合适的conda docker镜像，然后下载到本地。

我选择了”docker-anaconda”，地址是：Docker Hub

下载命令如下：

docker pull continuumio/anaconda3

二、进入docker

通常使用 docker run 命令进入docker镜像，例如：

docker run -i -t continuumio/anaconda3 /bin/bash

其中 -i: 以交互模式运行容器，通常与 -t 同时使用；

2.1 映射目录

平常进入了docker环境，然后创建或产生的文件，在退出docker环境后会”自动销毁”；或者想运行本地主机的某个程序，发现在docker环境中找不到。

我们可以通过映射目录的方式，把本地主机的某个目录，映射到docker环境中，这样产生的文件会保留在本地主机中。

比如：

docker run -i -t continuumio/anaconda3 -v /home/xxx/xxx/:/home/xxxx:rw /bin/bash

通过-v 把本地主机目录 /home/xxx/xxx/ 映射到docker环境中的/home/xxxx 目录；其权限是rw，即能读能写。

2.2 支持GPU

默认是不把GPU加入到docker环境中的，但可以通过参数设置：

--gpus all

但我发现，这样有时不能在docker里正常使用GPU；可以使用如下参数，在Pytorch中亲测有效。

--gpus all  -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all

举个例子：

docker run -i -t continuumio/anaconda3 --gpus all  -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all /bin/bash

2.3 设置内存

默认分配很小的内参，在训练模型时不够用，可以通过参数设置：

--shm-size xxG

比如，我电脑有32G内参，想放16G到docker中使用，设置为 –shm-size 16G，即：

docker run -i -t continuumio/anaconda3  --shm-size 16G /bin/bash

2.4 综合版本

结合映射目录、支持GPU、设置内存，打开docker的命令如下：

docker run -i -t  -v /home/disk1/guopu/:/home/guopu:rw --gpus all --shm-size 16G -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all continuumio/anaconda3  /bin/bash

详细的参数解析如下

-a stdin: 指定标准输入输出内容类型，可选 STDIN/STDOUT/STDERR 三项；
-d: 后台运行容器，并返回容器ID；
-i: 以交互模式运行容器，通常与 -t 同时使用；
-P: 随机端口映射，容器内部端口随机映射到主机的端口
-p: 指定端口映射，格式为：主机(宿主)端口:容器端口
-t: 为容器重新分配一个伪输入终端，通常与 -i 同时使用；
–name=”nginx-lb”: 为容器指定一个名称；
–dns 8.8.8.8: 指定容器使用的DNS服务器，默认和宿主一致；
–dns-search example.com: 指定容器DNS搜索域名，默认和宿主一致；
-h “mars”: 指定容器的hostname；
-e username=”ritchie”: 设置环境变量；
–env-file=[]: 从指定文件读入环境变量；
–cpuset=”0-2″ or –cpuset=”0,1,2″: 绑定容器到指定CPU运行；
-m :设置容器使用内存最大值；
–net=”bridge”: 指定容器的网络连接类型，支持 bridge/host/none/container: 四种类型；
–link=[]: 添加链接到另一个容器；
–expose=[]: 开放一个端口或一组端口；
–volume , -v:绑定一个卷

三、检验docker

进入docker中，首先查看一下GPU，用nvidia-smi命令。正常显示CUDA版本，正常加载了显卡（这里是两张1080ti）。

使用两张显卡训练YOLOv5时，显示正常；

四、进入已打开的docker

思路：首先使用docker ps 查询正在运行docker的ID，然后使用docker exec 命令进入。

命令如下：

$ sudo docker ps
$ sudo docker exec -it docker_ID /bin/bash

其中docker_ID，是使用docker ps查询正在运行docker的ID，比如是fe8984f24b79。

参考文献

Docker run 命令 | 菜鸟教程

怎么在docker中使用nvidia显卡 – 思念殇千寻 – 博客园

关于挂载的本地目录在容器中没有执行权限的问题

本文只供大家参考与学习，谢谢。

Original: https://blog.csdn.net/qq_41204464/article/details/121635600
Author: 一颗小树x
Title: 基于docker搭建conda深度学习环境（支持GPU加速）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/771252/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Django开发过程中，MySQL数据库的创建和连接

如何为Django项目创建和配置Mysql数据库操作系统：linux ubuntu20.04IDE: pycharm 1. 终端连接到mysql，在mysql中为项目创建对应的数…

Python 2023年8月4日
0042
Pytest单元测试框架之POM模型浅谈

一、什么是POM？ POM（Page Object Model）中文字母意思是，页面对象模型，POM是一种最近几年非常流行的自动化测试模型，或者思想，POM不是一个框架，就是一个解…

Python 2023年9月9日
0054
RLHF：基于人类反馈（Human Feedback）对语言模型进行强化学习【Reinforcement Learning from Human Feedback】

笔者读过之后，觉得讲解的还是蛮清晰的，因此提炼了一下核心脉络，希望给对ChatGPT技术原理感兴趣的小伙伴带来帮助。但其实这种生成模型很难训练。以语言模型为例，大多是采用&#82…

Python 2023年11月4日
0062
数据结构、算法及应用

《数据结构、算法及应用》主编张宪超软国同学在水(sha)深(dou)火(mei)热(xue)的大一之后，忽然在大二下班学期迎来了数据结构课。这个据说把软件的同学都虐的不轻的课竟…

Python 2023年6月6日
0040
《Python笔记》安装(pip)第三方包报错

目录 * – Python版本 – 报错信息 – + pip 安装numpy报错 + pip 安装 scipy报错 + pip 安装 pywin…

Python 2023年8月24日
0028
Lesson 2.矩阵运算基础、矩阵求导与最小二乘法

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年8月27日
0046
Python数据分析–Numpy常用函数介绍(3)

摘要：先汇总相关股票价格，然后有选择地对其分类，再计算移动均线、布林线等。一、汇总数据汇总整个交易周中从周一到周五的所有数据（包括日期、开盘价、最高价、最低价、收盘价，成交量等…

Python 2023年11月2日
0033
用【Python】写了一个水果忍者小游戏，玩过之后爱不释手

前言水果忍者到家都玩过吧，但是Python写的水果忍者你肯定没有玩过。今天就给你表演一个新的，用Python写一个水果忍者。水果忍者的玩法很简单，尽可能的切开抛出的水果就行。 …

Python 2023年9月18日
0039
生产中遇到的Spring项目Bean的多次加载问题

问题现象最近在本地调试公司的一个Web项目时，无意中发现日志中出现了两次同一个服务的init记录，项目都是基于Spring来搭建的，按理说服务都是单例的，应该只有一次服务加载日志…

Python 2023年10月18日
0044
lost castle Game 无限 EW

下载鼠标连点器。 pyHook-1.5.1-cp37-cp37m-win_amd64 PyUserInput-master from pymouse import PyMouse…

Python 2023年9月25日
0052
数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（3）

文章目录 * – 1.读取本的数据集 – 2.查看数据的前5行 – 3.将salary列的数据转换为最大值和最小值的平均值 – 4….

Python 2023年8月6日
0062
python 网络音乐播放器（二）：tkinter 实现歌词同步滚动

问题在我用 tkinter 做网络音乐播放器时，想实现滚动歌词的效果。如下图所示： ; 解决方案我们采用 tkinter 的 Listbox 来实现滚动歌词效果。 lrc_li…

Python 2023年9月24日
0045
电商系统中购物车功能设计实现

1、业务需求分析无论用户是否处于登录状态，都可以把商品添加到购物车中，并操作购物车中的商品。没登录的情况下，可以先选择想要的商品到购物车中，当登录之后，直接把之前没登录的购物车的…

Python 2023年8月6日
0043
项目场景： gyp verb check python checking for Python executable python2 in the PATH

node v16.15.0 npm 8.5.5 npm install 报错 gyp verb check python checking for Python execu…

Python 2023年8月1日
0045
matplotlib 笔记：饼图 & 嵌套饼图

1 饼图基本使用方法：plt.pie(x) x=[109,101,94,117] plt.figure(figsize=(8,8)) label=[‘魏’,’蜀’,’吴’,’群’…

Python 2023年9月1日
0074
使用Python实现多线程、多进程、异步IO的socket通信

主要记录使用Python实现多线程、多进程、异步IO的socket通信的代码。多线程实现socket通信服务器端代码 import socket import threading…

Python 2023年10月30日
0026

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31