Nvidia 开启GPU的持久模式
nvidia-smi -pm 1
# 不是ubuntu 18.04 这里要需要改 curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu18.04/nvidia-docker.list | tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update sudo apt-get install -y nvidia-container-toolkit
docker pull renoyuan/gpu_base:latest
docker run --gpus all -itd -p 8888:8899 --name zx_poc renoyuan/gpu_base:latest nvdia-smi
镜像仓库 ---> 有开源有公司的用于存放镜像
Docker 服务 ---> 镜像,容器管理工具
镜像---> 打包好的系统环境
容器---> 运行后的镜像实际运行的docker服务
ID --->镜像和容器都有uuid 很多时候使用ID更可靠
镜像拉取 默认是从官方仓库拉取的
docker pull renoyuan/gpu_base:latest
#登录远程仓库 docker login # 如果镜像仓库不需要登录可以忽略 #标记要上传的镜像为本地镜像 docker tag 镜像ID renoyuan/gpu_base:latest #将镜像上传到远程仓库 docker push renoyuan/gpu_base:latest
启动镜像 == 生成容器实例
顺序一定不能错
顺序一定不能错
顺序一定不能错
docker run [OPTIONS] IMAGE [COMMAND] [ARG...] # **顺序一定不能错** IMAGE 一定是在参数后面命令前面 docker run --gpus all -itd -p 8888:8899 --name zx_poc renoyuan/gpu_base:latest nvdia-smi # 参数 -i: 交互式操作。 -t: 终端。 -d: 后台运行 -p 端口映射 宿主机:容器 -v 资源映射 宿主机目录:容器目录 --name:容器名字 renoyuan/gpu_base:latest 镜像。 nvdia-smi :放在镜像名后的是命令
在使用 -d 参数时,容器启动后会进入后台。此时想要进入容器,可以通过以下指令进入:
docker attach <容器 ID>
docker exec <容器 ID>:推荐使用 docker exec 命令,因为此命令会退出容器终端,但不会导致容器的停止。
exit
docker stop uuid|name
docker start uuid|name
docker restar uuid|name
docker rm uuid 删除多个可以用空格隔开 -f:表示强制删除
docker cp 文件路径 容器id:容器路径
docker cp 容器id:容器路径 文件路径
docker ps -a # 查看容器
docker images # 查看镜像
docker commit [OPTIONS] CONTAINER [REPOSITORY[:TAG]] sudo docker commit -a "renoyuan" -m "gpu_base" 8462b4eb4157 gpu_base:v0 Option 功能 -a 指定新镜像作者 -c 使用 Dockerfile 指令来创建镜像 -m 提交生成镜像的说明信息 -p 在 commit 时,将容器暂停
cat gpu_base.tar.gz | docker import - gpu_base:v0(镜像名自己定义)
我们有了本地的镜像文件,在需要的时候可以使用docker load将本地保存的镜像再次导入docker中。
docker load --input gpu_base.tar | docker load < gpu_base.tar
docker save -o gpu_base.tar gpu_base
-o:指定保存的镜像的名字;gpu_base.tar:保存到本地的镜像名称;gpu_base:镜像名字,通过"docker images"查看
这样将导出容器快照到本地文件。
docker export 1e560fca3906 > gpu_base.tar.gz
运行docker 运行脚本文件 带有一定规范可以不
# 指定Python环境 FROM docker pull nvidia/cuda:11.0.3-runtime-ubuntu18.04 # 拷贝Python依赖库requirements文件到当前目录下 ADD requirements.txt / # 安装依赖库 RUN pip install -r /requirements.txt # 拷贝所有文件到app目录下 ADD . /app # 指定app为工作目录 WORKDIR /app # 声明端口 EXPOSE 5000 # docker容器启动 CMD [ "python" , "app.py"]
docker build -t python_gpu . docker build -t zxpoc . # Sending build context to Docker daemon 911.9MB 构建镜像中
一、安装docker
1、安装docker:sudo apt-get install -y docker.io
2、启动docker服务:systemctl start docker
3、设置开机启动:systemctl enable docker
4、查看docker状态:systemctl status docker
5、停止docker服务:systemctl stop docker
6、查看docker版本:docker version
二、非root用户运行docker
1、添加docker用户组:sudo groupadd docker
执行以上命令会提示已存在,原因是在安装docker时已自动创建。
2、将指定用户添加到用户组(username为你的用户名):sudo gpasswd -a username docker
3、查看是否添加成功:cat /etc/group | grep ^docker
3、重启docker:sudo systemctl restart docker
5、更新用户组:newgrp docker
6、执行docker命令,比如:docker ps -a