Skip to content

服务器使用流程

连接计算服务器-> 在计算服务器上配置 docker -> 在计算服务器挂载存储服务器 -> 在 docker 中运行代码

VISION 服务器使用方法 (旧平台)

VISION 服务器使用情况 (登记表)

新平台简明使用手册

Pycharm 对于实验室设备来说并不好用,踩了很多坑还是换回了 VScode

以 VScode 为例,通过在个人文件路径下设置 config 来完成(需要修改实际地址,用户,以及端口号)

在校外就使用直连完成,如果使用 easy connect 就需要使用跳板机

参考文件格式

完毕后就可以在终端中快速启动 SSH 服务器的终端

如果已经创建了 docker 就需在容器内部启动 SSH 服务,在本机进行远程连接

内层安装包:

Terminal window
apt install openssh-server
apt install openssh-client
apt install nano
apt install tmux
nano /etc/ssh/sshd_config

在配置文件中需要修改两个地方

Port 2222 # 防止端口冲突,随便选择一个
PermitRootLogin yes # 允许 root 登陆

另外需要修改 root 的密码,输入一下指令

Terminal window
passwd

配置完毕后,重启 SSH 服务

Terminal window
service ssh restart

就可以在本地直接通过 SSH 访问容器内部,注意 ip 是宿主机的 ip(因为启动时候选择了 host 选项)

Terminal window
ssh root@xxx.xxx.xxx.xxx -p 2222

有时候会出现问题,是更换 image 产生的

Terminal window
ssh-keygen -R '[192.168.1.244]:2025'

对于计算服务器,并没有权限直接访问 share 文件夹

可以借助于 docker 服务器中转操作

参考以下命令

Terminal window
docker commit xxx(容器名) yun.nju.edu.cn:5000/xxx(个人用户名)/pytorch:1.8.x-cuda11.x-cudnnx-devel
docker push yun.nju.edu.cn:5000/yangsh/base:pytorch-2.5.1-cuda12.4
docker commit yangsh yun.nju.edu.cn:5000/yangsh/base:pytorch-2.5.1-cuda12.4

首先在服务器上登陆

Terminal window
docker login yun.nju.edu.cn:5000
Terminal window
curl -s http://yun.nju.edu.cn:5000/v2/_catalog | grep "yangsh/"
curl http://yun.nju.edu.cn:5000/v2/yangsh/pytorch/tags/list
# tag
pytorch-2.5.1-cuda12.4-compressai-1.2.6

或者直接通过 网址

常见操作

Terminal window
# 创建会话
tmux new -s train
# 重新链接
tmux a -t train
# 列出所有会话
tmux ls

离开会话(后台保留)

Ctrl + b d

滚动模式 Ctrl + b [ 退出 q

这里列出了成功运行以后,最常用的几个命令,供快速查询

Terminal window
# 多行命令 (base 镜像)
docker run --gpus all --shm-size=8g --rm \
-e NVIDIA_DRIVER_CAPABILITIES=compute,utility,video \
--mount type=bind,source=/gpfs3/area1/shared/vimeo_long_new,target=/gpfs/shared/vimeo_long_new \
--mount type=bind,source=/gpfs3/area1/shared/PrePost,target=/gpfs/shared/PrePost \
--mount type=bind,source=/gpfs3/area1/yangsh,target=/gpfs/yangsh \
-dit --net=host --cap-add SYS_ADMIN --privileged \
--name yangsh \
yun.nju.edu.cn:5000/yangsh/pytorch:prepost-2.6.0-cuda12.4-py3.12 \
bash
# compressai
docker run --gpus all --shm-size=8g --rm \
-e NVIDIA_DRIVER_CAPABILITIES=compute,utility,video \
--mount type=bind,source=/gpfs3/area1/yangsh,target=/gpfs/yangsh \
-dit --net=host --cap-add SYS_ADMIN --privileged \
--name yangsh \
yun.nju.edu.cn:5000/yangsh/pytorch:multirag-doc-2.5.1-cuda12.4-py3.11 \
bash
# 进入容器
docker exec -it yangsh bash
# 重启 ssh 服务
service ssh restart

在本机上可能需要进行:

Terminal window
ssh-keygen -R '[192.168.1.244]:2025'

Docker Hub 使用

Terminal window
docker commit yangsh yun.nju.edu.cn:5000/yangsh/pytorch:prepost-2.6.0-cuda12.4-py3.12
# yun.nju.edu.cn:5000/base:pytorch-2.5.1-cuda12.4-compressai-1.2.6
docker push yun.nju.edu.cn:5000/yangsh/pytorch:prepost-2.6.0-cuda12.4-py3.12