NVIDIA GPU 显存释放
当我们使用 Nvidia GPU 训练深度学习模型时,特别是使用分布式多 GPU 时,因认为的终端程序,导致子线程(其实是子进程加载数据等)无法关闭,使得 GPU 显存一直占用,但是使用 nvidia-smi
却无法显示进程名等信息。本篇介绍如何彻底恢复 GPU 显存。
释放显存方案
通过找到真正占用显存的进程,然后杀死进程后达到是否显存。
1 | # 指定第 0 号 GPU 进程占用 |
参考文献
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 J. Xu!
评论