0
点赞
收藏
分享

微信扫一扫

【技巧】实时监控GPU运行状态



如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~

目录

方法一:nvidia-smi

方法二:nvtop

方法三:nvitop

方法一:nvidia-smi

        GPU统计数据以滚动方式显示,每个采样间隔一行。可以根据终端窗口的宽度调整要监控的指标。最多只能监控4个设备。如果没有指定设备,则使用自然枚举(从GPU索引0开始)最多支持4个设备进行监视。它支持Tesla, GRID, Quadro和有限的GeForce产品,用于开普勒或x64和ppc64裸机Linux下的更新gpu。注意:在启用mig的gpu上,目前不支持查询编码器、解码器、jpeg、ofa、gpu和内存的利用率。

运行命令:

nvidia-smi dmon

【技巧】实时监控GPU运行状态_Linux

方法二:nvtop

推荐!

    Nvtop 是一款类似于 htop 的工具,可以实时监控 GPU 的多项性能指标,包括温度、显存使用、GPU 使用率等,带有动态图形化界面。

安装命令:

sudo apt install nvtop

运行命令:

nvtop

【技巧】实时监控GPU运行状态_状态_02

方法三:nvitop

   nvitop 是另一个基于命令行但支持可视化的工具,类似 nvtop,但提供更多数据支持。

安装命令:

pip install nvitop

运行命令:

nvitop

【技巧】实时监控GPU运行状态_状态_03

举报

相关推荐

0 条评论