nvtop:当 nvidia-smi 不够直观时,这个开源 GPU 监视器给了一个 htop 风格的答案
nvtop 是一个基于 ncurses 的开源 GPU 任务监视器,为 NVIDIA/AMD/Intel 多厂商 GPU 提供 htop 风格的交互式 TUI 界面。实时显示 GPU 利用率、显存占用、温度、功耗和进程列表,支持键盘排序、筛选和终止进程。适合深度学习训练监控、多 GPU 服务器管理和 GPU 应用调优。
一句话简介
nvtop 是一个基于 ncurses 的开源 GPU 任务监视器,支持 NVIDIA/AMD/Intel 三大厂商 GPU,提供 htop 风格的交互式 TUI。实时显示 GPU 利用率、显存、温度、功耗和进程列表,支持键盘排序、筛选和终止进程。适合深度学习训练监控、多 GPU 服务器管理。
GitHub:github.com/Syllo/nvtop
核心亮点
- 🖥️ htop 风格交互界面:实时彩色柱状图和进程表格,方向键选择、F9 终止进程
- 🔌 NVIDIA + AMD + Intel 三厂支持:同一界面同时显示不同厂商 GPU 状态
- 📊 进程级 GPU 占用明细:PID、用户、利用率、显存占用量一目了然
- ⚙️ 键盘全操作:排序、筛选、终止进程全快捷键,适合 SSH 远程管理
- 📝 配置文件驱动:颜色、刷新率通过 nvtop.conf 控制,多机器间可复制
功能详解
多厂商 GPU 统一视图
NVIDIA 通过 NVML 获取最全指标,AMD 依赖 rocm-smi(利用率/显存/温度),Intel 依赖 intel-gpu-tools。在同一屏幕上同时查看不同厂商 GPU——nvidia-smi 做不到。
进程级资源追踪
实时显存柱状图直观展示每个进程的占用。选中进程按快捷键直接 kill,不需要切终端。深度学习实验卡住了→定位显存最高进程→一键终止,3 秒搞定。
自定义配置
配置文件 ~/.config/nvtop/nvtop.conf,可调 GPU 选择(-d)、刷新延迟(-i)、颜色主题等。命令行和配置文件叠加使用。
轻量级资源占用
C + ncurses 构建,无 Electron 套壳。监控 8 块 GPU 时 CPU 占用通常低于 1%。
安装/使用教程
Debian/Ubuntu
sudo apt update && sudo apt install nvtop
Fedora
sudo dnf install nvtop
Arch Linux
sudo pacman -S nvtop
从源码编译
git clone https://github.com/Syllo/nvtop.git
cd nvtop && mkdir build && cd build
cmake .. -DNVIDIA_SUPPORT=ON -DAMD_SUPPORT=ON -DINTEL_SUPPORT=ON
make && sudo make install
环境依赖
AMD GPU 需 rocm-smi,Intel GPU 需 intel-gpu-tools。某些系统需 sudo 权限。
适用场景
- 深度学习训练监控:PyTorch/TensorFlow 训练时实时看 GPU 利用率,识别 CPU/IO 瓶颈
- 多 GPU 服务器管理:管理员一目了然谁在用哪些 GPU、谁占用过多显存
- GPU 程序调试:CUDA/ROCm 开发时观察利用率和显存曲线
- 游戏与图形应用调优:Linux 游戏/3D 渲染时监控 GPU 温度和帧缓冲
- Docker 容器 GPU 监控:宿主机上即可看到容器内进程的 GPU 使用情况
类似工具对比
| 维度 | nvtop | nvidia-smi | radeontop | gpustat |
|---|---|---|---|---|
| 价格 | 免费开源 | 免费(驱动自带) | 免费开源 | 免费开源 |
| 支持 GPU | NVIDIA/AMD/Intel | 仅 NVIDIA | 仅 AMD | 仅 NVIDIA |
| 界面 | 交互式 TUI | 静态文本 | TUI | 单行文本 |
| 进程管理 | ✅ 排序/筛选/终止 | ✅ 列表 | ❌ | ❌ |
| 持久化 | ✅ 实时刷新 | ❌ 需循环调用 | ✅ 实时 | ✅ watch 配合 |
| AMD 支持 | 中 | N/A | 中 | N/A |
| 适用 | 日常监控+交互 | 脚本+精确查询 | AMD 专用 | 快速概览 |
常见问题 FAQ
Q: nvtop 和 nvidia-smi 用哪个?
不冲突。日常盯着用 nvtop(实时/直观/可交互),写脚本用 nvidia-smi(格式稳定/可解析)。单机单卡 nvidia-smi 可能够了,多台多卡 nvtop 体验更好。
Q: AMD/Intel GPU 支持怎么样?
不如 NVIDIA 全面。NVIDIA 通过 NVML 可显示全套指标,AMD/Intel 依赖各自工具包,通常利用率/显存/温度没问题,功耗和风扇转速可能不可用。
Q: Docker 容器里能用吗?
宿主机运行 nvtop 就能看到容器进程的 GPU 使用情况。容器内运行需 --gpus all 并挂载相关库。
Q: 性能开销大吗?
很小。C + ncurses,监控 8 块 GPU 时 CPU 低于 1%。刷新间隔建议 500-1000ms,太低可能让 SSH 卡顿。
Q: 能远程监控吗?
nvtop 本身不支持远程。但 SSH 到服务器运行 nvtop 就是"远程监控"——TUI 的优势就在这。
相关推荐
- Elmer FEM:开源多物理场仿真引擎 — FEM 重度依赖 GPU 加速
- JDiskReport:数据存储审计利器 — 训练数据集存储管理
- Fossil SCM:全栈式版本控制 — DL 项目代码和大文件版本管理
推荐资源
KCleaner:端侧 AI 开发环境的高效系统清理器,KDE Plasma 桌面维护必备利器
端侧 AI 开发往往涉及海量模型缓存、临时数据集和构建中间文件,Linux 桌面环境极易被"撑爆"。KCleaner 专为 KDE Plasma 设计,一键清理缓存、旧内核和包管理器残留,让你的 AI 开发工作站保持最佳性能。
Wallch:AIGC时代,动态壁纸如何成为桌面数字孪生的情感界面 🌌
2026年AIGC与多模态AI正在重塑人机交互的每个触点——桌面背景从静态图片演变为动态信息界面。Wallch 是 Linux 桌面美化史上的经典开源壁纸更换器,以 Live Earth 实时地球壁纸、Wikipedia 每日精选图片和桌面时钟渲染为核心特色,在数字孪生理念渗透桌面体验的今天,它开创性地将"动态信息流"引入了桌面美学。
Sozi:当 AIGC 遇上无限画布,这款开源 SVG 工具重新定义视觉叙事 🎨
2026年 AI 图像生成工具爆发式增长,AIGC 批量输出高质量 SVG 矢量资产。Sozi 作为基于 SVG 的开源缩放演示编辑器,将 AI 生成内容与人类叙事完美衔接,以无限画布上的非线性过渡重新定义演示美学。
Variety 开源桌面壁纸工具:端侧AI赋能 Linux 桌面美学,打造边缘计算时代的个性化数字孪生
2026年边缘计算与端侧AI全面落地,桌面个性化从纯美学升级为生产力入口。Variety 作为 Linux 最强大的开源壁纸自动更换工具,通过多源壁纸聚合和脚本扩展能力,在 AI 驱动的工作环境中为开发者打造动态、智能的桌面数字孪生。
Worker:当 Midnight Commander 不够强时,这个双面板文件管理器把配置做到了极致
Worker 是一款适用于 X11 环境的高度可配置双面板文件管理器。其核心特点是将几乎所有行为——快捷键、鼠标操作、文件关联、右键菜单、自定义按钮——全部开放为可编辑的文本配置文件。内建 Actions 系统支持绑定外部脚本(Shell/Python/Perl),实现一键批量重命名、格式转换、打包解压等复杂操作。适合追求效率和深度定制的 Linux/Unix 高级用户。
JDiskReport:边缘计算时代的数据存储审计利器 📊
2026年边缘计算设备呈指数级增长,分布式存储节点的空间管理从"运维小事"升级为"数据主权合规要件"。JDiskReport 跨平台开源硬盘分析工具,以多维图表直观展示存储分布,支持网络驱动器扫描和报告导出,为边缘端数据审计提供轻量高效的技术支撑。
Panda3D:AI 驱动的开源 3D 引擎,从具身智能仿真到数字孪生一站搞定
具身智能和数字孪生是 2026 年最热的技术方向之一。Panda3D 作为迪士尼出品、Python 优先的开源 3D 引擎,正成为 AI 机器人仿真、科学可视化和游戏开发的理想平台。
Typora:所见即所得的 Markdown 写作体验,为什么这个付费编辑器依然没有对手
Typora 是一款将 Markdown 语法与富文本体验深度融合的所见即所得编辑器,支持 macOS/Windows/Linux。它摒弃传统双栏模式,输入语法即实时渲染为最终排版,同时内置 LaTeX 数学公式渲染、Mermaid 图表绘制、Pandoc 多格式导出和 PicGo 图床自动上传。适合学术写作、技术文档、博客创作和日常笔记。
SolveSpace 轻量级参数化 CAD:开源数字孪生引擎,用约束求解驱动具身智能硬件原型设计
2026年具身智能与数字孪生技术深度耦合,参数化建模成为机器人硬件原型迭代的核心能力。SolveSpace 以不到 10MB 的体积提供专业级几何约束求解器,完美适配端侧开发环境和快速原型验证需求。
Autopsy 开源数字取证平台:AI 安全时代的多模态数据分析利器,零成本攻克电子取证难题
2026 年,AI 大模型推动的安全威胁持续升级,多模态数据分析成为数字取证的核心挑战。Autopsy 作为全球最流行的开源数字取证平台,以零成本提供专业级文件系统分析、时间线重建和哈希检测能力,是安全研究者和企业安全团队的必备利器。
💬 评论