开源中国-最新资讯 ( ) • 2024-03-27 00:24

nvitop 是一种交互式 NVIDIA 设备和进程监控工具。它有一个丰富多彩的信息界面,可以不断更新设备和进程的状态。作为资源监控器,它包含许多功能和选项,例如树视图、环境变量查看、进程过滤、进程指标监控等。除此之外,该软件包还为深度学习研究人员提供了 CUDA 设备选择工具nvisel。它还提供方便的 API,允许开发人员编写自己的监控工具。

特性:

  • 信息丰富且精美的输出:显示比nvidia-smi彩色精美方框绘图更多的信息。
  • 监控模式:可以作为资源监控器运行,而不是只打印一次结果。
    • 条形图和历史图
    • 过程排序
    • 过程过滤
    • 通过击键向进程发送信号
    • GPU 进程及其父进程的树视图屏幕
    • 环境变量屏幕
    • 帮助屏幕
    • 鼠标支持
  • 交互式:在监控模式下响应用户输入(来自键盘和/或鼠标)。(对比gpustatpy3nvml
  • 高效
    • 直接使用NVML Python 绑定查询设备状态,而不是解析nvidia-smi的输出(与nvidia-htop相比)
    • 支持稀疏查询并使用来自 cachetools 的 TTLCache 缓存结果(与gpustat相比)
    • 使用curses库显示信息,而不是用ANSI转义代码打印(与py3nvml相比)
    • 使用多线程异步收集信息并更快地响应用户输入。(与nvtop相比)
  • 便携式:适用于 Linux 和 Windows。
    • 使用跨平台库 psutil 获取主机进程信息,而不是在子进程中调用ps -p <pid>。(与nvidia-htoppy3nvml相比)
    • 用纯 Python 编写,易于使用pip安装(与nvtop相比)
  • 可集成:易于集成到其他应用程序中,不仅仅是监控。(对比nvidia-htopnvtop