摩尔线程数据中心GPU管理器(MTDCGM)是一套用于在集群环境中管理和监控mthreads数据中心GPU的工具。它包括主动健康监控、全面的诊断、系统警报等功能。基础设施团队可以单独使用它,并且它能够轻松地与mthreads合作伙伴提供的集群管理工具、资源调度和监控产品集成。
摩尔线程数据中心GPU管理器(MTDCGM)是一套用于在集群环境中管理和监控mthreads数据中心GPU的工具。它包括主动健康监控、全面的诊断、系统警报等功能。基础设施团队可以单独使用它,并且它能够轻松地与mthreads合作伙伴提供的集群管理工具、资源调度和监控产品集成。
MTDCGM简化了数据中心中的GPU管理,提高了资源的可靠性和正常运行时间,自动化了管理任务,并有助于提升整体基础设施的效率。DCGM支持在x86_64平台上的Linux操作系统。安装包中包含了库、二进制文件、验证套件(MTVS),以及使用API(C、Python和Go)的源代码示例。 摩尔线程数据中心数据中心GPU管理器(MTDCGM)包含了数据中心GPU管理接口(DCGMI)作为命令行工具,这是一款设计用于在数据中心环境中管理和监控GPU资源的软件。DCGMI为管理员提供了广泛的数据中心GPU状态信息,包括利用率、温度、功耗等,帮助他们有效地监控和管理GPU资源。
摩尔线程数据中心GPU管理套件(MT DCGM)包含了数据中心GPU管理接口(DCGMI)作为命令行工具,这是一款设计用于在数据中心环境中管理和监控GPU资源的软件。为管理员提供了广泛的数据中心GPU状态信息,包括利用率、温度、功耗等,帮助他们有效地监控和管理GPU资源。