节点监控¶
通过节点监控,你可以概览所选集群下节点的当前健康状态、对应容器组的异常数量; 在当前节点详情页,你可以查看正在告警的数量以及 CPU、内存、磁盘等资源消耗的变化趋势图。
前提条件¶
集群中已安装 insight-agent 且应用处于 运行中 状态。
操作步骤¶
-
进入 可观测性 产品模块。
-
在左边导航栏选择 基础设施 -> 节点。在该页面可查看以下信息:
- 集群切换 :切换顶部的下拉框可切换集群;
- 节点列表 :所选集群中的节点列表,单击切换节点。
- 故障 :统计当前集群产生的告警数量;
- 资源消耗 :所选节点的 CPU、内存、磁盘的实际使用量和总量;
- 指标说明 :所选节点的 CPU、内存、磁盘读写、网络接收发送的变化趋势。
-
切换到 资源水位线监控 页签,可查看当前节点的更多监控数据。
-
若选择的节点为 GPU 节点,在节点下方的页签即可看到 GPU 监控,从 GPU 监控 即可对 GPU 的资源进行监控。
!!!
当前仅支持 Nvidia、华为昇腾的 GPU 监控。