腾讯云容器服务 TKE Serverless 集群 - 监控和告警
文档简介:
本文档介绍 TKE Serverless 集群提供的集群、工作负载、Pod、Container 4个层面的监控数据收集和展示功能。
前提条件:
已创建状态为“运行中”的 Serverless 集群,详情请参见 创建集群。
本文档介绍 TKE Serverless 集群提供的集群、工作负载、Pod、Container 4个层面的监控数据收集和展示功能。
前提条件
已创建状态为“运行中”的 Serverless 集群,详情请参见 创建集群。
操作步骤
1. 登录容器服务控制台 ,选择左侧导航栏中的 集群。
2. 在集群管理页面,选择 Serverless 集群 ID。
3. 在集群资源管理页面,参考以下文档查看监控及设置告警:
查看监控数据
设置告警
监控及告警指标列表
监控
目前 TKE Serverless 集群提供了以下维度的监控指标,所有指标均为统计周期内的平均值。
注意
工作负载使用的 PV 的详细监控指标请参考 云硬盘监控、文件存储监控。
Service 关联的 CLB 详细的网络监控指标请参考 负载均衡监控。
云监控创建告警策略指引,详情请参见 创建告警策略。
集群监控指标
指标
|
单位
|
说明
|
CPU 使用量
|
核
|
集群当前所有运行中 Pod 使用的 CPU 规模
|
内存使用量
|
B
|
集群当前所有运行中 Pod 使用的内存规模
|
工作负载监控指标
指标
|
单位
|
说明
|
Pod 重启次数
|
次
|
工作负载内所有 Pod 的重启次数之和
|
CPU 使用量
|
核
|
工作负载内所有 Pod 的 CPU 使用量
|
CPU 利用率(占 Pod 规格)
|
%
|
工作负载内所有 Pod 的 CPU 使用量占分配资源总量之比
|
内存使用量
|
B
|
工作负载内所有 Pod 的内存使用量
|
内存利用率(占 Pod 规格)
|
%
|
工作负载内所有 Pod 的内存使用量占分配资源总量之比
|
Pod 监控指标
指标
|
单位
|
说明
|
异常状态
|
-
|
Pod 的状态,正常或异常
|
CPU 使用量
|
核
|
Pod 的 CPU 使用量
|
CPU 利用率(占 Request)
|
%
|
Pod 的 CPU 使用量和设置的 Request 值之比
|
CPU 利用率(占 Limit)
|
%
|
Pod 的 CPU 使用量和设置的 Limit 值之比
|
CPU 利用率(占 Pod 规格)
|
%
|
Pod 的 CPU 使用量占 Pod 分配总量之比
|
内存使用量
|
B
|
Pod 的内存使用量,含缓存
|
内存利用率(占 Request)
|
%
|
Pod 的内存使用量和设置的 Request 值之比
|
内存利用率(占 Limit)
|
%
|
Pod 的内存使用量和设置的 Limit 值之比
|
内存利用率(占 Pod 规格)
|
%
|
Pod 的内存使用量占 Pod 分配总量之比
|
Container 监控指标
指标
|
单位
|
说明
|
CPU 使用量
|
核
|
Container 的 CPU 使用量
|
CPU 利用率(占 Request)
|
%
|
Container 的 CPU 使用量和设置的 Request 值之比
|
CPU 利用率(占 Limit)
|
%
|
Container 的 CPU 使用量和设置的 Limit 值之比
|
内存使用量
|
B
|
Container 的内存使用量,含缓存
|
内存利用率(占 Request)
|
%
|
Container 的内存使用量和设置的 Request 值之比
|
内存利用率(占 Limit)
|
%
|
Container 的内存使用量和设置的 Limit 值之比
|
告警
目前 TKE Serverless 集群提供了以下维度的告警指标,所有指标均为统计周期内的平均值。
Pod 告警指标
指标
|
单位
|
说明
|
CPU 利用率(占 Pod 规格)
|
%
|
Pod 的 CPU 使用量占 Pod 分配总量之比
|
内存利用率(占 Pod 规格)
|
%
|
Pod 的内存使用量占 Pod 分配总量之比
|
CPU 利用率(占 Request)
|
%
|
Pod 的 CPU 使用量和设置的 Request 值之比
|
内存利用率(占 Request)
|
%
|
Pod 的内存使用量和设置的 Request 值之比
|
CPU 利用率(占 Limit)
|
%
|
Pod 的 CPU 使用量和设置的 Limit 值之比
|
内存利用率(占 Limit)
|
%
|
Pod 的内存使用量和设置的 Limit 值之比
|
Pod 重启次数
|
次
|
Pod 的重启次数
|
Pod Ready
|
-
|
Pod 的状态,默认 False 时告警
|
CPU 使用量
|
核
|
Pod 的 CPU 使用量
|
内存使用量
|
MB
|
Pod 的内存使用量,含缓存
|