腾讯云微服务引擎 TSE - 查看默认监控
文档简介:
操作场景:
云原生 API 网关 Kong 对运行的网关实例提供了多项监控指标,用以监测实例运行情况,例如:4xx请求数、5xx请求数等业务指标,CPU 利用率、内存使用率等系统指标。
操作场景
云原生 API 网关 Kong 对运行的网关实例提供了多项监控指标,用以监测实例运行情况,例如:4xx请求数、5xx请求数等业务指标,CPU 利用率、内存使用率等系统指标。
您可以根据这些指标实时了解网关实例的运行状况,针对可能存在的风险及时处理,保障系统的稳定运行。本文为您介绍通过 TSE 控制台查看网关实例监控的操作。
支持监控指标及含义
请求监控
指标名
|
指标含义
|
4xx请求数(Count)
|
客户端发送到云原生 API 网关的是请求非法请求,如鉴权不通过或者超过限流值的错误个数,按照所选择的时间粒度统计求和。
|
5xx请求数(Count)
|
云原生 API 网关将消息转发到后端服务,后端服务返回大于等于400错误状态码的个数,按照所选择的时间粒度统计求和。
|
成功请求数(Count)
|
云原生 API 网关返回为1xx,2xx,3xx的请求数量,按照所选择的时间粒度统计求和。
|
请求平均时延(ms)
|
请求平均时延,按照所选择的时间粒度统计求平均值。
|
请求最大时延(ms)
|
请求最大时延, 按照所选择的时间粒度统计求最大值。
|
总请求数(Count)
|
总请求数。按照所选择的时间粒度统计求和。
|
404请求数(Count)
|
请求后端服务失败,请求所希望的资源未被在后端服务器上发现,此类错误的个数的统计,按照所选择的时间粒度统计求和。
|
429请求数(Count)
|
请求后端服务失败,请求被限流,此类错误的个数的统计,按照所选择的时间粒度统计求和。
|
502请求数(Count)
|
API 网关尝试执行后端请求时,从后端服务器接收到无效的响应(通常连接服务失败),此类错误的个数的统计,按照所选择的时间粒度统计求和。
|
504请求数(Count)
|
API 网关尝试执行后端请求时,后端机器不可达,此类错误的个数的统计,按照所选择的时间粒度统计求和。
|
系统监控
实例/节点监控指标
指标名
|
指标含义
|
CPU 利用率(%)
|
云原生 API 网关集群的 CPU 使用率,按照所选择的时间粒度统计求平均值
|
内存使用率(%)
|
云原生 API 网关集群的内存使用率,按照所选择的时间粒度统计求平均值
|
入带宽流量(Mbps)
|
云原生 API 网关集群的入口带宽流量,按照所选择的时间粒度统计求平均值
|
出带宽流量(Mbps)
|
云原生 API 网关集群的出口带宽流量,按照所选择的时间粒度统计求平均值
|
TCP 入连接数(个)
|
云原生 API 网关集群的 TCP 连接数,按照所选择的时间粒度统计求平均值
|
负载均衡监控指标
指标名
|
指标含义
|
入流量(MiBytes)
|
在统计粒度内,客户端流入到负载均衡的流量。
|
出流量(MiBytes)
|
在统计粒度内,负载均衡流出到客户端的流量。
|
入包量(Count/s)
|
在统计粒度内,客户端向负载均衡每秒发送的数据包数量。
|
出包量(Count/s)
|
在统计粒度内,负载均衡向客户端每秒发送的数据包数量。
|
入带宽(Mbps)
|
在统计粒度内,客户端流入到负载均衡所用的带宽。
|
出带宽(Mbps)
|
在统计粒度内,负载均衡流出到客户端所用的带宽。
|
入带宽利用率(%)
|
在统计粒度内,客户端通过外网访问负载均衡所用的带宽利用率。
|
出带宽利用率(%)
|
在统计粒度内,负载均衡访问外网所用的带宽使用率。
|
业务监控
指标名
|
指标含义
|
服务来源健康检查失败总请求数(Count)
|
云原生 API 网关集群服务来源健康检查失败总请求数。
|
服务来源健康检查成功总请求数(Count)
|
云原生 API 网关集群服务来源健康检查成功总请求数。
|
服务来源健康检查总请求数(Count)
|
云原生 API 网关集群服务来源健康检查总请求数。
|
查看监控入口
1. 登录 TSE 控制台。
2. 在左侧导航栏单击云原生 API 网关 > 可观测性,在页面上方选择好网关实例。
3. 设置要查看的视图和时间范围,即可查看以下监控指标信息。
