腾讯云容器服务 TKE - 监控组件版本说明
文档简介:
monitor-agent 版本迭代记录。
2023-06-20,v1.3.8。
修复了内部用户容器层级指标采集逻辑。
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
monitor-agent 版本迭代记录
变更时间
|
版本号
|
变更内容
|
限制和影响
|
2023-06-20
|
v1.3.8
|
修复了内部用户容器层级指标采集逻辑。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2023-04-25
|
v1.3.7
|
修复了 Pod 层级 GPU 利用率(占节点)和 GPU 内存利用率(占节点)指标不能正常采集的问题,以及容器挂载了宿主机目录导致处于 terminating 状态的 pod 删除不掉的问题。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2023-03-21
|
v1.3.6
|
新增了原生节点相关指标:节点1分钟负载、节点磁盘总量、节点磁盘使用率、节点写带宽。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2023-01-18
|
v1.3.5
|
优化了当 cadvisor 没暴露指标container_fs_usage_bytes 和container_fs_limit_bytes 时,相关监控指标不上报。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2023-01-12
|
v1.3.4
|
修复了运行时为 containerd 时文件系统使用量指标为0的问题。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-12-13
|
v1.3.3
|
优化了基础监控拉取指标的方式。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-11-08
|
v1.3.2
|
修复了基础监控不能正常上报监控指标的问题。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-10-20
|
v1.3.1
|
修复了指标掉点的问题。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-08-25
|
v1.3.0
|
TKE 基础监控现在支持 PVC 监控指标,包括:PVC 云盘大小、PVC 云盘使用率、PVC 云盘使用量。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-08-09
|
v1.2.2
|
更新了 GPU 指标计算方式。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-07-28
|
v1.2.1
|
更新了节点 CPU 装箱率和节点内存装箱率指标计算方式。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-07-25
|
v1.2.0
|
新增了 Pod CPU 可优化量、Pod 内存可优化量、节点 CPU 装箱率、节点内存装箱率指标。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-07-21
|
v1.1.1
|
修复了基础监控组件在采集、计算、上报周期内没有完成对应周期的采集、计算、上报任务的问题。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-07-05
|
v1.1.0
|
tke-monitor-agent 挂载宿主机路径 /proc/meminfo、/proc/cpuinfo,用于采集节点 CPU 利用率、内存利用率。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
2022-06-23
|
v1.0.0
|
通过 chart 来管理基础监控组件。
|
此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
|
clustermonitor 版本迭代记录
变更时间
|
版本号
|
变更内容
|
限制和影响
|
2023-06-20
|
v1.0.7
|
成本指标的上报逻辑优化。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|
2023-06-08
|
v1.0.6
|
修复:当 Pod 不处于 running 状态时,k8s_pod_ping_succeed 指标不上报。
修复:当往 barad 上报的数据条数大于1000时,数据缓存没有被清理问题。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|
2023-04-03
|
v1.0.5
|
clustermonitor service 添加annotation.service.kubernetes.io/qcloud-loadbalancer-multiplex
: "true",独立集群场景下与巡检组件复用 ENILB。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|
2023-03-29
|
v1.0.4
|
新增 Node 状态、Pod Ready 状态、成本指标的采集和上报。
hpa 数据源 hpa-metrics-server 指标拉取优化。
metrics-server 版本升级。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|
2023-03-24
|
v1.0.3
|
修复 clustermonitor 版本升级失败问题。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|
2023-03-16
|
v1.0.2
|
修复 apiserver cpu/mem 利用率掉点问题。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|
2023-03-14
|
v1.0.1
|
通过 chart 来管理基础监控组件。
|
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
|