上云无忧 > 文档中心 > 腾讯云容器服务 TKE - 组件版本维护说明
容器服务 TKE
腾讯云容器服务 TKE - 组件版本维护说明

文档简介:
更新说明: 腾讯云容器服务提供了涵盖网络、存储、监控、镜像、调度、GPU 相关场景下的增强组件来扩展集群功能,您可在容器集群详情中的组件管理页面查看当前组件版本,并支持对组件版本进行手动升级操作。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

更新说明

腾讯云容器服务提供了涵盖网络、存储、监控、镜像、调度、GPU 相关场景下的增强组件来扩展集群功能,您可在容器集群详情中的组件管理页面查看当前组件版本,并支持对组件版本进行手动升级操作。

升级须知

1. 升级属于不可逆操作。
2. 仅支持向上升级容器服务提供的组件版本,在满足集群 kubernetes 版本限制的情况下,默认升级至当前最新版本。
3. 针对已废弃的组件版本,容器团队将不再提供技术支持,建议您及时升级。

版本迭代记录

CBS-CSI(腾讯云硬盘存储组件)

组件详情请参见 CBS-CSI 简介
发布时间
版本号
变更内容
限制和影响
2023-08-07
v1.1.2
csi-provisioner
支持使用快照 ID 进行 PVC 的快速数据恢复。

csi-attacher
添加退避算法,防止高频调用 CBS attach/detach 接口。

cbs-csi
支持 CDC 云硬盘场景。
优化 Pod 启动挂盘时间。
创建增强型 SSD 时支持设置额外性能。
CBS 快照幂等优化。
CHC、裸金属以及注册节点禁止 CBS 挂盘。
修复了1.24版本无法使用 LVM 功能的 Bug。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-03-24
v1.1.1
适配 tke 1.24 版本。
兼容旧版本收费模式参数。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-02-21
v1.1.0
支持自动感知 CVM 最大可挂载数。
优化云盘卸载逻辑,保证云盘状态正常。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-11-23
v1.0.9
支持 LVM 条带模式。
调高 csi-resizer 配额。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-11-15
v1.0.8
支持 LVM 多盘管理。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-10-20
v1.0.7
支持 xfs 文件系统快照。
支持1G粒度云盘创建。
支持 block 类型 volume。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-13
v1.0.6
支持从快照恢复时扩容。
支持 xfs 文件系统扩容。
支持 TKE 集群添加超级节点模式。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-07-06
v1.0.5
支持云标签重复时的云盘创建。
解决在线扩容时序问题。
回收 csi-node secret 资源权限。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-05-31
v1.0.4
优化插件启动逻辑。
csi-attacher 默认并发数调大至50。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-05-06
v1.0.3
插件支持配置污点容忍。
插件新增 type 启动参数。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-04-24
v1.0.2
取消插件 NodeUnpublishVolume 接口中的目录清理逻辑。
插件支持通过 Serial 获取盘符。
插件删除时保留对应 crd 资源。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-03-16
v1.0.1
支持使用了 intree cbs 的业务负载在集群从1.18升级到1.20时原地无损迁移到 csi。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

Cerberus(镜像签名验证组件)

组件详情请参见 Cerberus 说明
发布时间
版本号
变更内容
限制和影响
2022-09-26
v0.0.1
镜像验签组件。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

CFS-CSI(腾讯云文件存储组件)

组件详情请参见 CFS-CSI 说明
发布时间
版本号
变更内容
限制和影响
2023-07-05
v1.1.1
cfsclient 统一使用 PVC/PV 挂载方式。
CFS 实例增加标签功能。
修复部分问题,提升组件稳定性。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-03-07
v1.1.0
支持 inline 形式挂载。
更新负载配置,提升组件稳定性。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-23
v1.0.8
支持 TKE 集群添加超级节点模式。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-07-14
v1.0.7
动态存储功能适配 Serverless 集群。
共享存储功能适配 Serverless 集群。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-05-24
v1.0.5
支持 Serverless 集群 cfs provisioner。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-05-06
v1.0.4
插件支持配置污点容忍。
tcfs 配置文件中新增优先级和 hostAliases。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-04-19
v1.0.3
tcfs crd 增加资源标签字段。
1.12及以下 k8s 版本不安装 tcfs 相关的资源。
cfs-csi startServer 注册启动优化。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-04-12
v1.0.2
插件 umount 幂等性支持。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-03-24
v1.0.1
支持动态创建时共享存储实例,通过自动生成的子目录进行数据隔离。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

COS-CSI(腾讯云对象存储组件)

组件详情请参见 COS-CSI 说明
发布时间
版本号
变更内容
限制和影响
2022-05-06
v1.0.1
插件支持配置污点容忍。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

Craned(Request 推荐组件)

组件详情请参见 Request 智能推荐
发布时间
版本号
变更内容
限制和影响
2023-05-16
v2.1.0
修复了从旧版本升级后额外生成推荐 CRD 的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-05-05
v2.0.0
升级到推荐框架版本。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-02-24
v1.3.0
提升了组件的稳定性。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-12-09
v1.2.0
优化内存推荐逻辑,增加推荐数据精度。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-20
v1.1.0
请求腾讯云可观测平台的 metric 间隔调成5m,推荐频率降低到12小时一次。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

CranesScheduler(原生节点专用调度器)

组件详情请参见 原生节点专用调度器介绍
发布时间
版本号
变更内容
限制和影响
2023-08-16
v1.1.10
修复获取 Pod load 失败的问题。
修复在 node memory 达到驱逐水位线时,驱逐过多 Pod 的问题。
新增加一条驱逐停止水位线。
添加 hot-value metric,供外部观测。
计算节点热点值时,默认忽略 daemonset-pod。
支持各组件在超级节点上正常工作。
提升各组件在普通节点上 QoS 及优先级,保证组件高优先级工作。
下线由 node-annotator 实现的 hotvalue 方案。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-07-27
v1.1.9
使用 podinformer 方式实现 hot-value 功能。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-07-17
v1.1.8
下线以 prebind 扩展点实现的 hot-value 方案,仍使用原来的 annotate node 方式实现。prebind 方案有单点故障问题,会阻塞整个集群的调度,风险过高。
修复v1.18升级到v1.20版本的集群配置调度器失败的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-06-30
v1.1.7
crane-scheduler-controller 证书算法更新,从sha1更换到sha256,支持v1.22及以上集群。
Helm 管理优化:
hook deletePolicy 支持可重入操作。
添加 managecontrolplane 的 post-install、post-upgrade 和 pre-upgrade 拓展点,支持 prebind 的原地升级。
重做 hot-value 功能,添加 Prebind 拓展点,避免节点热点问题:
crane-scheduler目前只能支持单副本运行。
crane-scheduler-controller 兼容 hotvalue.weight 配置。
优化指标上报,缓解 OOM 问题。
取消 crane-scheduler-controller 及 descheduler 的 hostnetwork 网络模式,避免因端口冲突引起存活探针失败。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-06-21
v1.1.6
去除 crane-scheduler-controller 及 descheduler 的 deployment 上的 hostnetwork 设置。
crane-scheduler-controller 兼容 hotvalue.weight 配置。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-06-20
v1.1.5
证书算法更新,sha1更换到sha256,crane-scheduler-controller 支持v1.22及以上集群。
helm hook deletePolicy 支持可重入。
添加 Prebind 拓展点,使用调度器缓存热点,避免节点热点问题。
优化指标上报,缓解 OOM 问题。
添加 managecontrolplane 的 post-install、post-upgrade、pre-upgrade 拓展点,支持 prebind 的原地升级。
修改默认 cranescheduler 的 hotvalue 配置。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-03-23
v1.1.4
修复原生节点新加入节点打分阶段得分低,Pod 难以调度的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-21
v1.1.3
fix helm repo 参数缺失导致节点的指标无法更新到 node 上。
将 descheduler 融入到 cranescheduler,新增重调度器驱逐水位,动态调度器水位和重调度器目标水位一致。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

DeScheduler(重调度器插件)

组件详情请参见 DeScheduler 说明
发布时间
版本号
变更内容
限制和影响
2023-01-12
v1.0.2
修复集群节点 name 和 IP 不一致导致监控指标无法获取的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-06-07
v1.0.1
TMP 认证支持:
prom-probe 中添加 auth 认证。
descheduler 和 init container 中传入 token/appid 等环境变量,并进行解码。
descheduler 中增加 prometheus client 认证功能。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

DynamicScheduler(动态调度器)

组件详情请参见 DynamicScheduler 说明
发布时间
版本号
变更内容
限制和影响
2022-06-30
v1.0.2
TMP 认证支持:
probe-prometheus 中添加 auth 认证。
node-annotator 和 init container 中传入 token,appid 等环境变量,并进行解码。
node-annotator 中增加 prometheus client 认证功能,更新镜像到 v3.2.1。
对于使用 ip 作为 node exporter 上报标签的 promql 语句适配,修复无法查数据 bug。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

Nginx Ingress(开源七层网络接入层)

组件详情请参见 Nginx-ingress 说明
发布时间
版本号
变更内容
限制和影响
2023-08-09
v1.3.1
支持 TKE 1.22和 1.24集群增量 nginx ingress 实例的 IngressClass 能力。

2023-07-20
v1.3.0
支持 ingres-nginx v1.6.4版本,已用来支持 TKE 1.26及以上。
支持 IngressClass 对象,从v1.6.4版本开始。
支持上海自动驾驶地域 shadc。

2022-08-17
v1.2.0
接口迁移,不再依赖弹性网卡。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-04-18
v1.1.0
eks.tke.cloud.tencent.com/norm: "true"
eks.tke.cloud.tencent.com/disable-metrics:"true"
考虑到 TKE 集群添加超级节点模式,将原来在 Serverless 集群下生效的注解开放到 TKE 集群添加超级节点模式下生效。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

pod-identity-webhook(Pod 身份注入器)

组件详情请参见 Pod 使用 CAM 对数据库身份验证
发布时间
版本号
变更内容
限制和影响
2022-08-25
v1.0.0
添加 chart,支持 Pod 绑定一个 sa,sa 支持扮演 cam 角色来访问其他资源的能力。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

qGPU(GPU 隔离组件)

组件详情请参见 qGPU 概述
发布时间
版本号
变更内容
限制和影响
2023-08-30
v1.0.17
改进 Pod 删除时的处理逻辑,加快删除,减小 Recreate 策略的 Deployment 更新时新 Pod 调度失败的发生率。

2023-08-22
v1.0.16
修复 Pod 删除后变为 DeletedFinalStateUnknown 对象时强制转换为 Pod 引起 panic 的问题。
节点设置 label tke.cloud.tencent.com/qgpu-mode=base 后,安装 base 版本的 qgpu 模块,无需修改内核参数。

2023-06-20
v1.0.15
增加表示显存分配单位的标签 tke.cloud.tencent.com/qgpu.memory-unit,值为1G或者128M。
qgpu hook 兼容 nvidia 方案。
qgpu 安装失败时,日志中提示检查是否是支持的 GPU类型。
支持新的TencentOS-3.1 5.4内核。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-05-09
v1.0.14
支持原生节点、公共镜像、16卡、显存以128MB为单位。
兼容 nvidia 515(515.65.01) 驱动。
qGPU 调度器增加 /metrics 及 /caches 接口。
修复导致 qGPU 设备创建或销毁失败以及调度缓存信息不一致的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-02-08
v1.0.13
处理 qGPU 资源为0的 Pod 时,直接返回全部节点或者打分全部为0,避免处理大量节点耗时过长,阻塞 qgpu pod 的调度。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-12-20
v1.0.12
支持16卡。优化日志,避免打印干扰信。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-10-28
v1.0.11
删除 Pod 时,直接批量删除该 Pod 相关的指标,而不是按照容器逐个删除,避免某些情况下指标未删除的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-10-24
v1.0.10
修复某些多卡机型上,GPU 卡序号与次设备号不一致,导致 qGPU 挂错显卡,业务无法正常运行的问题。私有化允许安装不支持混部的 base 版本 run 包,此时不需要修改内核参数及重启节点。
修复未设置 qgpu-memory 却提示缺少 qgpu-core 的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-29
v1.0.9
修复 crd 引入的回归问题,该问题导致 qGPU 调度器重启后在未同步 Pod 分配信息的情况下就开始调度新 Pod,产生不一致问题。
更新 Pod 容器指标前,先清理相关数据,避免脏数据。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-21
v1.0.8
增加 /metrics 接口,暴露分配给 Pod 容器的 GPU 信息(node_gpu_core_request,node_gpu_memory_request_bytes; 类型Gauge,标签"node", "gpu", "namespace", "pod", "container"),Pod 删除后,相关容器的指标即被删除。
对于各种原因遗留的 qGPU 设备,在每分钟进行的 gc 中兜底删除,避免影响创建新的 qGPU 设备。
修复 Pod 删除后同名 Pod 马上被创建和调度到同一个节点可能导致创建 qGPU 设备失败的问题。
支持原生节点安装使用 qGPU(原生节点的 qGPU 不支持在离线混部功能)。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-09-06
v1.0.7
修复 qGPU 调度器未清理已删除节点信息的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-08-31
v1.0.6
支持使用节点的 kubeconfig 访问 apiserver (此时不能启用 crd 参数)。
支持使用 TencentOS 2.4(TK4) 公有镜像安装 qGPU。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-07-20
v1.0.5
支持使用公有镜像安装和使用 qGPU。
支持关闭给节点打 label 的功能(--enable-label=false)。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-06-08
v1.0.3
qgpu manager 镜像更新为 tkeimages/elastic-gpu-agent:v1.0.2。
qgpu scheduler 镜像更新为 tkeimages/elastic-gpu-scheduler:v1.0.2。
支持使用 GPU CRD 管理 GPU 资源。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-04-21
v1.0.2
更新了 qgpu manager 镜像版本,支持自动所在节点设置 GPU 驱动版本以及其他信息。
更新了 clusterrole qgpu-manager,增加了对 nodes 的操作权限。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

QOSAgent(QOS 保障组件)

组件详情请参见 QoSAgent
发布时间
版本号
变更内容
限制和影响
2023-08-14
v1.1.3
修复 caculateCPUUsage 时因为 nil 指针引起的 panic。
升级 cadvisor 版本,修复 CPU 负载高的问题。
DiskIO Manager 中禁用可能会导致内核 panic 的 bfq 功能。
修复打开再关闭 DiskIO manager 后,可能会导致 Pod 的 probe 执行失败的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-01-01
v1.0.1
修复了一些参数 default 值设置的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-08-30
v1.0.0
添加 chart,初步支持基于内核的 QoS 能力。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

SecurityGroupPolicy(安全组策略插件)

组件详情请参见 Pod 安全组
发布时间
版本号
变更内容
限制和影响
2023-01-15
v1.0.5
修复绑定多个重复的安全组造成 Pod 创建失败。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2022-08-25
v1.0.0
添加 chart,支持一批 TKE Serverless Pod 绑定同一个安全组来使用安全组放通安全组的能力。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

HPC(定时 HPA 组件)

组件详情请参见 HPC 说明
发布时间
版本号
变更内容
限制和影响
2023-03-12
v1.0.5
修复资源更新操作导致资源属性丢失问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
2023-01-08
v1.0.4
修复定时任务因用户误删除 finalizer 会被重复添加问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

imc-operator(镜像缓存)

组件详情请参见 镜像缓存
发布时间
版本号
变更内容
限制和影响
2023-06-25
v0.2.2
涉及 crd 新增字段、clusterrole 增加权限、controller镜像版本更新。
默认使用集群内子网制作镜像缓存,并支持用户 CRD 子网自定义设定。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
相似文档
  • 日志组件介绍: 日志组件是当用户开启容器服务内的日志服务时,腾讯云日志服务部署于用户集群内每个标准节点上的组件,用于采集容器服务产生的业务日志并写入腾讯云上的消费端,目前支持写入 CLS 和 Kafka。
  • VPC-CNI 组件包含3个 kubernetes 集群组件,分别是 tke-eni-agent、tke-eni-ipamd 和 tke-eni-ip-scheduler。一般情况下,三个组件版本相同,但 tke-eni-ip-scheduler 组件变更较少,版本可能会稍微落后。
  • monitor-agent 版本迭代记录。 2023-06-20,v1.3.8。 修复了内部用户容器层级指标采集逻辑。 此次升级不会对已有业务造成影响。升级过程中可能存在组件不可用情况,建议业务低峰期升级。
  • 腾讯云容器服务支持创建不同类型的 Kubernetes 集群,不同类型集群的计费项和计费标准不同。本文向您介绍如何购买不同类型集群。
  • 本文将帮助您快速了解腾讯云容器服务(Tencent Kubernetes Engine,TKE),您可根据指引快速上手容器服务 TKE。 1. 什么是容器服务? 腾讯云容器服务(Tencent Kubernetes Engine,TKE)基于原生 Kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,与腾讯云 IaaS 产品紧密结合,助力客户快速实现业务容器化,请参见 产品概述。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部