腾讯云容器服务实战教程 - 使用 tke-autoscaling-placeholder 实现秒级弹性伸缩

容器服务 TKE

简介/价格/文档

腾讯云容器服务实战教程 - 使用 tke-autoscaling-placeholder 实现秒级弹性伸缩

文档简介：

操作场景：如 TKE 集群配置了节点池并启用弹性伸缩，则在节点资源不够时可以触发节点的自动扩容（自动购买机器并加入集群），该扩容流程需要一定的时间才能完成，在一些流量突高的场景，该扩容速度可能会显得太慢，影响业务正常运行。

*此产品及展示信息均由腾讯云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

操作场景

如 TKE 集群配置了节点池并启用弹性伸缩，则在节点资源不够时可以触发节点的自动扩容（自动购买机器并加入集群），该扩容流程需要一定的时间才能完成，在一些流量突高的场景，该扩容速度可能会显得太慢，影响业务正常运行。而 tke-autoscaling-placeholder 可以用于在 TKE 上实现秒级伸缩，应对流量突高场景。本文将介绍如何使用 tke-autoscaling-placeholder 实现秒级弹性伸缩。

实现原理

tke-autoscaling-placeholder 利用低优先级的 Pod（带有 request 的 pause 容器，实际资源消耗较低）对资源进行提前占位，为可能出现流量突增的高优先级业务预留一部分资源作为缓冲。当需要扩容 Pod 时，高优先级的 Pod 可以快速抢占低优先级 Pod 的资源进行调度，这将导致低优先级的 tke-autoscaling-placeholder 的 Pod 进入 Pending 状态，如果配置了节点池并启用弹性伸缩，将会触发节点的扩容。通过这种资源缓冲机制，即使节点扩容速度较慢，也能确保部分 Pod 能够迅速扩容并调度，实现秒级伸缩。根据实际需求，可以调整 tke-autoscaling-placeholder 的 request 或副本数，以便调整预留的缓冲资源量。

使用限制

使用 tke-autoscaling-placeholder 应用，集群版本需要在1.18以上。

操作步骤

安装 tke-autoscaling-placeholder

1. 登录容器服务控制台，选择左侧导航栏中的应用市场。

2. 在应用市场页面，输入关键词 tke-autoscaling-placeholder 进行搜索，找到该应用。如下图所示：

3. 单击应用，在应用详情中，单击基本信息模块中的创建应用。

4. 在创建应用页面，按需配置并创建应用。如下图所示：

配置说明如下：

名称：输入应用名称。最长63个字符，只能包含小写字母、数字及分隔符“-”，且必须以小写字母开头，数字或小写字母结尾。

地域：选择需要部署的所在地域。

集群类型：选择标准集群。

集群：选择需要部署的集群 ID。

Namespace：选择需要部署的 namespace。

Chart 版本：选择需要部署的 Chart 版本。

参数：配置参数中最重要的是 replicaCount 与 resources.request，分别表示 tke-autoscaling-placeholder 的副本数与每个副本占位的资源大小，它们共同决定缓冲资源的大小，可以根据流量突高需要的额外资源量来估算进行设置。tke-autoscaling-placeholder 完整参数配置说明请参考如下表格：

参数名称	描述	默认值
replicaCount	placeholder 的副本数	10
image	placeholder 的镜像地址	ccr.ccs.tencentyun.com/tke-market/pause:latest
resources.requests.cpu	单个 placeholder 副本占位的 CPU 资源大小	300m
resources.requests.memory	单个 placeholder 副本占位的内存大小	600Mi
lowPriorityClass.create	是否创建低优先级的 PriorityClass (用于被 placeholder 引用)	true
lowPriorityClass.name	低优先级的 PriorityClass 的名称	low-priority
nodeSelector	指定 placeholder 被调度到带有特定 label 的节点	{}
tolerations	指定 placeholder 要容忍的污点	[]
affinity	指定 placeholder 的亲和性配置	{}

5. 单击创建，部署 tke-autoscaling-placeholder 应用。

6. 执行如下命令，查看进行资源占位的 Pod 是否启动成功。

		
			kubectl get pod -n default

示例如下：

				
			$ kubectl get pod -n default
		
			tke-autoscaling-placeholder-b58fd9d5d-2p6ww   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-55jw7   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-6rq9r   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-7c95t   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-bfg8r   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-cfqt6   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-gmfmr   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-grwlh   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-ph7vl   1/1     Running   0          8s
		
			tke-autoscaling-placeholder-b58fd9d5d-xmrmv   1/1     Running   0          8s

部署高优先级 Pod

tke-autoscaling-placeholder 默认优先级较低，其中业务 Pod 可以指定一个高优先的 PriorityClass，方便抢占资源实现快速扩容。如果还未创建 PriorityClass，您可以参考如下示例进行创建：

				
			apiVersion: scheduling.k8s.io/v1
		
			kind: PriorityClass
		
			metadata:
		
			 name: high-priority
		
			value: 1000000
		
			globalDefault: false
		
			description: "high priority class"

在业务 Pod 中指定 priorityClassName 为高优先的 PriorityClass。示例如下：

				
			apiVersion: apps/v1
		
			kind: Deployment
		
			metadata:
		
			 name: nginx
		
			spec:
		
			 replicas: 8
		
			 selector:
		
			 matchLabels:
		
			 app: nginx
		
			 template:
		
			 metadata:
		
			 labels:
		
			 app: nginx
		
			 spec:
		
			 priorityClassName: high-priority # 这里指定高优先的 PriorityClass
		
			 containers:
		
			 - name: nginx
		
			 image: nginx
		
			 resources:
		
			 requests:
		
			 cpu: 400m
		
			 memory: 800Mi

当集群节点资源不够时，扩容出来的高优先级业务 Pod 就可以将低优先级的 tke-autoscaling-placeholder

的 Pod 资源抢占过来并调度上，此时 tke-autoscaling-placeholder 的 Pod 状态将变成 Pending。示例如下：

				
			$ kubectl get pod -n default
		
			NAME                                          READY   STATUS    RESTARTS   AGE
		
			nginx-bf79bbc8b-5kxcw 1/1     Running 0 23s
		
			nginx-bf79bbc8b-5xhbx 1/1     Running 0 23s
		
			nginx-bf79bbc8b-bmzff 1/1     Running 0 23s
		
			nginx-bf79bbc8b-l2vht 1/1     Running 0 23s
		
			nginx-bf79bbc8b-q84jq 1/1     Running 0 23s
		
			nginx-bf79bbc8b-tq2sx 1/1     Running 0 23s
		
			nginx-bf79bbc8b-tqgxg 1/1     Running 0 23s
		
			nginx-bf79bbc8b-wz5w5 1/1     Running 0 23s
		
			tke-autoscaling-placeholder-b58fd9d5d-255r8 0/1     Pending 0 23s
		
			tke-autoscaling-placeholder-b58fd9d5d-4vt8r 0/1     Pending 0 23s
		
			tke-autoscaling-placeholder-b58fd9d5d-55jw7 1/1     Running 0 94m
		
			tke-autoscaling-placeholder-b58fd9d5d-7c95t 1/1     Running 0 94m
		
			tke-autoscaling-placeholder-b58fd9d5d-ph7vl 1/1     Running 0 94m
		
			tke-autoscaling-placeholder-b58fd9d5d-qjrsx 0/1     Pending 0 23s
		
			tke-autoscaling-placeholder-b58fd9d5d-t5qdm 0/1     Pending 0 23s
		
			tke-autoscaling-placeholder-b58fd9d5d-tgvmw 0/1     Pending 0 23s
		
			tke-autoscaling-placeholder-b58fd9d5d-xmrmv 1/1     Running 0 94m
		
			tke-autoscaling-placeholder-b58fd9d5d-zxtwp 0/1     Pending 0 23s

如果配置了节点池弹性伸缩，则将触发节点的扩容，虽然节点速度慢，但由于缓冲资源已分配到业务 Pod，

业务能够快速得到扩容，因此不会影响业务的正常运行。

总结

本文介绍了用于实现秒级伸缩的工具 tke-autoscaling-placeholder，巧妙的利用了 Pod 优先级与抢占的特点，提前部署一些用于占位资源的低优先级“空 Pod” 作为缓冲资源填充，在流量突高并且集群资源不够的情况下抢占这些低优先级的“空 Pod” 的资源，同时触发节点扩容，实现在资源紧张的情况下也能做到秒级伸缩，不影响业务正常运行。

文档中心

操作场景

实现原理

使用限制

操作步骤

安装 tke-autoscaling-placeholder

部署高优先级 Pod

总结

相关文档

文档中心

全民上云·上云补贴申领

免费试用（限企业）

操作场景

实现原理

使用限制

操作步骤

安装 tke-autoscaling-placeholder

部署高优先级 Pod

总结

相关文档