上云无忧 > 文档中心 > 腾讯云容器服务实战教程 - 实现独立集群的 Master 容灾
容器服务 TKE
腾讯云容器服务实战教程 - 实现独立集群的 Master 容灾

文档简介:
概述: 容器服务 TKE 包含托管集群及独立部署集群。若使用托管集群,则无需关注容灾,托管集群的 Master 由容器服务 TKE 内部维护。若使用独立集群,则 Master 节点由用户自行管理维护。独立集群如需实现容灾,则首先应根据需求规划容灾方案,在创建集群时进行相应配置即可。本文介绍如何实现 TKE 独立集群 Master 的容灾,您可参考本文进行操作。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

概述

容器服务 TKE 包含托管集群及独立部署集群。若使用托管集群,则无需关注容灾,托管集群的 Master 由容器服务 TKE 内部维护。若使用独立集群,则 Master 节点由用户自行管理维护。独立集群如需实现容灾,则首先应根据需求规划容灾方案,在创建集群时进行相应配置即可。本文介绍如何实现 TKE 独立集群 Master 的容灾,您可参考本文进行操作。

容灾实现思路

实现容灾应从物理部署层面切入,为避免因一次物理层面的故障导致多台 Master 异常,需将 Master 节点打散部署。可借助 置放群组 来选择将 Master 从物理机、交换机或机架三种维度中其中一种来将 Master 打散,以避免底层硬件或软件故障导致多台 Master 异常。如对容灾要求非常高,还可以考虑将 Master 跨可用区部署,以避免在发生大规模故障时,整个数据中心不可用导致 Master 集体异常的情况。

使用置放群组打散 Master

1. 登录 置放群组控制台,创建置放群组,详情请参见 分散置放群组。如下图所示:
注意
置放群组需与 TKE 独立集群在同一地域。

置放群组层级如下,本文以选择“机架层级”为例:
置放群组层级
说明
物理机层级
独立集群 Master 使用云服务器部署,属于虚拟机,在物理机上运行。一台物理机可能运行有多台虚拟机,如果物理机发生故障,将影响在这台物理机上运行的所有虚拟机。使用这个层级可以将 Master 打散部署到不同物理机上,避免一台物理机故障导致多台 Master 异常。
交换机层级
多台不同物理机可能连接在相同的交换机上,如果交换机发生故障,可能影响多台物理机。使用这个层级可以将 Master 打散部署到连到不同交换机的物理机上,避免交换机故障导致多台 Master 异常。
机架层级
多台不同物理机可能放置在同一个机架上,如果发生机架级别的意外,导致一台机架上多台物理机故障。使用这个层级以将 Master 打散部署到不同机架上的物理机上,避免发生机架级别的意外导致多台 Master 异常。
2. 参考 创建集群 创建 TKE 独立集群。在 “Master&Etcd 节点配置”的“高级设置”中,勾选“将实例添加到分散置放群组” ,并选择已创建的置放群组。如下图所示:

配置完成后,对应 Master 节点就会被打散部署到不同的机架上,实现机架级别的容灾。

Master 跨可用区容灾

如果对容灾要求较高,避免因发生大规模故障时整个数据中心都不可用,导致所有 Master 异常,可选择将 Master 部署在不同可用区中。配置方法如下: 在创建集群,选择 “Master&Etcd 节点配置”时,在多个可用区添加机型即可。如下图所示:


相似文档
  • 操作场景: 当前集群开启内网访问后,容器服务 TKE 默认通过域名访问集群,您需要在访问机上配置 Host 来进行内网域名解析。如未配置对应的域名解析规则(Host),在访问机上访问对应集群(运行 kubectl get nodes)时将会报错 “no such host”,如下图所示:
  • 操作场景: 开源工具 Velero(旧版本名称为 Heptio Ark)可以安全地备份和还原、执行灾难恢复以及迁移 Kubernetes 集群资源和持久卷。在容器服务 TKE 集群或自建 Kubernetes 集群中部署 Velero 可以实现以下功能: 备份集群资源并在丢失的情况下进行还原。 将集群资源迁移到其他集群。 将生产集群资源复制到开发和测试集群。
  • 操作场景: 开源工具 Velero(旧版本名称为 Heptio Ark)可以安全地备份和还原、执行灾难恢复以及迁移 Kubernetes 集群资源和持久卷。容器服务 TKE 支持使用 Velero 备份、还原和迁移集群资源,详情请参见 使用对象存储 COS 作为 Velero 存储实现集群资源备份和还原 和 在 TKE 中使用 Velero 迁移复制集群资源。
  • 前提条件: 已有容器服务 TKE 托管集群(以下称作集群 A ),且集群版本需 >= 1.18 及以上。 已创建迁移目标的 TKE Serverless 集群(以下称作集群 B),集群版本需 >= 1.20 及以上,创建 TKE Serverless 集群请参见 创建集群。
  • 操作场景: TKE Serverless 容器服务支持通过配置 NAT 网关 和 路由表 来实现集群内服务访问外网,您可参考本文进行配置。 操作步骤: 创建 NAT 网关: 1. 登录腾讯云私有网络控制台,选择左侧导航栏中的 NAT 网关。 2. 在 “NAT网关”页面中,单击+新建。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部