上云无忧 > 文档中心 > 腾讯云消息队列 Pulsar 版 - 跨地域容灾
消息队列 Pulsar 版
腾讯云消息队列 Pulsar 版 - 跨地域容灾

文档简介:
功能介绍: 消息中间件在业务系统的技术架构中,作为非常重要的组件。TDMQ Pulsar 本身支持了多可用区的容灾能力,为了解决当发生地域级灾难时,客户能够快速迁移业务,确保业务的连续性,故而推出跨地域容灾方案。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

功能介绍

消息中间件在业务系统的技术架构中,作为非常重要的组件。TDMQ Pulsar 本身支持了多可用区的容灾能力,为了解决当发生地域级灾难时,客户能够快速迁移业务,确保业务的连续性,故而推出跨地域容灾方案。
下面对跨地域容灾方案进行介绍。

在正常场景下,业务在 A 地域访问 Pulsar 服务端,用户需要完成两个主要动作:
1. 跨城网络连接建立,通过云联网 CCN 打通跨地域的 VPC 网络;
2. 元数据同步,通过 Pulsar 控制台建立两地的集群元数据同步,包括命名空间、Topic、订阅、角色等。
异常发生时。TDMQ Pulsar 控制台提供域名解析切换功能,将原 A 地域使用的域名指向到目标容灾 B 地域的集群。如此可避免客户端修改接入点地址,而实现对容灾 B 地域的集群方案,保障业务的延续性。
A 地域异常恢复后。用户首先需要判断是否要将 B 地域所产生的消息回写至 A 地域,以确保消息的完整性,如需回写,请联系我们的售后团队操作。接着,用户在 B 地域的集群操作接入点域名解析切回,切回操作执行后,客户端即可正常访问 A 地域。

操作指南

容灾功能启动配置

1. 在备份地域,创建专业集群,在集群购买界面,需要开启「跨地域容灾」开关,并选择要备份的集群;
2. 通过控制台配置集群的元数据同步链路:
复制链路名称:为同步链路定义一个名字。
源集群选择:选择要进行容灾备份的 Pulsar 集群。
目标集群选择:在不同地域选择创建好的容灾集群,此处仅会显示「集群 ID」相同的集群。
复制级别:支持集群级和命名空间两个级别
集群级,适用于集群级的冷备。
命名空间级,适用于两地集群日常都是活跃的,不同的命名空间分布在不同地域,地域间互为主备。

云联网网络打通

基于 云联网 打通生产地域和备份地域的网络,建立一个网络访问通道。使得在灾难时,在生产地域的客户端可以跨地域访问到备份集群。
配置详情请参考云联网 操作指南,进行如下操作:
1.新建云联网实例
2.关联网络实例

灾难发生时

用户决策,客户端访问切换至备份地域:
1. 通过控制台(如可用)发起域名解析切换;
2. 如控制台不可用,客户可联系售后架构师,由 TDMQ 服务侧发起切换。

灾难恢复后

用户决策,客户端访问切回原地域集群:
1. 用户判断是否需要进行消息回写,如需回写,请联系我们的售后团队操作;
2. 控制台发起域名切回,客户端正常访问原地域。

注意事项

1.支持范围

该功能仅专业集群支持。

2.消息回写

消息回写是在用户将流量切回原地域时的前置判断,目的是为了避免数据丢失,确保数据完整性。请务必在决定是否回写后再进行域名切回。
用户提供信息:
待搬迁的 Topic 列表,例如:集群 ID、命名空间或者具体的 Topic 列表。
起始时间和结束时间,Topic 中发送时间在该范围内的消息为待搬迁数据,参考字段为消息头中的 publishTime。
消息回写的影响:
大量的消息重复,服务端主观上不会去考虑源集群和目标集群的位点同步的复杂状态机,一律将搬迁消息视为新消息对待,即使历史数据已经有同一条消息,也视为两条不同的消息。如果重复消息对业务有一定影响,建议客户端做 幂等处理
较少的消息乱序。

3.关于角色

源集群下,至少需要有一个角色 Role,可以不绑定到命名空间。目标是为了确保同步时角色 Role 、Token 可以与容灾集群保持一致。

4.云联网的配置

云联网配置时,两个地域所创建的 VPC CIDR 需要错开。例如:广州10.0.0.0/16 上海10.1.0.0/16 ,如此云联网才能将这两个 VPC 连起来(IP 不会互相冲突)。

5.域名切换生效时间

域名切换生效时间约需 5s 至 5mins,包括两个部分:域名解析切换,客户端断开重连至新集群的 Broker。

6.灾难时切换后

灾难发生时,流量切换到容灾集群后,尽量不要在备份集群变更元数据,例如:命名空间属性、新建 Topic 等。

相似文档
  • 操作场景: TDMQ Pulsar 版支持集群监控功能,包括集群的计算指标、存储指标和消息大小统计分布,您可以根据这些监控数据,分析集群的使用情况,针对可能存在的风险及时处理。同时您也可以对监控项设置报警规则,以便数据异常时收到报警消息,及时处理风险,保障系统的稳定运行。
  • 操作场景: TDMQ Pulsar 版支持监控您账户下创建的 Topic 资源,帮助您实时掌握 Topic 状态,针对可能存在的问题及时处理,保障其稳定运行。 本文为您介绍通过控制台查看监控指标的操作方法和监控指标的含义。
  • 操作场景: 腾讯云默认为所有用户提供腾讯云可观测平台功能,无需用户手动开通。用户在使用了腾讯云某个产品后,腾讯云可观测平台才可以开始收集监控数据。
  • 本文为您介绍消息队列 Pulsar 版的权限管理内容。
  • CAM 基本概念: 主账号通过给子账号绑定策略实现授权,策略设置可精确到 [API,资源,用户/用户组,允许/拒绝,条件] 维度。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部