上云无忧 > 文档中心 > 腾讯云消息队列 CKafka - 连接器订阅 MySQL 的分区分表策略
消息队列 CKafka
腾讯云消息队列 CKafka - 连接器订阅 MySQL 的分区分表策略

文档简介:
背景: CKafka 连接器支持将订阅的多个 Mysql 数据库表的变更消息推送到 Kafka 的 Topic,有两种推送形式: 1. 支持将多个表的消息推送到同一个 Topic。 2. 支持将多个表的消息推送到不同的 Topic。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

背景

CKafka 连接器支持将订阅的多个 Mysql 数据库表的变更消息推送到 Kafka 的 Topic,有两种推送形式:
1. 支持将多个表的消息推送到同一个 Topic。
2. 支持将多个表的消息推送到不同的 Topic。
当订阅数据发送到多分区的 Topic 时,订阅数据发送的分区策略如下:
1. 默认情况下,数据将根据表的主键进行 hash,然后发送到多个分区。即同一个主键的订阅数据会发送到同一个分区,保证同一行数据的订阅变更数据是有序的。
2. 当根据主键 hash 不满足需求时,允许手动指定分区 hash 的列。即手动指定根据哪些列来进行 hash 发送至 Topic 的分区。

手动指定分区策略

手动指定分区策略需要在新建任务-数据源配置步骤设定每个表的分区策略,默认情况下将按照主键作为 key。 操作步骤如下:
1. 在创建数据链路任务时,在数据源配置界面可选择需要订阅的多库多表。

2. 根据选中的表添加分区策略,可设置表字段将字段值相同的数据变更消息投递到同一分区中。

数据订阅到多个 topic

如果希望将订阅的所有表的消息投递到多个 Topic,在新建任务-数据目标配置步骤选择分发到多个 Topic,然后配置表和 Topic 的映射规则。

说明
当数据订阅到多个 Topic 时,会将不同表的数据发送到不同的 Topic。在 Topic 维度的分区策略时,还是会根据上述的分区策略进行发送。
相似文档
  • 背景: 在使用 CKafka 连接器订阅 Postgresql 数据库时,需要给 连接管理 中配置的 PostgreSQL 用户分配相应的权限。只有拥有相应权限的用户从被允许的主机访问数据库时,才能够进行消息的同步。
  • 概览: 在通过 CKafka 连接器处理数据流入流出任务时,通常需要对数据进行简易的清洗操作,如格式化原始数据、解析特定字段、数据格式转换等等。开发者往往需要自己搭建一套数据清洗的服务(ETL)。
  • Ckafka 连接器的数据处理功能提供了根据正则表达式提取消息内容的能力,正则提取采用的是开源的正则提取包 re2 。 Java 的标准正则表达式包 java.util.regex 以及其他被广泛使用的正则表达式包如 PCRE、Perlre和 Python(re),都使用回溯实现策略,即当一个 pattern 出现两个替代方案a|b 的时候,引擎将首先尝试匹配子模式a,如果匹配失败,它将重置输入流并尝试匹配子模式 b。
  • 操作场景: JSON 目前是互联网信息传递中最通用的格式协议之一。目前数据处理也主要围绕 JSON 数据格式进行解析处理。 JSONPath 是针对 JSON 格式推出的消息查询语法规范。在数据处理中,不仅能够使用简单的 JSONPath 语法,快速获取复杂嵌套 JSON 结构体的某一成员的值;还能使用 JayWay 库的扩展函数,聚合或操作某一类型的成员字段。
  • 操作背景: 通过 CKafka 连接器连接 CVM 自建的服务时,根据腾讯云网络团队制定的标准跨 VPC 资源访问方案,需要先将自建服务挂载到 CLB(负载均衡)上,才能实现跨 VPC 的资源访问。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部