上云无忧 > 文档中心 > 腾讯云消息队列 RocketMQ - 监控告警
消息队列 RocketMQ 版
腾讯云消息队列 RocketMQ - 监控告警

文档简介:
操作场景: TDMQ RocketMQ 支持监控您账户下创建的资源,包括集群、Topic、Group 等,您可以根据这些监控数据,分析集群的使用情况,针对可能存在的风险及时处理。同时您也可以对监控项设置报警规则,以便数据异常时收到报警消息,及时处理风险,保障系统的稳定运行。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

操作场景

TDMQ RocketMQ 支持监控您账户下创建的资源,包括集群、Topic、Group 等,您可以根据这些监控数据,分析集群的使用情况,针对可能存在的风险及时处理。同时您也可以对监控项设置报警规则,以便数据异常时收到报警消息,及时处理风险,保障系统的稳定运行。

监控指标

TDMQ RocketMQ 版支持的监控指标如下:
分类
单位
指标
集群
Count
消息堆积条数
Count/s
计费 API 生产消费次数
Count/s
计费 API 消费限流次数
Count/s
计费 API 消费次数
Count/s
计费 API 生产限流次数
Count/s
计费 API 生产次数
Topic
Bytes/s
消息生产字节数 TPS
Count/s
消息生产条数 TPS
Count
消息堆积条数
Count/s
计费 API 消费限流次数
Count/s
计费 API 消费次数
Count/s
计费 API 生产限流次数
Count/s
计费 API 生产次数
Count/s
消息消费条数
Bytes/s
消息消费字节数
Bytes
主题存储消息量大小
Group
Count
消费者数量
Count
消息堆积条数
Count/s
计费 API 消费限流次数
Count/s
计费 API 消费次数
Count/s
消息消费条数
Bytes/s
消息消费字节数

查看监控数据

1. 登录 RocketMQ 控制台
2. 在左侧导航栏单击监控大盘,选择好地域和要查看的集群。
3. 在监控页面选择要查看的资源页签,设置好时间范围后,查看对应的监控数据。
图标
说明


单击可调整图表时间粒度,支持1分钟、5分钟和1小时。


单击可刷新获取最新的监控数据,支持设置30s、1min和5min时间间隔自动刷新监控数据。


单击可将图表复制到 Dashboard,关于 Dashboard 请参见 什么是 Dashboard


在集群监控页面,您可以选择集群内的多个 Topic,查看多个 Topic 的指标对比,如下图所示。

同理,您可以查看某个Topic下,订阅关系内的多个 Group 的相关指标对比;也可以查看某个 Group 下,订阅关系内的多个 Topic 的相关指标对比。

配置告警规则

新建告警规则

您可以为监控指标配置告警规则,当监控指标达到设定的报警阈值时,腾讯云可观测平台可以通过邮件、短信、微信、电话等方式通知您,帮助您及时应对异常情况。
1. 在集群的监控页面,单击下图告警按钮跳转至 腾讯云可观测平台控制台 配置告警策略。

2. 在告警策略页面,选择好策略类型和要设置告警的实例,设置好告警规则和告警通知模板。
策略类型:选择消息队列 TDMQ/RocketMQ5集群
告警对象:选择需要配置告警策略的 RocketMQ 实例。
触发条件:支持选择模板手动配置,默认选择手动配置,手动配置参见以下说明,新建模板参见 新建触发条件模板
说明
指标:例如“消息生产条数TPS”,选择统计粒度为1分钟,则在1分钟内,消息生产条数TPS连续N个数据点超过阈值,就会触发告警。
告警频次:例如“每30分钟警告一次”,指每30分钟内,连续多个统计周期指标都超过了阈值,如果有一次告警,30分钟内就不会再次进行告警,直到下一个30分钟,如果指标依然超过阈值,才会再次告警。
通知模板:选择通知模板,也可以新建通知模板,设置告警接收对象和接收渠道。
3. 单击完成,完成配置。
说明
有关告警的更多信息,请参见 腾讯云可观测平台告警服务

新建触发条件模板

1. 登录 腾讯云可观测平台控制台
2. 配置告警规则中,单击选择模板 > 新增触发条件模板,进入触发条件列表页面。

3. 在触发条件模板页单击新建触发条件模板

4. 在新建模板页,配置策略类型。
策略类型:选择消息队列 TDMQ/RocketMQ5
使用预置触发条件:勾选此选项,会出现系统建议的告警策略。

5. 确认无误后,单击保存
6. 返回新建告警策略页,单击刷新,就会出现刚配置的告警策略模板。
相似文档
  • 当一条消息从生产者发送到 TDMQ RocketMQ 版服务端,再由消费者进行消费,TDMQ RocketMQ 版会完整记录这条消息中间的流转过程,并以消息轨迹的形式呈现在控制台。 消息轨迹记录了消息从生产端到 TDMQ RocketMQ 版服务端,最后到消费端的整个过程,包括各阶段的时间(精确到微秒)、执行结果、生产者 IP、消费者 IP 等。
  • 为了给业务处理业务失败,给消息消费失败的情况兜底,保证消息生命周期的完整,RocketMQ 实现了消费失败后重试的策略。 如果您使用的是 RocketMQ 4.x 客户端,消息的重试次数以您在客户端内设置消息重试次数为准。
  • 操作场景: 死信队列是一种特殊的消息队列,用于集中处理无法被正常消费的消息的队列。当消息在达到一定重试次数后仍未能被正常消费,TDMQ RocketMQ 版会判定这条消息在当前情况下无法被消费,将其投递至死信队列。
  • 消息轨迹记录了消息从生产端到 TDMQ RocketMQ 版服务端,最后到消费端的整个过程,包括各阶段的时间(精确到微秒)、执行结果、生产者 IP、消费者 IP 等。
  • 操作背景: 由于 RocketMQ 需要访问其他云产品的 API,所以需要授权 RocketMQ 创建服务角色。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部