上云无忧 > 文档中心 > 百度智能云云监控报警回调
百度智能云云监控报警回调

文档简介:
通过报警回调,可实现将BCM云监控的报警通知发送到您指定的URL。您可以自由、灵活的处理各类告警消息,BCM支持通过 HTTP/HTTPS协议 的 POST 请求推送到可访问公网 URL ,您可基于回调接口推送的报警信息做进一步的处理。如需通过企业微信、钉钉、如流等办公软件接收报警通知,请参见webhook使用说明。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

功能简介

通过报警回调,可实现将BCM云监控的报警通知发送到您指定的URL。您可以自由、灵活的处理各类告警消息,BCM支持通过 HTTP/HTTPS协议 的 POST 请求推送到可访问公网 URL ,您可基于回调接口推送的报警信息做进一步的处理。如需通过企业微信、钉钉、如流等办公软件接收报警通知,请参见webhook使用说明。

报警回调使用说明

  • 报警回调接口:您需要提供能接收 HTTP/HTTPS 协议的POST 请求,并且公网可访问的 URL 地址,作为回调地址。
  • 报警回调触发:如果填写了报警回调地址,触发逻辑与告警短信、邮件、电话一致,当创建的告警策略被触发、告警策略恢复时,均会通过报警回调接口发送告警消息。
  • 绑定报警回调接口:您可在创建告警策略详添加回调接口。一个告警策略只可绑定一个报警回调 URL。
  • 返回内容:当向绑定的 URL 发出报警信息后,我们需要接收到标识成功的返回内容(httpCode = 200),以表明已成功接收信息;否则我们将重复发送告警信息,最多重试三次,超时时间为5s(重试机制)

操作步骤

目前云产品监控提供了报警回调功能,入口有三处:

  • 入口一:统一的创建报警策略入口
  1. 在左侧导航栏中点击<报警管理>-<报警策略>,在云产品监控的策略列表下,点击“添加策略”。

  1. 在创建策略页面,开启报警回调功能,选择协议方式,输入公网可访问的URL地址。

注意:回调token用来验证您收到的报警消息是否由百度云监控BCM发出。由BCM侧自动生成一个token,点击<更换一个>按钮可更换回调token,同时您需要更换回调程序中的校验Token,回调时使用最新的Token。

  • 入口二:为某个云服务下单个实例创建报警策略入口
  1. 在左侧导航栏中点击<云产品监控>,点击要查看的云产品,进入该云产品的实例列表页面。如查看云服务器BCC监控数据,点击<云服务器监控>,进入“云服务器列表”页面。选择对应的实例点击“添加策略”。

  1. 在创建策略页面,开启报警回调,输入需要的信息。

  • 入口三:创建报警动作入口
  1. 在左侧导航栏中点击<报警管理>-<报警动作>,在报警动作列表页面,点击“创建动作”。

  1. 在添加报警动作页面,勾选“报警回调”,输入需要的信息。

说明: 报警动作入口支持添加多个回调地址(上限5个)。

webhook使用说明

  • 企业微信
  1. 登录企业微信,打开需要接收告警通知的企业微信群。
  2. 添加群机器人后,复制webhook地址,参考操作步骤填写到“报警回调”中即可。
  3. 配置成功后,当报警通知被触发时,您可以在企业微信群收到报警通知。
  • 钉钉
  1. 登录钉钉,打开需要接收告警通知的钉钉群,添加群机器人。
  2. 填写表单,“安全设置”模块勾选“自定义关键词”选项,建议填写“报警”作为关键词。

说明:勾选自定义关键词复选框,输入添加关键词,最多可以设置10个关键词,消息中至少包含其中1个关键词才可以发送成功。例如添加了一个自定义关键词:报警,则这个机器人所发送的消息,必须包含报警这个词,才能发送成功。

  1. 群内添加钉钉机器人,复制webhook地址,参考操作步骤填写到“报警回调”中即可。
  2. 配置成功后,当报警通知被触发时,您可以在钉钉群收到报警通知。
  • 如流
  1. 登录钉钉,打开需要接收告警通知的钉钉群。
  2. 群内添加钉钉机器人,复制webhook地址,参考操作步骤填写到“报警回调”中即可。
  3. 配置成功后,当报警通知被触发时,您可以在如流群收到报警通知。

POST方式参数说明

指标报警POST方式参数说明

参数 说明
alertId 告警ID
userId 账号ID
alarmName 报警策略名称
scope 云产品名称
policyType 策略类型(指标报警和事件报警之一,Metric代表是指标报警,Event代表事件报警)
alertStartTimestamp 发生告警的时间戳
region 报警对象所在的地域
monitoringObject 发生报警的对象
alarmLevel 报警等级状态。根据实际情况返回严重、通知、重要、警告四种状态中的一种
formula 报警条件
currentValue 报警发生或恢复时监控项的当前值
taskTimestamp 报警回调发送时间
signature 签名

事件报警POST方式参数说明

参数 说明
alarmName 报警策略名称
scope 云产品名称
alertStartTimestamp 发生告警的时间戳
alertContent 事件详情
taskTimestamp 报警回调发送时间
signature 签名

signature值是与alertId、您配置时生成的token和taskTimestamp这3个参数连接并用MD5算法加密后的值相等来校验。

URL回调实例

下面是URL回调的使用实例,BCM发起的POST方式URL回调请求:

POST http://127.0.0.1:8201/callback
POST: alertId=dffvsdfsdffa&userId=a0345uiiiooo&alarmName=test&scope=BCE_BCC&policyType
=Metric&alertStartTimestamp=1597489020&region=华北-保定&monitoringObject=BCC实例i
-gid9sff&alarmLevel=MAJOR&formula=cpu使用率>70%
&currentValue=cpu使用率=87%&taskTimestamp=1597489090&signature=af7c6cvbnjkdfghjk

在callback.java文件中接收POST参数并对消息进行校验:

// 从发送来的POST请求中解析出alertId、taskTimestamp 、signature这3个参数。使用alertId、token(创建报警策略时生成的token)
和taskTimestamp 这3个参数连接并用MD5算法加密后的值来校验消息。
如果校验成功,则说明此消息为百度云发出,否则为非法请求,不予处理。其中taskTimestamp可以用来做过期验证,
如果时间戳与用户当前时间时间间隔大于某个周期(如10分钟),则用户可自行丢弃请求。

if (md5(alertId + token + taskTimestamp) == signature) {
    ..........
}

相似文档
  • 报警动作是报警通知方式和通知对象的模版,同一报警动作可重复使用。通过配置报警动作,可以灵活的选择邮件、短信、电话等报警通知方式和联系人或者联系人群组作为报警接收对象,不同的报警策略可选择相同的报警动作。 您可以通过修改报警动作实现不同报警策略的报警通知方式和报警接收对象的一键修改,提高您报警通知方式、报警接收对象的管理效率。
  • 报警模板是云监控报警服务下提供预置报警规则以供后续报警策略中高效复用的功能,提升用户对于同一个云服务下的单个或多个资源批量创建报警规则的效率。报警模板中根据各云服务的指标属性提供了推荐使用的报警规则,同时也支持自定义规则来创建报警模板。
  • 当报警发生后,您可以在报警历史页面通过产品类型、报警等级、当前状态等条件筛选想要关注的报警信息。 查看报警历史: 1.登录百度智能云,选择云监控BCM,在左侧导航栏中点击<报警管理>-><报警历史>,进入报警历史列表页面。
  • 应用是指为业务提供服务的服务端模块,由多个功能相同、实现一致的实例组成,多个应用组合起来构成一个完整的业务系统。您可以根据自己的系统架构,在BCM应用监控中自由的组织和管理应用。 针对应用运行过程中可能出现的异常问题,BCM提供了进程、端口和日志监控等监控方式,整体构建多角度的应用监控体系,保障您可更加高效的掌握应用运行状态。
  • 进程监控通过监控应用内各个实例所在进程的运行状态,实时的监控其CPU、内存、磁盘等资源使用情况,您可以通过监控趋势图图表实时查看监控指标及配置报警等操作。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部