上云无忧 > 文档中心 > 天翼云应用运维管理使用教程 - 创建告警规则
应用运维管理
天翼云应用运维管理使用教程 - 创建告警规则

文档简介:
通过告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生告警;当没有指标数据上报时,会产生数据不足事件,以便您在第一时间发现异常并进行处理。
*产品来源:中国电信天翼云。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

通过告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生告警;当没有指标数据上报时,会产生数据不足事件,以便您在第一时间发现异常并进行处理。

例如,在日常运维中,主机CPU使用率过高可能导致主机死机或重启。这种情况下,您可通过告警规则设置阈值条件,当主机的CPU使用率超过85%时,通过告警进行预警,以便及时获取资源运行状态等信息并采取相应措施,避免因资源问题造成业务损失。

注意事项

告警规则不能超过1000条。当告警规则数量达到上限时,请删除不需要的告警规则后重新创建。

自定义告警规则

步骤 1     在AOM左侧导航栏中选择“告警 > 告警规则”,在右上角单击“添加阈值”。

步骤 2     自定义告警规则。

1.        选择资源:在“阈值名称”文本框中输入规则名称,选择资源类型,在资源树上选择待监控的资源,单击“下一步”。

  • 资源树上最多可选择10个资源。

  • 当选择多个资源时,创建操作完成后,会创建多个告警规则,每个资源对应一个告警规则。规则命名方式为:您在“阈值名称”文本框中设置的告警规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。

选择资源


2.        定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数。

  • 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。

  • 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。

  • 统计方式:指标数据按照所设置的统计方式进行聚合。

  • 统计周期:指标数据按照所设置的统计周期进行聚合。

步骤 3     单击“添加”,完成创建。如下图所示,创建了多个告警规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。

如下图所示,对于一个告警规则,其监控对象为某个组件,当组件的CPU内核占用超过3时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警 > 告警规则”,在告警列表中查看该告警。

告警规则

相似文档
  • 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。
  • 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。
  • 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。
  • 主机包括弹性云服务器(ECS)、物理机。AOM既可监控通过创建CCE、ServiceStage集群时创建的主机,也可监控非CCE、ServiceStage集群环境下直接创建的主机(直接创建的主机操作系统需满足操作系统及版本,且创建后需要给主机安装ICAgent,安装操作详见安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4、IPv6。
  • 容器监控和组件监控的区别在于所监控的对象不同。组件监控是全量监控,监控对象为通过CCE部署的工作负载,通过ServiceStage创建应用,或直接在ECS或BMS上部署的组件。容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建应用。详细操作请参见组件监控。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部