文档简介:
百度智能云Elasticsearch 提供监控指标、报警和实例组功能。
- 监控指标:为运行中的集群提供多项监控指标,用户可根据监控指标,实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
- 报警:报警功能支持用户通过配置监控报警实时掌控集群、节点状态,及时查收报警通知,提前做好问题防御。
- 实例组:支持将多个百度智能云 Elasticsearch 实例添加至一个实例组,便于按组查看实例监控数据并配置报警策略,在实例较多时能够大幅提升监控数据查看及报警配置效率。
监控指标
查看监控指标
1.登录百度智能云 Elasticsearch 控制台。
2.在集群列表中点击目标集群ID。
3.在集群信息页左侧的导航栏中选择监控,右侧展示集群内各节点的性能指标和负载均衡端口运行情况。
4.选中想要查看的监控对象和监控指标,监控图表就展示在下方。
指标概览
节点指标:CPU使用率、内存使用量、磁盘空间使用量、磁盘空间最大使用量、JVM年轻代使用率、JVM老年代使用率。
负载均衡端口指标:负载均衡服务端口健康检查、负载均衡服务端口网络流量、负载均衡服务端口网络数据包和负载均衡服务端口并发连接数。负载均衡指标始终展示,无需手动选择。
更多指标监控功能开发中,敬请期待。
报警
配置报警策略
1.进入监控页面。
2.点击右上角的 "报警详情",进入 BCM 的报警策略页面。
3.点击左上角“添加策略”按钮,填写基本信息、策略规则和报警通知,创建报警策略。
其中报警规则可选已有的监控功能指标,包括:CPU使用率、内存使用量、磁盘空间使用量、磁盘空间最大使用量、JVM年轻代使用率、JVM老年代使用率。
更多创建、查看报警策略功能说明,可参考报警策略
实例组(批量观测及批量报警)
添加实例组
目前百度智能云 Elasticsearch 实例组只支持节点维度,可选择多个节点(实例)组成实例组,按组对节点(实例)进行监控和配置报警策略。
1.进入云监控 BCM 管控平台 云监控BCM。
2.在侧边栏中点击“实例组”。
3.点击“添加实例组”按钮,创建新的实例组。
4.填写基本信息,选择想添加到实例组的多个实例,点击保存即可。
查看和管理实例组
1.在实例组列表中,选择产品为“Elasticsearch”,可查看现有Elasticsearch实例组。
2.点击操作列中的“删除组”按钮,可删除实例组。
3.点击实例组名称,可修改实例组中实例内容。
添加报警策略
为实例组添加报警策略,实现多节点(实例)监控指标批量报警。
1.实例组列表,点击操作列的“添加报警策略”按钮。
2.填写基本信息,配置策略规则和报警通知。
3.配置后点击保存,完成实例组报警策略配置。
当实例组中的任一实例的策略规则超过了阈值,就会触发警报。
查看和编辑报警策略
1.点击 Elasticsearch 实例组名称。
2.在详情页左侧侧边栏中选择“报警策略”,可查看此实例组已配置的报警策略。
3.根据列表中的“是否开启通知”功能,开启和关闭报警策略。点击操作列中的“编辑”按钮,可继续编辑报警策略。操作列中的“删除”按钮,可删除对应报警策略。
4.左上角“创建策略”按钮,支持为实例组创建新的报警策略。
更多实例组功能说明,可参考实例组