上云无忧 > 文档中心 > 百度智能云云数据库RDS监控报警配置
云数据库 RDS
百度智能云云数据库RDS监控报警配置

文档简介:
RDS实例创建完成后会默认自动配置两个报警策略(磁盘使用率和CPU占用率),为了更及时准确的了解数据库运行状况,建议客户自助在BCM中配置更详细的监控策略。BCM中提供了RDS相关的监控数据采集,用户可根据实际业务进行选择和配置。 for MySQL 版 for SQL Server 版 for PostgreSQL 版
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

背景

RDS实例创建完成后会默认自动配置两个报警策略(磁盘使用率和CPU占用率),为了更及时准确的了解数据库运行状况,建议客户自助在BCM中配置更详细的监控策略。BCM中提供了RDS相关的监控数据采集,用户可根据实际业务进行选择和配置。

BCM for RDS监控配置方法

请参考:《监控报警操作指南》

RDS for MySQL各监控项报警阈值推荐

监控项 统计周期 统计方法 推荐阈值 重复几次后报警
CPU占用率 1min 平均值 > 80% 3
数据空间磁盘使用率 1min 平均值 > 80% 3
系统空间磁盘使用率 1min 平均值 > 80% 3
内存使用率 1min 平均值 > 90% 3
慢查询 1min 平均值 > 当前实例CPU核数的2倍 3
主从延迟 1min 平均值 > 300秒 3
总连接数 1min 平均值 > 当前实例参数max_connections的80% 3
活跃连接数 1min 平均值 > 当前实例CPU核数的2倍 3
最大事务执行时间 1min 平均值 > 60秒 3

RDS磁盘监控最佳实践

磁盘监控曲线

  • 数据空间磁盘使用率:

    说明: 数据空间磁盘使用率,计算公式:数据使用磁盘空间/购买的磁盘空间,即表示用户数据((表文件,共享表空间,临时文件)/购买的磁盘空间)。如下图的蓝色监控曲线 影响:如果数据磁盘空间使用100%,则rds实例会被设置为只读模式,用户无法写入数据

  • 系统空间磁盘使用率:

    说明:系统空间磁盘使用率,计算公式:(数据使用磁盘空间+日志使用磁盘空间)/购买的磁盘空间,即(表示用户数据+log(mysql.log,slow.log,mysql.err,binlog,系统采集日志))/(购买的磁盘空间)。 如下图红色监控曲线 影响: 如果系统空间磁盘使用100%,则因为磁盘写满导致无法继续写入数据

案例

某客户购买一个双机高可用实例,初始化数据后,看到磁盘监控如下:

数据空间磁盘使用:9.19%

系统空间磁盘使用:14.42%

为了数据安全和审计,开启了全日志和较长周期保留binlog,经过一段时间运行,收到rds电话通知:磁盘增长迅速一个小时磁盘使用了87%,存在磁盘打满风险。如下图:

授权dba查看磁盘增长快速的原因:因为不规范使用sql,导致mysql.log, slow.log, mysql.err等日志文件快速增长。

解决办法是合理升配磁盘套餐,并且优化sql之后,清理异常产生的log文件,系统磁盘使用率降回。如下图:

相似文档
  • 大事务是指运行时间比较长,操作的数据比较多的事务。大事务风险有很多,主要集中如下两点: 锁定太多的数据,造成大量的阻塞和锁超时,影响其他线程正常执行SQL语句。 执行时间长,容易造成主从延迟。 for MySQL 版 for SQL Server 版 for PostgreSQL 版
  • CPU占用率监控RDS实例的CPU使用情况。当CPU占用率高时,说明数据库压力大,通常会导致如下现象: 数据库响应变慢,SQL执行耗时变长,导致请求超时。 数据库读和写的QPS降低。 for MySQL 版 for SQL Server 版 for PostgreSQL 版
  • 数据库性能的优劣,直接关系到系统执行的效率和稳定性,如果出现性能问题不仅会损害公司形象,也可能会造成公司资金方面的损失。慢SQL是影响数据库性能很重要的一个方面。对于海量数据,劣质SQL和优质SQL之间的速度差别可能达到上百倍,解决慢SQL对解决数据库性能问题会起到事半功倍的效果。 for MySQL 版 for SQL Server 版 for PostgreSQL 版
  • 慢日志明细: 历史慢SQL实时统计,方便数据库管理员对慢查询语句进行分析,快速定位系统正在进行的性能问题。 错误日志明细: 开启和关闭MySQL服务的时间和服务运行中异常情况的统计,用于MySQL服务出现异常时,及时查找原因。 for MySQL 版
  • 数据容灾对于每个存储系统来说,都是不可缺少的,数据库也不例外。对于数据可用性有强需求的业务场景如金融、游戏业务等场景尤其如此。数据库容灾主要通过多副本架构来保证,同时可以通过定时备份数据、主从同步数据方法来保障数据高可用。在复杂网络情况,用户往往还会需要能有跨机房、跨可用区、跨地域的数据容灾能力。 for MySQL 版 for SQL Server 版 for PostgreSQL 版
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部