百度智能云云数据库RDS克隆实例恢复数据最佳实践

云数据库 RDS

简介/价格/文档

百度智能云云数据库RDS克隆实例恢复数据最佳实践

文档简介：

在数据库的使用过程中，如果遇到误操作导致的数据删除、数据篡改等问题，可以通过RDS克隆实例功能实现数据修复。克隆实例的数据恢复方式分为如下两种： for MySQL 版 for SQL Server 版 for PostgreSQL 版

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

概述

在数据库的使用过程中，如果遇到误操作导致的数据删除、数据篡改等问题，可以通过RDS克隆实例功能实现数据修复。克隆实例的数据恢复方式分为如下两种：

按时间点恢复：将数据恢复到指定时间点的数据快照（精确到秒），适合误操作后的数据恢复场景，恢复过程包含全量恢复和增量恢复
按备份集恢复：将数据恢复到指定备份集的数据快照，适合业务压测和集群拆分扩展等需求，恢复过程仅进行全量恢复

使用说明

前置条件

RDS实例运行状态正常
主实例备份状态正常、备份集正常

注意事项

克隆实例的创建过程需要先下载备份数据和增量binlog日志，然后进行全量数据恢复和增量数据恢复，因此数据量越大、写入并发越高则创建克隆实例的耗时越长
克隆实例的数据是所选时间点的静态快照，不包含克隆实例所选时间点之后新写入的增量数据
克隆实例创建成功后，需要导出克隆实例中待恢复表的数据，并与线上数据进行比对校验，提取需要恢复的数据内容，然后谨慎操作恢复数据到线上生产环境
常见的数据恢复过程举例：

时间点	操作日志
09:18	误操作删除了部分数据
10:10	感知到数据异常问题
10:15	操作RDS克隆实例功能，恢复的时间点指定到09:18
12:10	克隆实例恢复完成（注意：克隆实例中不包含09:18后新写入的数据）
12:30	经过数据比对和校验，将误操作涉及到的部分数据恢复到线上

使用克隆实例功能恢复数据案例

确定克隆实例的操作目标（恢复范围）

因在09:18:02的时候,做了一个误操作, 误将表t_order的字段status=0的数据误删除,需要恢复t_order表数据到09:18:02时刻的快照，使用克隆实例的按时间点恢复功能，选择还原时间点:2019-07-02 09:18:02
选择按照时间点克隆实例(已经确认有成功的历史备份)
克隆实例完成后,检查克隆实例上的数据是否符合预期
确认恢复出来的数据快照符合预期后，将数据恢复到线上，为了不直接替换线上表，先将克隆实例的t_order表改名
```
rename table t_order to t_order_bk_091802;
```

从克隆实例导出数据，并且导入到线上实例，示例如下：

主库ip:10.100.0.7
克隆实例ip:10.100.0.14
#在bcc上开启screen，避免大表导出导入过程中session中断
screen -S mysql_importdata
#设置linux session时间,避免导出后linux进程因为闲置退出
export TMOUT=0
#数据导出并通过管道同时导入
# --set-gtid-purged=OFF 导出的数据时,不导出gtid,避免导入时,从库因为gtid已经执行而跳过,导致恢复的数据只在主库存在
# --skip-lock-tables 不加锁,避免锁住线上表
#  --quick 避免导出的数据写入缓存,影响线上服务
#  --hex-blob 将blob数据转为16进制,避免导入后数据不一致
#  --single-transaction 通过单一事务保证数据一致
#  --tz-utc=0 执行utf时区,保证时间数据一致
mysqldump -h 10.100.0.14 -uxx -ppassword --set-gtid-purged=OFF --skip-lock-tables   --quick  --hex-blob

--single-transaction --tz-utc=0   baidu_dba t_order_bk_091802 | mysql -h 10.100.0.7  -uXXX -pXXX dba_baidu baidu_dba

数据校验

查询新表和克隆实例恢复出来的表之间的数据差异，判断恢复后需要补入哪些数据。具体校验方法可根据客户业务需要校验(比如可以将数据导出到文件,通过文件进行diff)
```
如本例，通过校验,发现id在1~172631范围的数据误删除,需要恢复
```

补入原表的新数据

#将原表数据补入新的线上表
begin; 
insert into t_order(data,status) select data,status from  t_order_bk_091802 where id>=1 and id <=172631

 ; #补入后再检查 select status, count(1),min(id),max(id) from t_order where id>=1 and id <=172631 ; #符合预期,提交事务 commit;

常见问题和解决办法

bcc上使用mysqldump导出报错: 比如: mysqldump: unknown variable 'set-gtid-purged=OFF'

原因：排除掉选项字母写错,密码写错等原因，主要的问题就是使用mysqldump版本太低，需要升级，例如：
```
mysqldump --version
mysqldump Ver 10.13 Distrib 5.1.73, for redhat-linux-gnu (x86_64)  #这是默认的版本太低,需要升级
```
解决: 下载最新版的mysql到bcc上编译安装,或者从其他曾经安装过高版本mysql的bcc上复制一份 mysqldump 和mysql文件.
导出命令报错: ./mysqldump: Permission denied

原因：一般是 mysqldump没有执行权限.授权执行即可

解决：chmod a+x mysqldump
数据校验如何做

解决: 若已知的误操作的sql，可以将误操作的sql，改写为查询sql，然后对比数据；或者将数据查询出来输出到文本文件,然后进行文本比对

相似文档

百度智能云云数据库RDS代理实例使用限制
读写分离原则：事务、写请求或同一个session写请求之后一段时间（默认200ms）内的读，会发往主库。读写分离不保证非事务读的一致性，业务上有一致性需求的查询，请封装到事务。对业务要求：业务有连接探活或超时机制。超时时间为：前端超时时间 < 代理超时时间 < MySQL超时时间。业务端有重试机制。 for MySQL 版 for SQL Server 版 for PostgreSQL 版
百度智能云云数据库RDS MySQL无主键表导致的复制延迟问题
在生产环境中，经常会遇到这样的情况：客户在主实例对一个没有索引的表执行大批量数据的update或delete操作。如果主从采用ROW模式复制，主库只需要全表扫描一次，从库却需要对主库影响的每一行数据都做一次全表扫描，往往会造成从库非常大的同步延迟，这种情况一般不能被业务所容忍。 for MySQL 版
百度智能云云数据库RDS 为什么mysql的ibdata1文件会不断增大
DBA在运维数据库的过程中，常常会有这样的烦恼：InnoDB存储引擎的共享表空间文件ibdata1逐步增大，更严重甚至将磁盘打满影响服务。此篇文章主要围绕两个问题进行分析： ibdata1文件为什么会增大？ ibdata1文件在同集群的主从库间并不一定同步增长？ for MySQL 版
百度智能云云数据库RDS使用mysqldump导入GeneratedColumn报错问题
MySQL在5.7版本中提供了Generated Column的功能，它可以通过函数计算获得新的一列数据，我们可以通过在虚拟列加索引的方式提高查询效率、分区表可使用虚拟列进行分区等。 for MySQL 版
百度智能云云数据库RDS MySQL5.7ibtmp暴涨导致磁盘打满问题
MySQL从5.7.1版本开始，临时表的存放由之前的临时文件可替换成采用独立的临时表空间形式，命名为ibtmp1；由innodb_temp_data_file_path参数可配置临时表空间相关参数。MySQL将临时表空间从系统表空间 (system tablespace) 文件中独立出来，该共享临时表空间用于存储非压缩 InnoDB 临时表 (non-compressed InnoDB temporary tables)、关系对象 (related objects)、回滚段 (rollback segment) 等数据。 for MySQL 版

文档中心

全民上云·上云补贴申领

免费试用（限企业）

概述

使用说明

前置条件

注意事项

使用克隆实例功能恢复数据案例

常见问题和解决办法