免责声明: 本文档可能包含第三方产品信息,该信息仅供参考。阿里云对第三方产品的性能、可靠性以及操作可能带来的潜在影响,不做任何暗示或其他形式的承诺。
Percona Toolkit包含多种用于MySQL数据库管理的工具。本文主要介绍常用的pt-online-schema-change和pt-archiver搭配RDS MySQL的使用方法。
注:
- pt-online-schema-change和pt-archiver工具均须指定--no-version-check选项方能搭配RDS MySQL实例使用。
- 本文样例使用Percona Toolkit 2.2.17版本测试。
- 本文样例仅做为样例使用,不承担任何因此示范导致的问题责任。具体操作手册请参考Percona Toolkit的相关文档。
阿里云提醒您:
- 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。
- 如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改,建议提前创建快照或开启RDS日志备份等功能。
- 如果您在阿里云平台授权或者提交过登录账号、密码等安全信息,建议您及时修改。
pt-online-schema-change提供在线修改表结构等功能,搭配RDS MySQL 5.5使用可以避免在修改表结构的过程中阻塞应用对表数据的访问。由于RDS MySQL 5.6支持online-ddl功能,可以直接在业务低峰期进行操作,也可以结合pt-online-schema-change使用。
CREATE TABLE `x` ( `id` int(11) NOT NULL AUTO_INCREMENT, `password` varchar(10) DEFAULT NULL, `recommend_level` double(5,0) DEFAULT NULL, `name` varchar(30) DEFAULT '101' COMMENT 'change', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8mb4;
pt-online-schema-change --no-version-check --execute --alter "add column c1 int" h=xxx.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=x
注:系统显示类似如下。
- h=xxx.mysql.rds.aliyuncs.com:RDS实例地址。
- P=3306:RDS实例端口。
- u=jacky:RDS实例用户。
- p=xxx:RDS实例用户密码。
- D=jacky:RDS实例数据库。
- t=x:RDS实例表名称。
show create table x \G系统显示类似如下。
pt-online-schema-change --no-version-check --execute --alter "drop column c1" h=xxx.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=x
show create table x \G系统显示类似如下。
pt-online-schema-change --no-version-check --execute --alter "modify column c1 bigint unsigned" h=xxx.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=x
show create table x \G系统显示类似如下。
pt-online-schema-change --no-version-check --execute --alter "add key idx_c1 (c1)" h=xxx.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=x
show create table x \G系统显示类似如下。
pt-online-schema-change --no-version-check --execute --alter "drop key idx_c1" h=xxx.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=x
show create table x \G系统显示类似如下。
pt-archiver是Percona官方提供的归档工具,用于归档大型表中的记录到另一个表或文件。
CREATE TABLE `my_tab` ( `id` bigint(11) NOT NULL AUTO_INCREMENT, `areaID` varchar(50) DEFAULT NULL, `area` varchar(60) DEFAULT NULL COMMENT '中文注释测试', `father` varchar(12) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_area` (`area`) ) ENGINE=InnoDB AUTO_INCREMENT=3162 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT KEY_BLOCK_SIZE=8;
select count(*) from my_tab;系统显示类似如下。
pt-archiver --source h=xxx.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=my_tab --charset=utf8 --file '/var/tmp/%Y-%m-%d-%D.%t' --where "id > 3008" --limit 1000 --commit-each --no-version-check
注:
- h=xxx.mysql.rds.aliyuncs.com:RDS实例地址。
- P=3306:RDS实例端口。
- u=jacky:RDS实例用户。
- p=xxx:RDS实例用户密码。
- D=jacky:RDS实例数据库。
- t=my_tab:RDS实例表名称。
- --source:指定要被归档的数据源。
- --charset=utf8:使用的字符集,需与表字符集一致,否则指定--no-check-charset参数。
- --file:指定目标操作系统文件名。
- --where "id > 3008":指定where过滤条件,过滤出要归档的数据。
- --limit 1000:每条语句读取和归档的数据行数,默认是1。
- --commit-each:每次获取和归档数据后,commit提交。
- --no-version-check:不做版本检查,RDS MySQL必须设置。
select count(*) from my_tab;系统显示类似如下。
wc -l /var/tmp/xxx-jacky.my_tab系统显示类似如下。
可以将数据归档到同实例不同库下的表中,也可以将数据归档到不同实例下的表中。归档操作前,目标表要存在。
pt-archiver --source h=rds01.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=my_tab --charset=utf8 --dest h=rds01.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=my_db,t=my_tab --where "id > 2000" --limit 1000 --commit-each --no-version-check
注:--dest为指定归档到的目标表。
select count(*) from my_tab;系统显示类似如下。
select count(*) from jacky.my_tab;系统显示类似如下。
pt-archiver --source h=rds01.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=my_tab --charset=utf8 --dest h=rds02.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=my_tab --where "id > 500" --limit 1000 --commit-each --no-version-check
select count(*) from my_tab;系统显示类似如下。
select count(*) from jacky.my_tab;系统显示类似如下。
当需要归档的数据量很大,比如第一次做归档的时候,可以考虑通过尝试bulk insert的方式来加速归档过程,命令如下所示。
pt-archiver --source h=rds01.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=rd_test,t=large_tab_04 --charset=utf8 --dest h=rds02.mysql.rds.aliyuncs.com,P=3306,u=jacky,p=xxx,D=jacky,t=large_tab_04 --where "1=1" --limit 5000 --commit-each --bulk-insert --no-version-check --statistics
注:
- --bulk-insert:批量插入数据,会自动启用--bulk-delete和--commit-each,每次插入行数通过--limit选项指定。
- --statistics:显示pt-archiver本次操作的统计信息。