十分钟了解RDS
- 十分钟了解云数据库RDS
云数据库RDS简介
- 什么是云数据库RDS
- 产品优势
- 产品系列
- 实例规格
  - 实例规格族
  - 实例规格表
- 存储类型
- 典型应用
- RDS使用须知
- 【通知】2月19日起新加坡地域逐步上线单库单表恢复功能
- 【通知】2月25日覆盖性恢复功能下线
- 【重要】RDS网络链路升级说明
云数据库RDS价格
- 计费方式与收费项
- 变配的计费规则
- 续费
- 到期或欠费的影响
- 查看消费明细
RDS for MySQL 快速入门
- 使用限制
- RDS for MySQL使用流程
- 创建RDS for MySQL实例
- 初始化配置
  - 创建账号和数据库
- 连接MySQL实例
- 扩展实例
  - 只读实例
    - MySQL只读实例简介
    - 创建MySQL只读实例
  - 灾备实例
RDS for MySQL 用户指南
- 前言
- 数据迁移/同步
  - 数据迁移/同步方案概览
  - 使用 DTS 迁移 MySQL 数据
  - 使用 mysqldump 迁移 MySQL 数据
  - RDS 实例间数据迁移
  - 从第三方云数据库迁移到RDS
  - 从自建数据库迁移到 RDS
  - 迁移 RDS for MySQL 数据到本地 MySQL
  - 压缩数据
  - 数据集成
- 计费管理
  - 按量付费转包年包月
  - 开通或修改自动续费
  - 手动续费
- 待处理事件
- 实例管理
  - 重启实例
  - 设置可维护时间段
  - 迁移可用区
  - 切换主备实例
  - 修改数据复制方式
  - 释放实例
  - 升级数据库版本
  - 升级内核小版本
  - RDS for MySQL版本说明
  - 变更配置
  - 设置实例参数
  - 实例回收站
- 只读实例与读写分离
  - MySQL只读实例简介
  - 创建MySQL只读实例
  - 读写分离简介
  - 开通读写分离
  - 修改延迟阈值和读权重分配
  - 切换读写分离地址类型
  - 关闭读写分离
  - 监控读写分离性能
  - 测试读写分离性能
  - 测试读写分离效果
    - 通过SQL审计验证
    - 通过内部SQL命令验证
  - 验证读权重分配
  - 系统权重分配规则
  - 读写分离常见问题
  - 只读实例延时复制
- 账号管理
  - 创建账号
  - 重置密码
  - 修改账号权限
  - 授权服务账号
  - 删除账号
- 数据库管理
  - 创建数据库
  - 删除数据库
- 数据库连接
  - 关闭数据库代理模式
  - 切换网络类型
  - 经典网络平滑迁移到VPC的混访方案
  - 设置连接地址
- 数据库代理
- 监控与报警
  - 查看资源和引擎监控
  - 设置监控频率
  - 设置报警规则
- 数据安全性
  - SQL审计
  - 切换为高安全白名单模式
  - 设置 SSL 加密
  - 设置透明数据加密
- 日志管理
- SQL洞察
- 性能优化
- MySQL CloudDBA
  - MySQL CloudDBA简介
  - 智能优化
    - 查看实例运行状况
    - 诊断实例性能
  - 问题诊断
  - 分析SQL和会话事务
  - SQL优化
  - 查看实例性能诊断报告
- 备份数据
  - 备份MySQL数据
  - 查看备份空间免费额度
  - 下载数据备份和日志备份
  - 删除备份数据
  - MySQL设置本地Binlog
- 恢复数据
  - 恢复MySQL数据
  - MySQL单库单表恢复
- 标签管理
  - 创建标签
  - 删除标签
  - 根据标签筛选实例
- 附录
  - 添加下载备份文件权限给只读子账号
  - 通过DMS登录RDS数据库
  - 常用 SQL 命令（MySQL）
  - 查看实例的内外网地址及端口信息
RDS for SQL Server 快速入门
- 使用限制
- 使用流程
- 创建RDS for SQL Server实例
- 初始化配置
  - 创建数据库和账号
- 连接实例
- 只读实例
  - SQL Server只读实例简介
  - 创建SQL Server只读实例
- SQL Server上云评估工具
- 各版本的功能差异
- 各版本的API差异
- 存储过程
RDS for SQL Server 用户指南
- 前言
- 数据迁移
- 计费管理
- 待处理事件
- 实例管理
- SQL Server读写分离
- 账号管理
- 数据库管理
- 数据库代理
- 数据库连接
- 监控与报警
- 数据安全性
- 日志管理
- SQL Server CloudDBA
- 备份数据
- 恢复数据
- 标签管理
- 附录
  - 查看实例的内外网地址及端口信息
  - 通过DMS登录RDS数据库
RDS for PostgreSQL 快速入门
- 使用限制
- 使用流程
- 创建RDS for PostgreSQL实例
- 初始化配置
  - 创建数据库和账号
- 连接实例
- 只读实例
  - PostgreSQL只读实例简介
  - 创建PostgreSQL只读实例
- 使用 oss_fdw 读写外部数据文本文件
- 附录
  - 附录：用户及 Schema 管理
  - 版本说明
RDS for PostgreSQL 用户指南
- 前言
- 数据迁移
- 计费管理
- 待处理事件
- 实例管理
- 账号管理
  - 创建账号
  - 重置密码
- 数据库管理
  - 创建数据库
  - 删除数据库
- 数据库连接
- 监控与报警
- 数据安全性
  - SQL审计
  - 切换为高安全白名单模式
- 日志管理
- PostgreSQL CloudDBA
- 备份数据
- 恢复数据
  - 恢复PostgreSQL数据
- 标签管理
- 附录
RDS for PPAS 快速入门
- 使用限制
- 使用流程
- 创建RDS for PPAS实例
- 初始化配置
  - 创建数据库和账号
- 连接实例
- 只读实例
  - PPAS只读实例简介
  - 创建PPAS只读实例
- 使用 oss_fdw 读写外部数据文本文件
- 附录
RDS for PPAS 用户指南
- 前言
- 数据迁移
- 计费管理
- 待处理事件
- 实例管理
- 账号管理
  - 创建账号
  - 重置密码
- 数据库管理
  - 创建数据库
  - 删除数据库
- 数据库连接
- 监控与报警
- 数据安全性
  - SQL审计
  - 切换为高安全白名单模式
- 日志管理
- PPAS CloudDBA
- 备份数据
- 恢复数据
  - 恢复PPAS数据
- 标签管理
- 附录
  - 通过DMS登录RDS数据库
  - 查看实例的内外网地址及端口信息
RDS for MariaDB TX 快速入门
- 使用限制
- 使用流程
- 创建RDS for MariaDB实例
- 初始化配置
  - 创建账号和数据库
- 连接实例
RDS for MariaDB TX 用户指南
- 前言
- 数据迁移
  - RDS for MariaDB实例间数据迁移
  - 使用mysqldump迁移MariaDB TX数据
- 计费管理
- 待处理事件
- 实例管理
- 账号管理
- 数据库管理
  - 创建数据库
  - 删除数据库
- 数据库连接
  - 设置连接地址
- 监控与报警
- 数据安全性
  - 切换为高安全白名单模式
- 日志管理
- 备份数据
- 恢复数据
  - 恢复MariaDB数据
- 标签管理
- 附录
  - 查看实例的内外网地址及端口信息
时空数据库
- 简介
- 模型
- 使用进阶
  - 开启时空并行查询
  - 开启GPU加速计算
- Raster SQL参考
- PointCloud SQL参考
- Trajectory SQL参考
- Trajectory 最佳实践
- Trajecotry 常见问题
性能白皮书
- MySQL版
- PPAS版
- PostgreSQL版
- SQL Server版
安全白皮书
- 产品概述
- 产品安全方案
最佳实践
- MySQL
- SQL Server
- PostgreSQL
- 双十一背后的数据库技术
- 通过DMS将逻辑备份导入RDS数据库
API参考
- API概览
- 使用API
- 实例管理
- CloudDBA数据库性能优化
  - CreateDiagnosticReport
  - DescribeDiagnosticReportList
- 数据库管理
- 数据库代理
- 账号管理
- 安全管理
- 网络管理
- 日志管理
- 备份恢复
- SQL Server备份文件上云
- 监控管理
- 参数管理
- 数据迁移
- 标签管理
- RAM资源授权
- 附表
SDK参考
- Python SDK for RDS使用参考
- SDK参考
常见问题
- RDS简介
- 购买
  - 某一可用区的实例库存不足怎么办？
- 参数/性能
- 数据备份/恢复
- 网络/IP
- 数据库/账号/表
- 功能/付费方式
- 实例规格/版本
- 空间/内存
- 读写分离/只读实例
- 错误代码
- DTS相关问题
- DMS相关问题
视频专区
- 三分钟了解云数据库RDS
- RDS实例创建
- 账号及数据库管理
- ECS连接RDS
- 只读实例与读写分离
- 监控、备份及克隆实例
- RDS for SQL Server使用OSS备份文件增量上云演示
相关协议
- 服务等级协议
- 服务条款
- 服务保障
技术运维问题
- MYSQL使用
- SQL Server使用
- PostgreSQL使用
  - RDS for PostgreSQL 导入数据的几种方法
  - 如何建立基于RDS PostgreSQL的备库
- PPAS使用
- 网络连接类
产品使用问题
- 控制台
  - 微金融客户创建灾备实例被限制
- 备份恢复
- 数据迁移工具（DTS）使用
- 数据管理工具（DMS）使用
- 访问数据库
  - RDS for php SDK使用子账户查询实例信息的endpoint
- 创建数据库和账号
- 性能监控

PostgreSQL/PPAS CPU使用率高的原因及解决办法

更新时间：访问次数：4280

问题描述

RDS for PostgreSQL/PPAS使用过程中，可能会遇到CPU使用率过高甚至达到100%的情况。本文将介绍造成该状况的常见原因以及解决方法，并通过CPU使用率为100%的典型场景，来分析引起该状况的排查及其相应的解决方案。

解决方案

阿里云提醒您：

如果您对实例或数据有修改、变更等风险操作，务必注意实例的容灾、容错能力，确保数据安全。

如果您对实例（包括但不限于ECS、RDS）等进行配置与数据修改，建议提前创建快照或开启RDS日志备份等功能。

如果您在阿里云平台授权或者提交过登录账号、密码等安全信息，建议您及时修改。

CPU使用率到达100%，首先检查是不是业务高峰活跃连接陡增，而数据库预留的资源不足。需要查看问题发生时，活跃的连接数是否比平时多很多。对于RDS for PostgreSQL/PPAS，数据库上的连接数变化，可以从控制台的监控信息中看到。而当前活跃的连接数，可以直接连接数据库，使用下列查询语句得到。

select count( * ) from pg_stat_activity where state not like '%idle';

追踪慢SQL

如果活跃连接数的变化处于正常范围，则可能是当时有性能很差的SQL被大量执行。由于RDS有慢SQL日志，可以通过这个日志，定位到当时比较耗时的SQL来进一步做分析。但通常问题发生时，整个系统都处于停滞状态，所有SQL都慢下来，当时记录的慢SQL可能非常多，并不容易找到目标。这里介绍几种追查慢SQL的方法。

第一种方法是使用pg_stat_statements插件定位慢SQL，仅适用于PostgreSQL，步骤如下。
1. 如果没有pg_stat_statements插件，需要先手动创建。要利用插件和数据库系统里面的计数信息（如SQL执行时间累积等），而这些信息是不断累积的，包含了历史信息。为了更方便的排查当前的CPU过高问题，要先使用以下命令重置计数器。
```
create extension pg_stat_statements;
select pg_stat_reset();
select pg_stat_statements_reset();
```
2. 等待一段时间（例如1分钟），使计数器积累足够的信息。
3. 参考以下命令查询最耗时的SQL，一般就是导致问题的直接原因。
```
select * from pg_stat_statements order by total_time desc limit 5;
```
4. 参考以下SQL语句，查询读取Buffer次数最多的SQL，这些SQL可能由于所查询的数据没有索引，而导致了过多的Buffer读，也同时大量消耗了CPU。
```
select * from pg_stat_statements order by shared_blks_hit+shared_blks_read desc limit 5;
```

第二种方法是直接通过pg_stat_activity视图，参考以下查询SQL语句，查看当前长时间执行，一直不结束的SQL。这些SQL也可能造成CPU过高。

select datname,
       usename,
       client_addr,
       application_name,
       state,
       backend_start,
       xact_start,
       xact_stay,
       query_start,
       query_stay,
       replace(query, chr(10), ' ') as query
from
  (select pgsa.datname as datname,
          pgsa.usename as usename,
          pgsa.client_addr client_addr,
          pgsa.application_name as application_name,
          pgsa.state as state,
          pgsa.backend_start as backend_start,
          pgsa.xact_start as xact_start,
          extract(epoch
                  from (now() - pgsa.xact_start)) as xact_stay,
          pgsa.query_start as query_start,
          extract(epoch
                  from (now() - pgsa.query_start)) as query_stay,
          pgsa.query as query
   from pg_stat_activity as pgsa
   where pgsa.state != 'idle'
     and pgsa.state != 'idle in transaction'
     and pgsa.state != 'idle in transaction (aborted)') idleconnections
order by query_stay desc
limit 5;

第3种方法是从数据表上表扫描（Table Scan）的信息开始查起，查找缺失索引的表。数据表如果缺失索引，大部分热数据又都在内存时（例如内存8G，热数据6G），此时数据库只能使用表扫描，并需要处理已在内存中的大量无关记录，导致耗费大量CPU。特别是对于表记录数超过100的表，一次表扫描占用大量CPU（基本把一个CPU占满）和多个连接并发（例如上百连接）。
1. 参考以下SQL语句，查出使用表扫描最多的表。
```
select * from pg_stat_user_tables where n_live_tup > 100000 and seq_scan > 0 order by seq_tup_read desc limit 10;
```
2. 参考以下SQL语句，查询当前正在运行的访问到上述表的慢查询。
```
select * from pg_stat_activity where query ilike '%<table name>%' and query_start - now() > interval '10 seconds';
```
  说明：也可以通过pg_stat_statements插件定位涉及到这些表的查询，如下所示。
  select * from pg_stat_statements where query ilike '%<table>%'order by shared_blks_hit+shared_blks_read desc limit 3;

处理慢SQL

对于上面的方法查出来的慢SQL，如下所示，首先需要做的是结束掉它们，使业务先恢复。

select pg_cancel_backend(pid) from pg_stat_activity where  query like '%<query text>%' and pid != pg_backend_pid();
select pg_terminate_backend(pid) from pg_stat_activity where  query like '%<query text>%' and pid != pg_backend_pid();

如果这些SQL确实是业务上必需的，则需要对他们做如下优化。

对查询涉及的表，执行ANALYZE [$Table]或VACUUM ANZLYZE [$Table]语句，更新表的统计信息，使查询计划更准确。为避免对业务影响，最好在业务低峰执行。

说明：[$Table]为查询涉及的表。
选择一条如下SQL语句执行，查看SQL的执行计划，第一条SQL语句不会实际执行SQL语句，第二条SQL语句会实际执行而且能得到详细的执行信息，对其中的Table Scan涉及的表，建立索引。
```
explain [$Query_Text]
explain (buffers true, analyze true, verbose true) [$Query_Text]
```
说明：[$Query_Text]为SQL文件或语句。
重新编写SQL语句，去除掉不必要的子查询、改写UNION ALL、使用JOIN CLAUSE固定连接顺序等，都是进一步深度优化SQL语句的手段，这里不再深入说明。

适用于

云数据库RDS PostgreSQL版
云数据库RDS PPAS版

如果您的问题仍未解决，您可以在阿里云社区提交工单联系阿里云技术支持。

FAQ

关于此文档暂时还没有FAQ

有用(0) 我要提问

返回
顶部

开放平台

云数据库 RDS 版

PostgreSQL/PPAS CPU使用率高的原因及解决办法

问题描述

解决方案

追踪慢SQL

处理慢SQL

适用于

FAQ