借助AWR报告分析解决oracleCPU过高的问题(转)

摘要:
本期将介绍一些AWR报告的基本用法及其在性能问题诊断中的应用。这包括等待事件、各种系统级和会话级统计信息,以及有关使用更多资源的SQL语句的信息。Oracle数据库的后台进程将以一定间隔(一小时)收集系统的当前状态图像,并选择快照点以生成指定时间段/Rdbms/admin/awrrpt的统计报告。sql3)输入报告参数a)选择要生成的AWR报告的类型。

原文地址:http://www.cnblogs.com/crystal-guoguo/p/4213458.html

简介:
在oracle数据库中,有两个非常实用的自带监控工具EM(Enterprise Manager)和AWR(Automatic Workload Repository)。其中,通过AWR报告可以生成易于阅读的监控报告,可协助进行性能问题的诊断和分析。
本期将介绍一些AWR报告的基本使用和在性能问题诊断中的应用。
 什么是AWR:
      从oracle 10g开始,使用名为GATHER_STATS_JOB的计划任务来收集AWR的统计数据,AWR报告中收集了许多不同的统计数据,包括等待事件、各种系统级和会话级的统计数据及使用较多资源的SQL语句相关的信息。
    在默认情况下,Oracle数据库后台进程会以一定间隔(一小时)收集系统当前状态镜像,并且保存在数据库中,默认的保留时间是8天,此策略可根据实际情况进行调整。在特殊的时间点,如测试执行前后,可以通过手动创建快照的方式来增加快照。在生成AWR报告时,通过快照点来选择生成指定时间段的统计报告。
 AWR的生成:
一、手动产生AWR报告
1)在Oracle数据库服务器上,用SYSDBA身份登入sqlplus。
2)运行脚本
在sqlplus中输入awrrpt执行命令。
@?/rdbms/admin/awrrpt.sql
3)输入报告参数
a) 选择要生成AWR报告的类型,可选择text类型和html类型,输入html(默认)。
b)报告涉及天数范围
选择要生成报告的日期是多少天的记录。输入天数后,(输入1,则表示要生成今天0点开始到目前的时间段内的报告;输入2,则表示要生成昨天0点开始到现在的时间段内的报告;以此类推。)界面显示出改时间段的数据表格,每个时间点对应一个snap id,间隔时间oracle默认为1小时。 
c)输入要生成报告的开始和结束snap编号。 
d)确定报告名称。
不输入直接回车,系统会自动生成一个默认名字的报告。
e)生成报告。
提示报告输出结束后,AWR报告存放在指定目录(用sqlplus登录oracle数据库的目录)下 。 
案例分析:
现象:
 某交易单场景,发现数据库CPU平均使用率达近90%。本案例数据库为12Core,从Instance CPU上看,oracle占用的CPU占服务器中CPU资源(89.9%)的99.5%。

分析过程:
    为了定位数据库CPU过高的问题,测试过程中使用AWR报告,观察数据库的使用情况:
1)先整体查看报告头信息(header)和性能指标(Buffer Nowait,Buffer Hit,Library Hit,Execute to Parse,Parse CPU to Parse Elapsd,Redo NoWait )。
2)看Time Model Statistics,在整个sql执行时间(sql execute elapsed time)时间为15499秒中,解析时间(parse time elapsed)用了26秒,硬解析时间(hard parse elapsed time)用了26 秒,可知解析时间是花的很少的,所以可以判断出,sql的解析没有成为性能瓶颈,进一步推测,sql在获取数据的过程中遇到了瓶颈。
4)关注下负载的概要信息。数据库层面的TPS仅为1.3,TPS较低。
5)进一步分析发现,从SQL ordered by CPU Time来看,SQL id 为cjnzff37c9gr3和cq32agu0qkpd8的SQL语句,执行次数多,耗CPU较高。
6)针对这2个SQL语句,执行命令,获取sql 执行计划。(需输入SQL id)
@$ORACLE_HOME/rdbms/admin/awrsqrpt.sql
7)通过查看执行计划,对CTR_LOAN_CONT的表读取占用的cost较多,需要根据索引读取196000行数据。其中CTR_LOAN_CONT表为1200多万条数据,占用空间5888m,统计更新也较准确。部分计划如下:

8)查看 Segments by Logical Reads,96%的逻辑读都为CTR_LOAN_CONT 表的读取。最终定位为,数据库CPU过高为SQL导致。
 
处理方法:
(1)转移数据库服务器的一部分逻辑处理到应用服务器。即将数据库中的一些通过SQL判断的逻辑通过应用代码进行实现,从而适当的降低数据库服务器的复杂计算。
(2)针对XX模块仍然采用视图,但在视图中添加第三方平台作为条件过滤,并将归并方法UNION(表链接后筛选掉重复的记录再排序)改为UNION ALL(无排序去重)。
调优后效果:
(1)CTR_LOAN_CONT的表读取占用的cost从15359降低到276。
(2)数据库服务器的CPU平均使用率从89.9%降低到11.6%。
  

免责声明:文章转载自《借助AWR报告分析解决oracleCPU过高的问题(转)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇MySQL 启动后随即关闭或启动失败 [ innodb表空间损坏、innodb_force_recovery强制启动 ]OSPF NSSA区域内有多个ABR时,7类LSA转换5类LSA的站点选择(转)下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

MySQL集群常见高可用方案(转)

1. 概述 我们在考虑MySQL数据库的高可用的架构时,主要要考虑如下几方面: 如果数据库发生了宕机或者意外中断等故障,能尽快恢复数据库的可用性,尽可能的减少停机时间,保证业务不会因为数据库的故障而中断。 用作备份、只读副本等功能的非主节点的数据应该和主节点的数据实时或者最终保持一致。 当业务发生数据库切换时,切换前后的数据库内容应当一致,不会因为数据缺...

四、 MySQL客户端工具及SQL讲解

一.客户端命令介绍 mysql客户端命令 ​ 1、用于数据库的连接管理 1) 连接(略) 2) 管理: 3)接收用户的SQL语句 #MySQL接口自带的命令 h 或 help 或? 查看帮助,查看mysql的管理命令 G 格式化查看数据(结果以key:value形式展示) T 或 tee...

python3+Scrapy爬虫使用pipeline数据保存到文本和数据库,数据少或者数据重复问题

爬取的数据结果是没有错的,但是在保存数据的时候出错了,出现重复数据或者数据少问题。那为什么会造成这种结果呢? 其原因是由于Spider的速率比较快,而scapy操作数据库操作比较慢,导致pipeline中的方法调用较慢,这样当一个变量正在处理的时候,一个新的变量过来,之前的变量的值就会被覆盖。 就比如pipline的速率是1TPS,而spider的速率是5...

linux下导入导出MySQL数据库

一、导出:用mysqldump命令行命令格式mysqldump -u 用户名 -p 数据库名 > 数据库名.sql范例:mysqldump -u root -p abc > abc.sql(导出数据库abc到abc.sql文档)提示输入密码时,输入该数据库用户名的密码。 *************************************...

SQL Server ->> AlwaysOn高可用副本同步失败

前段时间我们生产环境有台alwayson高可用副本挂了,一开始是发现数据库账号不能登录,以为是密码过期,登录到副本上面发现数据库同步中断。 这个时候肯定第一时间是先查下SQL SERVER日志看下是什么报错原因引起的。 然后在SQL SERVER日志里面找到凌晨2点15分30秒的时候目标数据库有一条错误日志,提示Always On Availabili...

大文件数据库脚本导入解决方案

当客户服务器不允许直接备份时,往往通过导出数据库脚本的方式来部署-还原数据库 但是当数据库导出脚本很大,用Microsoft SQl Server Management Studio执行脚本时,往往会遇到“内存不足”的提示 解决办法: 用微软自带的sqlcmd工具,可以导入执行。以SQL Server 2008R版本为例: 第一步:Win+R键入:cmd命...