【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问团队

摘要:
非常抱歉,今天凌晨3:20~8:30左右,我们使用的阿里云RDS实例SQLServer2016标准版突然出现CPU100%故障,造成全站无法正常访问,由此给您带来巨大的麻烦,请您谅解。从阿里云RDS控制台CloudDBA看,故障期间下面的一个SQL语句大量执行,并且极其消耗CPU。最终恢复正常是通过RDS的2次主备切换,当发现故障后,我们立即进行主备切换,但切换后CPU依然100%,然后我们排查SQL语句的问题,排查未果,然后又进行一次主备切换,才恢复正常。

【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问团队第1张

非常抱歉,今天凌晨 3:20~8:30 左右,我们使用的阿里云 RDS 实例 SQL Server 2016 标准版突然出现 CPU 100% 故障,造成全站无法正常访问,由此给您带来巨大的麻烦,请您谅解。

问题很奇怪,故障期间是数据库服务器负载极低的时间段。从阿里云 RDS 控制台 CloudDBA 看,故障期间下面的一个 SQL 语句大量执行,并且极其消耗 CPU 。

【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问团队第2张

【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问团队第3张

开始我们以为是这个 SQL 语句引发的故障,但排查下来这个 SQL 语句本身并没有性能问题,而且已经使用了至少6个月。

最终恢复正常是通过 RDS 的2次主备切换,当发现故障后,我们立即进行主备切换,但切换后 CPU 依然 100% ,然后我们排查 SQL 语句的问题,排查未果,然后又进行一次主备切换,才恢复正常。

事后分析后发现应该是第一次主备切换没有成功完成,阿里云 RDS 控制台查看不到主备切换日志,但2次切换,只有第2次收到邮件通知,由此可以推断。

您的云数据库RDS实例:xxx(名称:enable or disable task fetching while rds2slb transgfer.)任务触发切换完毕,请检查程序连接是否正常,建议设置自动重连机制以避免切换影响。

问题的原因有待进一个分析,再次抱歉由此给您带来的麻烦。

免责声明:文章转载自《【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问团队》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇TCPDF说明文档MHDD检测不到硬盘的解决办法下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

阿里云、腾讯云、七牛、网易云CDN简单对比

阿里云、腾讯云、七牛、网易云简单对比如下, 仅做参考: 1、产品功能 产品功能 阿里云视频 腾讯云视频 七牛直播云 网易云视频 服务 直播 点播 转码 互动直播 直播 点播 转码 互动直播 直播 点播 直播、点播、互动直播、互动白板 推流SDK Android/iOS/windows Android/iOS/windows Android/iO...

Maven配置阿里镜像库和本地库的方法

Maven配置阿里镜像库 原因: 默认Maven中心仓库下载速度过慢. 配置方式: 在setting.xml文件中增加<mirror></mirror>标签 具体步骤: Step1 查找setting.xml文件(一般位于maven文件夹下的conf目录下);              Step2 在setting.xml...

阿里云产品之数据中台架构

1. 场景描述 客户打包买了很多阿里云的产品,但是阿里云不负责实施,基于阿里云产品与客户需求,拟采用的数据中台架构,有类似需求的,可以参考下,拿走不谢! 2. 解决方案 阿里产品大数据架构图: 从下到上,简要介绍下各个阿里产品作用及承担的任务: 2.1 云数据库 RDS 阿里云关系型数据库RDS(Relational Database Service)是...

快使用阿里云的maven仓库

自从开源中国的maven仓库挂了之后就一直在用国外的仓库,慢得想要砸电脑的心都有了。如果你和我一样受够了国外maven仓库的龟速下载?快试试阿里云提供的maven仓库,从此不在浪费生命…… 仓库地址:http://maven.aliyun.com/nexus/#view-repositories;public~browsestorage 仓库配置 在mav...

InfiniBand技术rds协议

前言:   之前一直从事oracle工作,近期一体机学习遇到ib交换机配置rds协议等未接触概念,有必要将一些网络、存储方面的知识总结下。 一、控制器和适配器:   控制器:集成在主板上,将cpu逻辑指令通过协议转换为设备能识别的控制信号。   适配器:独立在主板外,功能和控制器相同。   cpu如何读取磁盘中文件?   当用户执行一个命令,如cat /e...

阿里云天池新人赛——docker练习场比赛心得

由于在阿里的淘宝商品直播识别大赛中提交结果需要用到docker,以前也没有用过。正好阿里提供了docker的新人赛,借此机会学习一下。 既然学习docker,首先就要了解docker是什么:   Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器或Windows 机器上,也可...