“快准狠”找到Linux系统内存的问题

摘要:
内存性能指标最容易想到的是系统内存使用情况,比如已用内存、剩余内存、共享内存、可用内存、缓存和缓冲区的用量等。通过memleak给出的内存分配栈,找到了内存泄漏的可疑位置。通过cachetop,找到了缓冲区升高的根源;通过对比剩余内存跟/proc/zoneinfo的内存阈,发现Swap升高是内存回收导致的。通过vmstat或者sar发现内存在不断增长后,可以分析中是否存在内存泄漏的问题。

内存性能指标

最容易想到的是系统内存使用情况,比如已用内存、剩余内存、共享内存、可用内存、缓存和缓冲区的用量等。

已用内存和剩余内存很容易理解,就是已经使用和还未使用的内存。

共享内存是通过 tmpfs 实现的,所以它的大小也就是 tmpfs 使用的内存大小。tmpfs 其实也是一种特殊的缓存。

可用内存是新进程可以使用的最大内存,它包括剩余内存和可回收缓存。

缓存包括两部分,一部分是磁盘读取文件的页缓存,用来缓存从磁盘读取的数据,可以加快以后再次访问的速度。另一部分,则是 Slab 分配器中的可回收内存。

缓冲区是对原始磁盘块的临时存储,用来缓存将要写入磁盘的数据。这样,内核就可以把分散的写集中起来,统一优化磁盘写入。

第二类很容易想到的,应该是进程内存使用情况,比如进程的虚拟内存、常驻内存、共享内存以及 Swap 内存等。

虚拟内存,包括了进程代码段、数据段、共享内存、已经申请的堆内存和已经换出的内存等。这里要注意,已经申请的内存,即使还没有分配物理内存,也算作虚拟内存。

常驻内存是进程实际使用的物理内存,不过,它不包括 Swap 和共享内存。

共享内存,既包括与其他进程共同使用的真实的共享内存,还包括了加载的动态链接库以及程序的代码段等。

Swap 内存,是指通过 Swap 换出到磁盘的内存。

这些指标中,常驻内存一般会换算成占系统总内存的百分比,也就是进程的内存使用率。

除了这些很容易想到的指标外,还有,缺页异常。系统调用内存分配请求后,并不会立刻为其分配物理内存,而是在请求首次访问时,通过缺页异常来分配。缺页异常又分为下面两种场景。

可以直接从物理内存中分配时,被称为次缺页异常。

需要磁盘 I/O 介入(比如 Swap)时,被称为主缺页异常。

显然,主缺页异常升高,就意味着需要磁盘 I/O,那么内存访问也会慢很多。

除了系统内存和进程内存,第三类重要指标就是 Swap 的使用情况,比如 Swap 的已用空间、剩余空间、换入速度和换出速度等。

已用空间和剩余空间很好理解,就是字面上的意思,已经使用和没有使用的内存空间。

换入和换出速度,则表示每秒钟换入和换出内存的大小。

“快准狠”找到Linux系统内存的问题第1张

内存性能工具

free。这是个最常用的内存工具,可以查看系统的整体内存和 Swap 使用情况。

top 或 ps,查看进程的内存使用情况。通过 proc 文件系统,找到了内存指标的来源;

vmstat,动态观察了内存的变化情况。与 free 相比,vmstat 除了可以动态查看内存变化,还可以区分缓存和缓冲区、Swap 换入和换出的内存大小。

cachestat ,查看整个系统缓存的读写命中情况,并用 cachetop 来观察每个进程缓存的读写命中情况。

vmstat,发现了内存使用在不断增长,

memleak,确认发生了内存泄漏。通过 memleak 给出的内存分配栈,找到了内存泄漏的可疑位置。

sar 发现了缓冲区和 Swap 升高的问题。通过 cachetop,找到了缓冲区升高的根源;通过对比剩余内存跟 /proc/zoneinfo 的内存阈,发现 Swap 升高是内存回收导致的。通过 /proc 文件系统,找出了 Swap 所影响的进程。

第一个表格,从内存指标出发,列举了哪些性能工具可以提供这些指标。这样,在实际排查性能问题时

“快准狠”找到Linux系统内存的问题第2张

第二个表格,从性能工具出发,整理了这些常见工具能提供的内存指标。

“快准狠”找到Linux系统内存的问题第3张

还是那句话,在实际生产环境中,希望的是,尽可能快地定位系统瓶颈,然后尽可能快地优化性能,也就是要又快又准地解决性能问题。

方法当然有。还是那个关键词,找关联。其实,虽然内存的性能指标很多,但都是为了描述内存的原理,指标间自然不会完全孤立,一般都会有关联。当然,反过来说,这些关联也正是源于系统的内存原理,这也是基础原理的重要性。

看到系统的剩余内存很低时,进程不一定不能申请分配新内存了,因为进程可以使用的内存,除了剩余内存,还包括了可回收的缓存和缓冲区。

所以,为了迅速定位内存问题,通常会先运行几个覆盖面比较大的性能工具,比如 free、top、vmstat、pidstat 等。

先用 free 和 top,查看系统整体的内存使用情况。

再用 vmstat 和 pidstat,查看一段时间的趋势,从而判断出内存问题的类型。

最后进行详细分析,比如内存分配分析、缓存 / 缓冲区分析、具体进程的内存使用分析等。

“快准狠”找到Linux系统内存的问题第4张

图中列出了最常用的几个内存工具,和相关的分析流程。其中,箭头表示分析的方向

通过 free,发现大部分内存都被缓存占用后,可以使用 vmstat 或者 sar 观察一下缓存的变化趋势,确认缓存的使用是否还在继续增大。如果继续增大,则说明导致缓存升高的进程还在运行,那就能用缓存 / 缓冲区分析工具(比如 cachetop、slabtop 等),分析这些缓存到底被哪里占用

free 一下,发现系统可用内存不足时,首先要确认内存是否被缓存 / 缓冲区占用。排除缓存 / 缓冲区后,可以继续用 pidstat 或者 top,定位占用内存最多的进程。找出进程后,再通过进程内存空间工具(比如 pmap),分析进程地址空间中内存的使用情况就可以了。

通过 vmstat 或者 sar 发现内存在不断增长后,可以分析中是否存在内存泄漏的问题。比如可以使用内存分配分析工具 memleak ,检查是否存在内存泄漏。如果存在内存泄漏问题,memleak 会为你输出内存泄漏的进程以及调用堆栈。

免责声明:文章转载自《“快准狠”找到Linux系统内存的问题》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇【ES6】迭代器与可迭代对象SQLSERVER加密解密函数(非对称密钥 证书加密 对称密钥)下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

FFmpeg在Linux下编译使用

1.FFmpeg编译 1.1.安装yasm 这里我是直接通过ubuntu包安装的,当然也可以通过编译源码来安装。 sudo apt-get install yasm 1.2.下载FFmpeg git clone https://git.ffmpeg.org/ffmpeg.git 1.3.配置、编译FFMPEG ./configure --prefix=ho...

Linux基础知识(一)

    本篇主要介绍Linux操作系统相关知识以及其常用命令等。 一、操作系统的基本知识   一般而言,现代计算机计算机系统是一个复杂的系统,故若程序员需要掌握该系统的每一个细节例如如何通过代码去调用音响等这些事情,那可能不再编写代码了,这种情况会严重影响程序员的开发效率。 并且管理这些部件并加以优化使用,是一件极富挑战性的工作,于是,计算安装了一层软件(...

Linux的远程桌面配置

一、Ubuntu的远程桌面 Ubuntu默认已安装好VNC服务端组件vino-server,只需要在“系统设置->首选项->桌面共享”中设置即可。 1、设置桌面共享首选项 2、设置好之后,可查看启动的VNC服务进程 [root@localhost]$ sudo netstat -altunp | grep 590tcp   0 0   0.0...

MongoDB在linux下的启动

     最近公司数据库用到MongoDB,而之前只关注知道它是分布式非关系数据库,数据以文档的形式存储,数据格式是类似json的bson格式.而对于具体用法以及java如何调用并没有过多接触,今天花费一天的时间了解了MongoDB在linux下的安装以及基本的命令行调用.    1. Linux下安装MongoDB     进入官网: https://d...

Linux平台Oracle 12.1.0.2 单实例安装部署

主题:Linux平台Oracle 12.1.0.2 单实例安装部署环境:RHEL 6.5 + Oracle 12.1.0.2需求:安装部署OEM 13.2需要Oracle 12.1.0.2版本作为资料库 1.下载介质 目前从OTN就可以直接下载到12.1.0.2的介质。 linuxamd64_12102_database_1of2.zip linuxamd...

Tomcat配置https环境(Windows+Linux)

[-] 1进入到jdk下的bin目录 2输入如下指令keytool -v -genkey -alias tomcat -keyalg RSA -keystore dtomcatkeystore 3输入keystore密码 4输入名字组织单位组织市省国家等信息 5输入之后会出现确认的提示 6输入tomcat的主密码 7进入tomcat文件夹 8在seve...