枯藤闲画云

进程的虚拟内存，物理内存，共享内存

转自:https://blog.csdn.net/rebirthme/article/details/50402082

想必在linux上写过程序的同学都有分析进程占用多少内存的经历，或者被问到这样的问题——你的程序在运行时占用了多少内存（物理内存）？通常我们可以通过top命令查看进程占用了多少内存。这里我们可以看到VIRT、RES和SHR三个重要的指标，他们分别代表什么意思呢？这是本文需要跟大家一起探讨的问题。当然如果更加深入一点，你可能会问进程所占用的那些物理内存都用在了哪些地方？这时候top命令可能不能给到你你所想要的答案了，不过我们可以分析proc文件系统提供的smaps文件，这个文件详尽地列出了当前进程所占用物理内存的使用情况。

这篇blog总共分为三个部分。第一部分简要阐述虚拟内存和驻留内存这两个重要的概念；第二部分解释top命令中VIRT、RES以及SHR三个参数的实际参考意义；最后一部分向大家介绍一下smaps文件的格式，通过分析smaps文件我们可以详细了解进程物理内存的使用情况，比如mmap文件占用了多少空间、动态内存开辟消耗了多少空间、函数调用栈消耗了多少空间等等。

关于内存的两个概念

要理解top命令关于内存使用情况的输出，我们必须首先搞清楚虚拟内存（Virtual Memory）和驻留内存（Resident Memory）两个概念。

【虚拟内存】

首先需要强调的是虚拟内存不同于物理内存，虽然两者都包含内存字眼但是它们属于两个不同层面的概念。进程占用虚拟内存空间大并非意味着程序的物理内存也一定占用很大。虚拟内存是操作系统内核为了对进程地址空间进行管理（process address space management）而精心设计的一个逻辑意义上的内存空间概念。我们程序中的指针其实都是这个虚拟内存空间中的地址。比如我们在写完一段C++程序之后都需要采用g++进行编译，这时候编译器采用的地址其实就是虚拟内存空间的地址。因为这时候程序还没有运行，何谈物理内存空间地址？凡是程序运行过程中可能需要用到的指令或者数据都必须在虚拟内存空间中。既然说虚拟内存是一个逻辑意义上（假象的）的内存空间，为了能够让程序在物理机器上运行，那么必须有一套机制可以让这些假象的虚拟内存空间映射到物理内存空间（实实在在的RAM内存条上的空间）。这其实就是操作系统中页映射表（page table）所做的事情了。内核会为系统中每一个进程维护一份相互独立的页映射表。。页映射表的基本原理是将程序运行过程中需要访问的一段虚拟内存空间通过页映射表映射到一段物理内存空间上，这样CPU访问对应虚拟内存地址的时候就可以通过这种查找页映射表的机制访问物理内存上的某个对应的地址。“页（page）”是虚拟内存空间向物理内存空间映射的基本单元。

下图1演示了虚拟内存空间和物理内存空间的相互关系，它们通过Page Table关联起来。其中虚拟内存空间中着色的部分分别被映射到物理内存空间对应相同着色的部分。而虚拟内存空间中灰色的部分表示在物理内存空间中没有与之对应的部分，也就是说灰色部分没有被映射到物理内存空间中。这么做也是本着“按需映射”的指导思想，因为虚拟内存空间很大，可能其中很多部分在一次程序运行过程中根本不需要访问，所以也就没有必要将虚拟内存空间中的这些部分映射到物理内存空间上。

到这里为止已经基本阐述了什么是虚拟内存了。总结一下就是，虚拟内存是一个假象的内存空间，在程序运行过程中虚拟内存空间中需要被访问的部分会被映射到物理内存空间中。虚拟内存空间大只能表示程序运行过程中可访问的空间比较大，不代表物理内存空间占用也大。

【驻留内存】

驻留内存，顾名思义是指那些被映射到进程虚拟内存空间的物理内存。上图1中，在系统物理内存空间中被着色的部分都是驻留内存。比如，A1、A2、A3和A4是进程A的驻留内存；B1、B2和B3是进程B的驻留内存。进程的驻留内存就是进程实实在在占用的物理内存。一般我们所讲的进程占用了多少内存，其实就是说的占用了多少驻留内存而不是多少虚拟内存。因为虚拟内存大并不意味着占用的物理内存大。

关于虚拟内存和驻留内存这两个概念我们说到这里。下面一部分我们来看看top命令中VIRT、RES和SHR分别代表什么意思。

top命令中VIRT、RES和SHR的含义

搞清楚了虚拟内存的概念之后解释VIRT的含义就很简单了。VIRT表示的是进程虚拟内存空间大小。对应到图1中的进程A来说就是A1、A2、A3、A4以及灰色部分所有空间的总和。也就是说VIRT包含了在已经映射到物理内存空间的部分和尚未映射到物理内存空间的部分总和。

RES的含义是指进程虚拟内存空间中已经映射到物理内存空间的那部分的大小。对应到图1中的进程A来说就是A1、A2、A3以及A4几个部分空间的总和。所以说，看进程在运行过程中占用了多少内存应该看RES的值而不是VIRT的值。

最后来看看SHR所表示的含义。SHR是share（共享）的缩写，它表示的是进程占用的共享内存大小。在上图1中我们看到进程A虚拟内存空间中的A4和进程B虚拟内存空间中的B3都映射到了物理内存空间的A4/B3部分。咋一看很奇怪。为什么会出现这样的情况呢？其实我们写的程序会依赖于很多外部的动态库（.so），比如libc.so、libld.so等等。这些动态库在内存中仅仅会保存/映射一份，如果某个进程运行时需要这个动态库，那么动态加载器会将这块内存映射到对应进程的虚拟内存空间中。多个进展之间通过共享内存的方式相互通信也会出现这样的情况。这么一来，就会出现不同进程的虚拟内存空间会映射到相同的物理内存空间。这部分物理内存空间其实是被多个进程所共享的，所以我们将他们称为共享内存，用SHR来表示。某个进程占用的内存除了和别的进程共享的内存之外就是自己的独占内存了。所以要计算进程独占内存的大小只要用RES的值减去SHR值即可。

进程的smaps文件

查看命令是：cat /proc/进程的pid/smaps

通过top命令我们已经能看出进程的虚拟空间大小（VIRT）、占用的物理内存（RES）以及和其他进程共享的内存（SHR）。但是仅此而已，如果我想知道如下问题：

进程的虚拟内存空间的分布情况，比如heap占用了多少空间、文件映射（mmap）占用了多少空间、stack占用了多少空间？
进程是否有被交换到swap空间的内存，如果有，被交换出去的大小？
mmap方式打开的数据文件有多少页在内存中是脏页（dirty page）没有被写回到磁盘的？
mmap方式打开的数据文件当前有多少页面已经在内存中，有多少页面还在磁盘中没有加载到page cahe中？
等等

以上这些问题都无法通过top命令给出答案，但是有时候这些问题正是我们在对程序进行性能瓶颈分析和优化时所需要回答的问题。所幸的是，世界上解决问题的方法总比问题本身要多得多。linux通过proc文件系统为每个进程都提供了一个smaps文件，通过分析该文件我们就可以一一回答以上提出的问题。

在smaps文件中，每一条记录（如下图2所示）表示进程虚拟内存空间中一块连续的区域。其中第一行从左到右依次表示地址范围、权限标识、映射文件偏移、设备号、inode、文件路径。详细解释可以参见understanding-linux-proc-id-maps。

接下来8个字段的含义分别如下：

Size：表示该映射区域在虚拟内存空间中的大小。
Rss：表示该映射区域当前在物理内存中占用了多少空间。
Shared_Clean：和其他进程共享的未被改写的page的大小。
Shared_Dirty：和其他进程共享的被改写的page的大小。
Private_Clean：未被改写的私有页面的大小。
Swap：表示非mmap内存（也叫anonymous memory，比如malloc动态分配出来的内存）由于物理内存不足被swap到交换空间的大小。
Pss：该虚拟内存区域平摊计算后使用的物理内存大小(有些内存会和其他进程共享，例如mmap进来的)。比如该区域所映射的物理内存部分同时也被另一个进程映射了，且该部分物理内存的大小为1000KB，那么该进程分摊其中一半的内存，即Pss=500KB。

图2. smaps文件示例

有了smap如此详细关于虚拟内存空间到物理内存空间的映射信息，相信大家已经能够通过分析该文件回答上面提出的4个问题。

最后希望所有读者能够通过阅读本文对进程的虚拟内存和物理内存有一个更加清晰认识，并能更加准确理解top命令关于内存的输出，最后可以通过smaps文件更进一步分析进程使用内存的情况

http://yalung929.blog.163.com/blog/static/203898225201212981731971/

引言: top命令作为Linux下最常用的性能分析工具之一，可以监控、收集进程的CPU、IO、内存使用情况。比如我们可以通过top命令获得一个进程使用了多少虚拟内存（VIRT）、物理内存（RES）、共享内存（SHR）。

最近遇到一个咨询问题，某产品做性能分析需要获取进程占用物理内存的实际大小（不包括和其他进程共享的部分），看似很简单的问题，但经过研究分析后，发现背后有很多故事……

1 VIRT RES SHR的准确含义

三个内存指标，VRIT，RES，SHR准确含义是什么？谁能告诉我们？MAN页？Linux专家？SUSE工程师？Linus？谁能说出最正确答案？没人！因为惟有源代码才是最正确的答案。

那我们就去看下源码吧，这就是开源软件的最大的好处。

首先这三个数据的源头，肯定是内核，进程的相关数据结构肯定是由内核维护。那么top作为一个用户空间的程序，要想获取内核空间的数据，就需要通过系统接口（API）获取。而proc文件系统是Linux内核空间和用户空间交换数据的一个途径，而且是非常重要的一种途径，这点和windows更倾向于基于函数调用的形式不同。

当你调用系统函数read读取一个普通文件时，内核执行对应文件系统的代码从磁盘传送文件内容给你。

当你调用系统函数read读取一个 proc文件时，内核执行对应的proc文件系统的代码从内核的数据结构中传送相关内容给你。proc文件和磁盘没有关系。只是系统接口而已。

而一个进程的相关信息，Linux全部通过/proc//内的文件告诉了我们。

如下，你可以使用普通的文件读写工具，比如cat获取进程的各种信息。这比函数调用的方式灵活多了、丰富多了。

回到我们的问题，top命令显示的进程信息，肯定也是通过proc获取的，因为除此之外没有其他途径，没有系统函数可以做这个事情，top也不可能越过用户层直取内核获取数据。

带着以上信息，很快就可以从top的源码中找到关键代码：

啊哈，statm文件：

根据sscanf的顺序，第一个值是VIRT，第二个值是RES，第三个值是SHR！

等等，好像数值对不上，top显示的SHR是344k，而statm给出的是86！

再来看一行关键代码：

statm显示的是页数，top显示的是KB。X86下，一页是4KB，86 * 4 = 344。这就对了！

于是乎，我们找到了最关键的入口，接下来按图索骥，看看内核是怎么产生statm文件内容就可以了。~~

proc_pid_statm函数负责产生statm文件内容，当你使用cat命令打印statm文件时，内核中的这个函数会执行。

proc_pid_statm获取进程的mm_struct数据结构，而这个数据结构就是进程的内存描述符，通过它可以获取进程内存使用、映射的全部信息。

进一步考察task_statm函数，可以看到：

第一个值（VIRT）就是mm->total_vm，即进程虚存的总大小，这个比较清晰，只要进程申请了内存，无论是malloc还是堆栈还是全局，都会计入这个值；

第二个值（RES）是mm->file_rss+mm->anon_rss；

第三个值（SHR）是mm->file_rss。

RES要和SHR结合者看，内核把物理内存分为了两部分，一部分是映射至文件的，一部分是没有映射至文件的即匿名内存，完全和共不共享没有关系！

但file_rss为什么叫做shared呢？应该是一种指示性表述，表示这部分内存可能是共享的。但并不代表真正共享了。那么到底哪些计入file_rss？通过查阅相关代码，发现（可能有遗漏）：

l 程序的代码段。

l 动态库的代码段。

l 通过mmap做的文件映射。

l 通过mmap做的匿名映射，但指明了MAP_SHARED属性。

l 通过shmget申请的共享内存。

即进程通过以上方式占用的物理内存，计入file_rss，也就是top的SHR字段。我们看到一般这些内存都是以共享方式存在。但如果某个动态库只一个进程在使用，它的代码段就没有被共享着。

反过来再来看anon_rss统计的内容，是否就一定是独占的？也不是，比如新fork之后的子进程，由于copy on write机制，在页面被修改之前，和父进程共享。这部分值并不体现在top命令的SHR字段内。

综上所述top命令显示的SHR字段，并不是准确描述了进程与其他进程共享使用的内存数量，是存在误差的。

那么如何获取进程准确的共享内存数量？

2 获取进程准确的共享内存数量

我们注意到在描述进程信息的proc/内，有一个smaps文件，里面展示了所有内存段的信息，其中有Shared_Clean Shared_Dirty Private_Clean Private_Dirty:几个字段。

找到相关代码，可以看到，一个页面如果映射数>=2计入Shared_* ；如果=1计入Private_*。（脏页计入*_Dirty，否则计入*_Clean）

统计smaps文件内所有段的Shared_*值的总和就是进程准确的共享内存数量！

统计smaps文件内所有段的Private_*值的总和就是进程准确的独占内存数量！

3 总结

通过以上分析，我们可以得到如下结论：

l top命令通过解析/proc//statm统计VIRT和RES和SHR字段值。

l VIRT是申请的虚拟内存总量。

l RES是进程使用的物理内存总和。

l SHR是RES中”映射至文件”的物理内存总和。包括：

程序的代码段。

动态库的代码段。

通过mmap做的文件映射。

通过mmap做的匿名映射，但指明了MAP_SHARED属性。

通过shmget申请的共享内存。

l /proc//smaps内Shared_*统计的是RES中映射数量>=2的物理内存。

l /proc//smaps内Private_*统计的是RES中映射数量=1的物理内存。

在Linux下查看内存我们一般用free命令：
[root@scs-2 tmp]# free
             total       used       free     shared    buffers     cached
Mem:       3266180    3250004      16176          0     110652    2668236
-/+ buffers/cache:     471116    2795064
Swap:      2048276      80160    1968116

下面是对这些数值的解释：
total:总计物理内存的大小。
used:已使用多大。
free:可用有多少。
Shared:多个进程共享的内存总额。
Buffers/cached:磁盘缓存的大小。
第三行(-/+ buffers/cached):
used:已使用多大。
free:可用有多少。
第四行就不多解释了。
区别：第二行(mem)的used/free与第三行(-/+ buffers/cache) used/free的区别。这两个的区别在于使用的角度来看，第一行是从OS的角度来看，因为对于OS，buffers/cached 都是属于被使用，所以他的可用内存是16176KB,已用内存是3250004KB,其中包括，内核（OS）使用+Application(X, oracle,etc)使用的+buffers+cached.
第三行所指的是从应用程序角度来看，对于应用程序来说，buffers/cached 是等于可用的，因为buffer/cached是为了提高文件读取的性能，当应用程序需在用到内存的时候，buffer/cached会很快地被回收。
所以从应用程序的角度来说，可用内存=系统free memory+buffers+cached。
如上例：
2795064=16176+110652+2668236

接下来解释什么时候内存会被交换，以及按什么方交换。当可用内存少于额定值的时候，就会开会进行交换。
如何看额定值：
cat /proc/meminfo

[root@scs-2 tmp]# cat /proc/meminfo
MemTotal:      3266180 kB
MemFree:         17456 kB
Buffers:        111328 kB
Cached:        2664024 kB
SwapCached:          0 kB
Active:         467236 kB
Inactive:      2644928 kB
HighTotal:           0 kB
HighFree:            0 kB
LowTotal:      3266180 kB
LowFree:         17456 kB
SwapTotal:     2048276 kB
SwapFree:      1968116 kB
Dirty:               8 kB
Writeback:           0 kB
Mapped:         345360 kB
Slab:           112344 kB
Committed_AS:   535292 kB
PageTables:       2340 kB
VmallocTotal: 536870911 kB
VmallocUsed:    272696 kB
VmallocChunk: 536598175 kB
HugePages_Total:     0
HugePages_Free:      0
Hugepagesize:     2048 kB

用free -m查看的结果：
[root@scs-2 tmp]# free -m
             total       used       free     shared    buffers     cached
Mem:          3189       3173         16          0        107       2605
-/+ buffers/cache:        460       2729
Swap:         2000         78       1921

查看/proc/kcore文件的大小（内存镜像）：
[root@scs-2 tmp]# ll -h /proc/kcore
-r-------- 1 root root 4.1G Jun 12 12:04 /proc/kcore

备注：

占用内存的测量

测量一个进程占用了多少内存，linux为我们提供了一个很方便的方法，/proc目录为我们提供了所有的信息，实际上top等工具也通过这里来获取相应的信息。

/proc/meminfo 机器的内存使用信息

/proc/pid/maps pid为进程号，显示当前进程所占用的虚拟地址。

/proc/pid/statm 进程所占用的内存

[root@localhost ~]# cat /proc/self/statm

654 57 44 0 0 334 0

输出解释

CPU 以及CPU0。。。的每行的每个参数意思（以第一行为例）为：

参数解释 /proc//status

Size (pages) 任务虚拟地址空间的大小 VmSize/4

Resident(pages) 应用程序正在使用的物理内存的大小 VmRSS/4

Shared(pages) 共享页数 0

Trs(pages) 程序所拥有的可执行虚拟内存的大小 VmExe/4

Lrs(pages) 被映像到任务的虚拟内存空间的库的大小 VmLib/4

Drs(pages) 程序数据段和用户态的栈的大小（VmData+ VmStk ）4

dt(pages) 04

查看机器可用内存

/proc/28248/>free

total used free shared buffers cached

Mem: 1023788 926400 97388 0 134668 503688

-/+ buffers/cache: 288044 735744

Swap: 1959920 89608 1870312

我们通过free命令查看机器空闲内存时，会发现free的值很小。这主要是因为，在linux中有这么一种思想，内存不用白不用，因此它尽可能的cache和buffer一些数据，以方便下次使用。但实际上这些内存也是可以立刻拿来使用的。

所以空闲内存=free+buffers+cached=total-used

用/proc文件系统查看进程的内存使用情况

/proc目录Linux 内核提供了一种通过 /proc 文件系统，在运行时访问内核内部数据结构、改变内核设置的机制。proc文件系统是一个伪文件系统

/proc/vmstat 虚拟内存统计信息

/proc/vmcore 内核panic时的内存映像

/proc/diskstats 取得磁盘信息

/proc/schedstat kernel调度器的统计信息

/proc/zoneinfo 显示内存空间的统计信息,对分析虚拟内存行为很有用

以下是/proc目录中进程N的信息

/proc/N pid为N的进程信息

/proc/N/cmdline 进程启动命令

/proc/N/cwd 链接到进程当前工作目录

/proc/N/environ 进程环境变量列表

/proc/N/exe 链接到进程的执行命令文件

/proc/N/fd 包含进程相关的所有的文件描述符

/proc/N/maps 与进程相关的内存映射信息

/proc/N/mem 指代进程持有的内存,不可读

/proc/N/root 链接到进程的根目录

/proc/N/stat 进程的状态

/proc/N/statm 进程使用的内存的状态

/proc/N/status 进程状态信息,比stat/statm更具可读性

/proc/self 链接到当前正在运行的进程

ps命令的输出关于内存的情况不是很详细，尤其是进程所使用的内存中有很大一部分是共享库函数使用的，因此通过ps命令的输出看不到进程自己使用了多少内存。为了查看更详细的信息，可以借助于/proc文件系统。这个文件系统并存在于磁盘上，但是可以象操作其它普通文件一样操作它。它是Linux提供给用户查看进程相关信息的接口。在/proc下有2个文件和进程内存有关：/proc//status和/proc//smaps。

通过/proc//status可以查看进程的内存使用情况，包括虚拟内存大小（VmSize），物理内存大小（VmRSS），数据段大小（VmData），栈的大小（VmStk），代码段的大小（VmExe），共享库的代码段大小（VmLib）等等。

$ cat /proc/10069/status
Name:   a.out
State: S (sleeping)
Tgid:   10069
Pid:    10069
PPid:   6793
TracerPid:      0
Uid:    1001    1001    1001    1001
Gid:    1001    1001    1001    1001
FDSize: 256
Groups: 1000 1001
VmPeak:     1692 kB
VmSize:     1616 kB
VmLck:         0 kB
VmHWM:       304 kB
VmRSS:       304 kB
VmData:       28 kB
VmStk:        88 kB
VmExe:         4 kB
VmLib:      1464 kB
VmPTE:        20 kB
Threads:        1
SigQ:   0/16382
SigPnd: 0000000000000000
ShdPnd: 0000000000000000
SigBlk: 0000000000000000
SigIgn: 0000000000000000
SigCgt: 0000000000000000
CapInh: 0000000000000000
CapPrm: 0000000000000000
CapEff: 0000000000000000
CapBnd: ffffffffffffffff
Cpus_allowed:   f
Cpus_allowed_list:      0-3
Mems_allowed:   1
Mems_allowed_list:      0
voluntary_ctxt_switches:        1
nonvoluntary_ctxt_switches:     1注意，VmData，VmStk，VmExe和VmLib之和并不等于VmSize。这是因为共享库函数的数据段没有计算进去（VmData仅包含a.out程序的数据段，不包括共享库函数的数据段，也不包括通过mmap映射的区域。VmLib仅包括共享库的代码段，不包括共享库的数据段）。

通过/proc//smaps可以查看进程整个虚拟地址空间的映射情况，它的输出从低地址到高地址按顺序输出每一个映射区域的相关信息，如下所示：

$ cat /proc/10069/smaps
00110000-00263000 r-xp 00000000 08:07 128311     /lib/tls/i686/cmov/libc-2.11.1.so
Size:               1356 kB
Rss:                 148 kB
Pss:                   8 kB
Shared_Clean:        148 kB
Shared_Dirty:          0 kB
Private_Clean:         0 kB
Private_Dirty:         0 kB
Referenced:          148 kB
Swap:                  0 kB
KernelPageSize:        4 kB
MMUPageSize:           4 kB
......
......
bfd7f000-bfd94000 rw-p 00000000 00:00 0          [stack]
Size:                 88 kB
Rss:                   8 kB
Pss:                   8 kB
Shared_Clean:          0 kB
Shared_Dirty:          0 kB
Private_Clean:         0 kB
Private_Dirty:         8 kB
Referenced:            8 kB
Swap:                  0 kB
KernelPageSize:        4 kB
MMUPageSize:           4 kB注意：rwxp中，p表示私有映射（采用Copy-On-Write技术）。 Size字段就是该区域的大小。

一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。

Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用实际物理内存；一级是具体的物理页面，它对应我们机器上的物理内存。

这里要提到一个很重要的概念，内存的延迟分配。Linux内核在用户申请内存的时候，只是给它分配了一个线性区（也就是虚存），并没有分配实际物理内存；只有当用户使用这块内存的时候，内核才会分配具体的物理页面给用户，这时候才占用宝贵的物理内存。内核释放物理页面是通过释放线性区，找到其所对应的物理页面，将其全部释放的过程。

 
           char *p=malloc( 
           2048 
           ) 
           //这里只是分配了虚拟内存2048，并不占用实际内存。 
          
           strcpy(p,” 
           123 
           ”) 
           //分配了物理页面，虽然只是使用了3个字节，但内存还是为它分配了2048字节的物理内存。 
          
           free(p) 
           //通过虚拟地址，找到其所对应的物理页面，释放物理页面，释放线性区。

我们知道用户的进程和内核是运行在不同的级别，进程与内核之间的通讯是通过系统调用来完成的。进程在申请和释放内存，主要通过brk,sbrk,mmap,unmmap这几个系统调用，传递的参数主要是对应的虚拟内存。

注意一点，在进程只能访问虚拟内存，它实际上是看不到内核物理内存的使用，这对于进程是完全透明的。

glibc内存管理器

那么我们每次调用malloc来分配一块内存，都进行相应的系统调用呢？

答案是否定的，这里我要引入一个新的概念，glibc的内存管理器。

我们知道malloc和free等函数都是包含在glibc库里面的库函数，我们试想一下，每做一次内存操作，都要调用系统调用的话，那么程序将多么的低效。

实际上glibc采用了一种批发和零售的方式来管理内存。glibc每次通过系统调用的方式申请一大块内存（虚拟内存），当进程申请内存时，glibc就从自己获得的内存中取出一块给进程。

内存管理器面临的困难

我们在写程序的时候，每次申请的内存块大小不规律，而且存在频繁的申请和释放，这样不可避免的就会产生内存碎块。而内存碎块，直接会导致大块内存申请无法满足，从而更多的占用系统资源；如果进行碎块整理的话，又会增加cpu的负荷，很多都是互相矛盾的指标，这里我就不细说了。

我们在写程序时，涉及内存时，有两个概念heap和stack。传统的说法stack的内存地址是向下增长的，heap的内存地址是向上增长的。

函数malloc和free，主要是针对heap进行操作，由程序员自主控制内存的访问。

在这里heap的内存地址向上增长，这句话不完全正确。

glibc对于heap内存申请大于128k的内存申请，glibc采用mmap的方式向内核申请内存，这不能保证内存地址向上增长；小于128k的则采用brk，对于它来讲是正确的。128k的阀值，可以通过glibc的库函数进行设置。

这里我先讲大块内存的申请，也即对应于mmap系统调用。

对于大块内存申请，glibc直接使用mmap系统调用为其划分出另一块虚拟地址，供进程单独使用；在该块内存释放时，使用unmmap系统调用将这块内存释放，这个过程中间不会产生内存碎块等问题。

针对小块内存的申请，在程序启动之后，进程会获得一个heap底端的地址，进程每次进行内存申请时，glibc会将堆顶向上增长来扩展内存空间，也就是我们所说的堆地址向上增长。在对这些小块内存进行操作时，便会产生内存碎块的问题。实际上brk和sbrk系统调用，就是调整heap顶地址指针。

那么heap堆的内存是什么时候释放呢？

当glibc发现堆顶有连续的128k的空间是空闲的时候，它就会通过brk或sbrk系统调用，来调整heap顶的位置，将占用的内存返回给系统。这时，内核会通过删除相应的线性区，来释放占用的物理内存。

下面我要讲一个内存空洞的问题：

一个场景，堆顶有一块正在使用的内存，而下面有很大的连续内存已经被释放掉了，那么这块内存是否能够被释放？其对应的物理内存是否能够被释放？

很遗憾，不能。

这也就是说，只要堆顶的部分申请内存还在占用，我在下面释放的内存再多，都不会被返回到系统中，仍然占用着物理内存。为什么会这样呢？

这主要是与内核在处理堆的时候，过于简单，它只能通过调整堆顶指针的方式来调整调整程序占用的线性区；而又只能通过调整线性区的方式，来释放内存。所以只要堆顶不减小，占用的内存就不会释放。

提一个问题：

 
           char *p=malloc( 
           2 
           ); 
          
           free(p)

为什么申请内存的时候，需要两个参数，一个是内存大小，一个是返回的指针；而释放内存的时候，却只要内存的指针呢？

这主要是和glibc的内存管理机制有关。glibc中，为每一块内存维护了一个chunk的结构。glibc在分配内存时，glibc先填写chunk结构中内存块的大小，然后是分配给进程的内存。

 
           chunk ------size 
          
           p------------ content

在进程释放内存时，只要指针-4 便可以找到该块内存的大小，从而释放掉。

注：glibc在做内存申请时，最少分配16个字节，以便能够维护chunk结构。

glibc提供的调试工具：

为了方便调试，glibc 为用户提供了 malloc 等等函数的钩子（hook），如 __malloc_hook

对应的是一个函数指针，

 
           void 
           * 
           function 
           (size_t size,  
           const 
           void 
           *caller)

其中 caller 是调用 malloc 返回值的接受者（一个指针的地址）。另外有 __malloc_initialize_hook函数指针，仅仅会调用一次（第一次分配动态内存时）。（malloc.h）

一些使用 malloc 的统计量（SVID 扩展）可以用 struct mallinfo 储存，可调用获得。

 
           struct mallinfo mallinfo ( 
           void 
           )

如何检测 memory leakage？glibc 提供了一个函数

void mtrace (void)及其反作用void muntrace (void)

这时会依赖于一个环境变量 MALLOC_TRACE 所指的文件，把一些信息记录在该文件中

用于侦测 memory leakage，其本质是安装了前面提到的 hook。一般将这些函数用

#ifdef DEBUGGING 包裹以便在非调试态下减少开销。产生的文件据说不建议自己去读，

而使用 mtrace 程序（perl 脚本来进行分析）。下面用一个简单的例子说明这个过程，这是

源程序：

 
           #include 
          
           #include 
          
           #include 
          
           intmain( 
           int 
           argc, char *argv[] ) 
          
           { 
          
           int 
           *p, *q ; 
          
           #ifdef DEBUGGING 
          
           mtrace( ) ; 
          
           #endif 
          
           p = malloc( sizeof(  
           int 
           ) ) ; 
          
           q = malloc( sizeof(  
           int 
           ) ) ; 
          
           printf 
           ( 
           "p = %p\nq = %p\n" 
           , p, q ) ; 
          
           *p = 1 ; 
          
           *q = 2 ; 
          
           free( p ) ; 
          
           return 
           0 ; 
          
           }

很简单的程序，其中 q 没有被释放。我们设置了环境变量后并且 touch 出该文件

执行结果如下：

 
           p = 0x98c0378q =  
           0x98c0388

该文件内容如下

 
           = Start 
          
           @./test30:[ 
           0x8048446 
           ] +  
           0x98c0378 
           0x4 
          
           @./test30:[ 
           0x8048455 
           ] +  
           0x98c0388 
           0x4 
          
           @./test30:[ 
           0x804848f 
           ] -  
           0x98c0378

到这里我基本上讲完了，我们写程序时，数据部分内存使用的问题。

代码占用的内存

数据部分占用内存，那么我们写的程序是不是也占用内存呢？

在linux中，程序的加载，涉及到两个工具，linker 和loader。Linker主要涉及动态链接库的使用，loader主要涉及软件的加载。

exec执行一个程序
elf为现在非常流行的可执行文件的格式，它为程序运行划分了两个段，一个段是可以执行的代码段，它是只读，可执行；另一个段是数据段，它是可读写，不能执行。
loader会启动，通过mmap系统调用，将代码端和数据段映射到内存中，其实也就是为其分配了虚拟内存，注意这时候，还不占用物理内存；只有程序执行到了相应的地方，内核才会为其分配物理内存。
loader会去查找该程序依赖的链接库，首先看该链接库是否被映射进内存中，如果没有使用mmap，将代码段与数据段映射到内存中，否则只是将其加入进程的地址空间。这样比如glibc等库的内存地址空间是完全一样。

因此一个2M的程序，执行时，并不意味着为其分配了2M的物理内存，这与其运行了的代码量，与其所依赖的动态链接库有关。

运行过程中链接动态链接库与编译过程中链接动态库的区别

我们调用动态链接库有两种方法：一种是编译的时候，指明所依赖的动态链接库，这样loader可以在程序启动的时候，来所有的动态链接映射到内存中；一种是在运行过程中，通过dlopen和dlfree的方式加载动态链接库，动态将动态链接库加载到内存中。

这两种方式，从编程角度来讲，第一种是最方便的，效率上影响也不大，在内存使用上有些差别。

第一种方式，一个库的代码，只要运行过一次，便会占用物理内存，之后即使再也不使用，也会占用物理内存，直到进程的终止。

第二中方式，库代码占用的内存，可以通过dlfree的方式，释放掉，返回给物理内存。

这个差别主要对于那些寿命很长，但又会偶尔调用各种库的进程有关。如果是这类进程，建议采用第二种方式调用动态链接库

包含了所有CPU活跃的信息，该文件中的所有值都是从系统启动开始累计到当前时刻。

[root@localhost ~]# cat /proc/self/statm

654 57 44 0 0 334 0

输出解释

CPU 以及CPU0的每行的每个参数意思（以第一行为例）为：

参数解释 /proc/pid/statm

Size (pages) 任务虚拟地址空间的物理内存页数

Resident(pages) 应用程序正在使用的物理内存页数

Shared(pages) 共享页数 0

Trs(pages) 程序所拥有的可执行虚拟内存的物理内存页数

Lrs(pages) 被映像到任务的虚拟内存空间的库的物理内存页数

Drs(pages) 程序数据段和用户态的栈的物理内存页数

dt(pages) 0

linux下page的大小一般为4096，即4KB

查看linux下page大小的命令是 getconf PAGE_SIZE

打开 /proc/pid/statm 文件即可获取进程pid下包含了所有CPU活跃的信息，该文件中的所有值都是从系统启动开始累计到当前时刻。
[root@localhost ~]# cat /proc/self/statm
654 57 44 0 0 334 0
输出解释
CPU 以及CPU0的每行的每个参数意思（以第一行为例）为：
参数解释 /proc/pid/statm
Size (pages) 任务虚拟地址空间的物理内存页数
Resident(pages) 应用程序正在使用的物理内存页数
Shared(pages) 共享页数 0
Trs(pages) 程序所拥有的可执行虚拟内存的物理内存页数
Lrs(pages) 被映像到任务的虚拟内存空间的库的物理内存页数
Drs(pages) 程序数据段和用户态的栈的物理内存页数
dt(pages) 0
linux下page的大小一般为4096，即4KB
查看linux下page大小的命令是 getconf PAGE_SIZE
打开 /proc/pid/statm 文件即可获取进程pid下的内存使用情况的内存使用情况

linux 下面查看内存有多种渠道，比如通过命令 ps ,top,free 等，比如通过/proc系统，一般需要比较详细和精确地知道整机内存/某个进程内存的使用情况，最好通过/proc 系统，下面介绍/proc系统下内存相关的几个文件

单个进程的内存查看 cat /proc/[pid] 下面有几个文件： maps , smaps, status

maps 文件可以查看某个进程的代码段、栈区、堆区、动态库、内核区对应的虚拟地址，如果你还不了解linux进程的内存空间，可以参考这里。

下图是maps文件内存示例

 Develop>cat /proc/self/maps 
00400000-0040b000 r-xp 00000000 fd:00 48              /mnt/cf/orig/root/bin/cat
0060a000-0060b000 r--p 0000a000 fd:00 48              /mnt/cf/orig/root/bin/cat
0060b000-0060c000 rw-p 0000b000 fd:00 48              /mnt/cf/orig/root/bin/cat 代码段
0060c000-0062d000 rw-p 00000000 00:00 0               [heap] 堆区
7f1fff43b000-7f1fff5d4000 r-xp 00000000 fd:00 861   /mnt/cf/orig/root/lib64/libc-2.15.so
7f1fff5d4000-7f1fff7d3000 ---p 00199000 fd:00 861  /mnt/cf/orig/root/lib64/libc-2.15.so
7f1fff7d3000-7f1fff7d7000 r--p 00198000 fd:00 861   /mnt/cf/orig/root/lib64/libc-2.15.so
7f1fff7d7000-7f1fff7d9000 rw-p 0019c000 fd:00 861   /mnt/cf/orig/root/lib64/libc-2.15.so
7f1fff7d9000-7f1fff7dd000 rw-p 00000000 00:00 0 
7f1fff7dd000-7f1fff7fe000 r-xp 00000000 fd:00 2554  /mnt/cf/orig/root/lib64/ld-2.15.so
7f1fff9f9000-7f1fff9fd000 rw-p 00000000 00:00 0 
7f1fff9fd000-7f1fff9fe000 r--p 00020000 fd:00 2554  /mnt/cf/orig/root/lib64/ld-2.15.so
7f1fff9fe000-7f1fff9ff000 rw-p 00021000 fd:00 2554  /mnt/cf/orig/root/lib64/ld-2.15.so
7f1fff9ff000-7f1fffa00000 rw-p 00000000 00:00 0 
7fff443de000-7fff443ff000 rw-p 00000000 00:00 0     [stack] 用户态栈区
7fff443ff000-7fff44400000 r-xp 00000000 00:00 0     [vdso]
ffffffffff600000-ffffffffff601000 r-xp 00000000 00:00 0  [vsyscall] 内核区

有时候可以通过不断查看某个进程的maps文件，通过查看其虚拟内存（堆区）是否不停增长来简单判断进程是否发生了内存溢出。

maps文件只能显示简单的分区，smap文件可以显示每个分区的更详细的内存占用数据

下图是smaps文件内存示例, 实际显示内容会将每一个区都显示出来，下面我只拷贝了代码段和堆区，

每一个区显示的内容项目是一样的，smaps文件各项含义可以参考这里

 Develop>cat /proc/self/smaps 
00400000-0040b000 r-xp 00000000 fd:00 48  /mnt/cf/orig/root/bin/cat
Size:                 44 kB 虚拟内存大小
Rss:                  28 kB 实际使用物理内存大小
Pss:                  28 kB
Shared_Clean:         0 kB 页面被改，则是dirty,否则是clean,页面引用计数>1,是shared,否则是private
Shared_Dirty:          0 kB
Private_Clean:        28 kB
Private_Dirty:         0 kB
Referenced:           28 kB
Anonymous:             0 kB
AnonHugePages:         0 kB
Swap:                  0 kB  处于交换区的页面大小
KernelPageSize:        4 kB  操作系统一个页面大小
MMUPageSize:           4 kB  体系结构MMU一个页面大小 
Locked:                0 kB

0060c000-0062d000 rw-p 00000000 00:00 0 [heap]
Size: 132 kB
Rss: 8 kB
Pss: 8 kB
Shared_Clean: 0 kB
Shared_Dirty: 0 kB
Private_Clean: 0 kB
Private_Dirty: 8 kB
Referenced: 8 kB
Anonymous: 8 kB
AnonHugePages: 0 kB
Swap: 0 kB
KernelPageSize: 4 kB
MMUPageSize: 4 kB
Locked: 0 kB

下图是status文件内存示例, 加粗部分是内存相关的统计，

 Develop>cat /proc/24475/status
Name:    netio   可执行程序的名字
State:    R (running) 任务状态，运行/睡眠/僵死
Tgid:    24475  线程组号
Pid:    24475   进程id
PPid:    19635  父进程id
TracerPid:    0  
Uid:    0    0    0    0
Gid:    0    0    0    0
FDSize:    256 该进程最大文件描述符个数
Groups:    0 
VmPeak:     6330708 kB  内存使用峰值

VmSize:      268876 kB 进程虚拟地址空间大小

VmLck:           0 kB 进程锁住的物理内存大小，锁住的物理内存无法交换到硬盘

VmHWM:       16656 kB

VmRSS:       11420 kB 进程正在使用的物理内存大小

VmData:      230844 kB 进程数据段大小

VmStk:         136 kB 进程用户态栈大小

VmExe:         760 kB 进程代码段大小

VmLib:        7772 kB 进程使用的库映射到虚拟内存空间的大小

VmPTE:         120 kB 进程页表大小
VmSwap:           0 kB
Threads:    5
SigQ:    0/63346
SigPnd:    0000000000000000
ShdPnd:    0000000000000000
SigBlk:    0000000000000000
SigIgn:    0000000001000000
SigCgt:    0000000180000000
CapInh:    0000000000000000
CapPrm:    ffffffffffffffff
CapEff:    ffffffffffffffff
CapBnd:    ffffffffffffffff
Cpus_allowed:    01
Cpus_allowed_list:    0
Mems_allowed:    01
Mems_allowed_list:    0
voluntary_ctxt_switches:    201
nonvoluntary_ctxt_switches:    909

可以看到，linux下内存占用是一个比较复杂的概念，不能

简单通过一个单一指标就判断某个程序“内存消耗”大小，原因有下面2点：

进程所申请的内存不一定真正会被用到（malloc或mmap的实现）
真正用到了的内存也不一定是只有该进程自己在用 (比如动态共享库)

关于内存的使用分析及本文几个命令的说明也可以参考这里

下面是查看整机内存使用情况的文件 /proc/meminfo

 Develop>cat /proc/meminfo 
MemTotal:        8112280 kB 所有可用RAM大小 （即物理内存减去一些预留位和内核的二进制代码大小）
MemFree:         4188636 kB LowFree与HighFree的总和，被系统留着未使用的内存
Buffers:           34728 kB 用来给文件做缓冲大小
Cached:           289740 kB 被高速缓冲存储器（cache memory）用的内存的大小
                           （等于 diskcache minus SwapCache ）
SwapCached:            0 kB 被高速缓冲存储器（cache memory）用的交换空间的大小 
                            已经被交换出来的内存，但仍然被存放在swapfile中。
                            用来在需要的时候很快的被替换而不需要再次打开I/O端口
Active:           435240 kB 在活跃使用中的缓冲或高速缓冲存储器页面文件的大小，
                              除非非常必要否则不会被移作他用
Inactive:         231512 kB 在不经常使用中的缓冲或高速缓冲存储器页面文件的大小，可能被用于其他途径.
Active(anon):     361252 kB 
Inactive(anon):   120688 kB
Active(file):      73988 kB
Inactive(file):   110824 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:             0 kB 交换空间的总大小
SwapFree:              0 kB 未被使用交换空间的大小
Dirty:                 0 kB 等待被写回到磁盘的内存大小
Writeback:             0 kB 正在被写回到磁盘的内存大小
AnonPages:        348408 kB 未映射页的内存大小
Mapped:            33600 kB 已经被设备和文件等映射的大小
Shmem:            133536 kB 
Slab:              55984 kB 内核数据结构缓存的大小，可以减少申请和释放内存带来的消耗
SReclaimable:      25028 kB 可收回Slab的大小
SUnreclaim:        30956 kB 不可收回Slab的大小（SUnreclaim+SReclaimable＝Slab）
KernelStack:        1896 kB 内核栈区大小
PageTables:         8156 kB 管理内存分页页面的索引表的大小
NFS_Unstable:          0 kB 不稳定页表的大小
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:     2483276 kB
Committed_AS:    1804104 kB
VmallocTotal:   34359738367 kB 可以vmalloc虚拟内存大小
VmallocUsed:      565680 kB 已经被使用的虚拟内存大小
VmallocChunk:   34359162876 kB
HardwareCorrupted:     0 kB
HugePages_Total:    1536  大页面数目
HugePages_Free:        0 空闲大页面数目
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB 大页面一页大小
DirectMap4k:       10240 kB 
DirectMap2M:     8302592 kB

关于内存的两个概念

要理解top命令关于内存使用情况的输出，我们必须首先搞清楚虚拟内存（Virtual Memory）和驻留内存（Resident Memory）两个概念。

虚拟内存

　　　首先需要强调的是虚拟内存不同于物理内存，虽然两者都包含内存字眼但是它们属于两个不同层面的概念。进程占用虚拟内存空间大并非意味着程序的物理内存也一定占用很大。虚拟内存是操作系统内核为了对进程地址空间进行管理（process address space management）而精心设计的一个逻辑意义上的内存空间概念。我们程序中的指针其实都是这个虚拟内存空间中的地址。比如我们在写完一段C++程序之后都需要采用g++进行编译，这时候编译器采用的地址其实就是虚拟内存空间的地址。因为这时候程序还没有运行，何谈物理内存空间地址？凡是程序运行过程中可能需要用到的指令或者数据都必须在虚拟内存空间中。既然说虚拟内存是一个逻辑意义上（假象的）的内存空间，为了能够让程序在物理机器上运行，那么必须有一套机制可以让这些假象的虚拟内存空间映射到物理内存空间（实实在在的RAM内存条上的空间）。这其实就是操作系统中页映射表（page table）所做的事情了。内核会为系统中每一个进程维护一份相互独立的页映射表。。页映射表的基本原理是将程序运行过程中需要访问的一段虚拟内存空间通过页映射表映射到一段物理内存空间上，这样CPU访问对应虚拟内存地址的时候就可以通过这种查找页映射表的机制访问物理内存上的某个对应的地址。“页（page）”是虚拟内存空间向物理内存空间映射的基本单元。

　　　　　　　　　　　　　　　　　　图1. 虚拟内存空间到物理内存空间映射

驻留内存

　　关于虚拟内存和驻留内存这两个概念我们说到这里。下面一部分我们来看看top命令中VIRT、RES和SHR分别代表什么意思。

top命令中VIRT、RES和SHR的含义

进程的smaps文件

进程的虚拟内存空间的分布情况，比如heap占用了多少空间、文件映射（mmap）占用了多少空间、stack占用了多少空间？
进程是否有被交换到swap空间的内存，如果有，被交换出去的大小？
mmap方式打开的数据文件有多少页在内存中是脏页（dirty page）没有被写回到磁盘的？
mmap方式打开的数据文件当前有多少页面已经在内存中，有多少页面还在磁盘中没有加载到page cahe中？
等等

　　接下来8个字段的含义分别如下：

Size：表示该映射区域在虚拟内存空间中的大小。
Rss：表示该映射区域当前在物理内存中占用了多少空间　　　　　　
Shared_Clean：和其他进程共享的未被改写的page的大小
Shared_Dirty： 和其他进程共享的被改写的page的大小
Private_Clean：未被改写的私有页面的大小。
Private_Dirty： 已被改写的私有页面的大小。
Swap：表示非mmap内存（也叫anonymous memory，比如malloc动态分配出来的内存）由于物理内存不足被swap到交换空间的大小。
Pss：该虚拟内存区域平摊计算后使用的物理内存大小(有些内存会和其他进程共享，例如mmap进来的)。比如该区域所映射的物理内存部分同时也被另一个进程映射了，且该部分物理内存的大小为1000KB，那么该进程分摊其中一半的内存，即Pss=500KB。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　图2. smaps文件中的一条记录

　　有了smap如此详细关于虚拟内存空间到物理内存空间的映射信息，相信大家已经能够通过分析该文件回答上面提出的4个问题。

　最后希望所有读者能够通过阅读本文对进程的虚拟内存和物理内存有一个更加清晰认识，并能更加准确理解top命令关于内存的输出，最后可以通过smaps文件更进一步分析进程使用内存的情况。

你可能感兴趣的:(apue)

linux僵尸进程和孤儿进程 sfc0907 C语言僵尸进程孤儿进程 linux
原文出处：http://www.cnblogs.com/Anker/p/3271773.html孤儿进程与僵尸进程[总结]1、前言之前在看《unix环境高级编程》第八章进程时候，提到孤儿进程和僵尸进程，一直对这两个概念比较模糊。今天被人问到什么是孤儿进程和僵尸进程，会带来什么问题，怎么解决，我只停留在概念上面，没有深入，倍感惭愧。晚上回来google了一下，再次参考APUE，认真总结一下，加深理解
APUE读书笔记-前言-说明（1） QuietHeart
从某个地方曾经看到过，即使能够用100%的努力来描述想要描述的东西，对方也可能至多只接收到我们所描述的信息的很少一部分。于是，为了强调这说明的重要性，这里“冲动地”将前面对本文说明的描述单独提取出来，做一遍重复，希望通过这个方法，能将其描述的信息更多地传达给读者。算做一个无聊的尝试，可见本处说明的重要性。_1、注意阅读方式本书可以作为“字典”，供日常工作和学习等需要的时候查阅；根据读者所掌握的知识
阅读APUE需要考虑的问题 m风满楼
在io部分，每一章都提到了效率问题，用户cpu时间，系统cpu时间始终时间，这些都将称为程序性能调优的一些关键点=========================================================================第一章文件I/O系统调用和库调用文件属性指什么进程的工作目录是什么，相对路径指什么文件描述符是什么不用缓冲的i/o真的不用缓冲吗？答：当一个进
APUE第7章进程环境 MachinePlay
7.1引言image.png将介绍进程控制原语，在此之前需先了解进程的环境。本章中将学习:当程序执行时，其main函数是如何被调用的;命令行参数是如何传递给新程序的;典型的存储空间布局是什么样式;如何分配另外的存储空间;进程如何使用环境变量;进程的各种不同终止方式等。另外，还将说明longjmp和setjmp函数以及它们与栈的交互作用。本章结束之前，还将查看进程的资源限制。7.2main函数C程序
CentOS配置apue.h MachinePlay
apue.h是作者自己写的一个文件，包含了常用的头文件，系统不自带。其中包含了常用的头文件，以及出错处理函数的定义。使用起来确实很方便。使用apue.h需要一些配置（仅linux、unix可以使用）首先下载对应版本的压缩包选择版本新建一个自己准备存放源码的目录，然后下载mkdirAPUEcdAPUEwgethttp://www.apuebook.com/src.tar.gztar-zxvfsrc.
APUE学习：信号 hjyzjustudy Apue linux
信号机制是一个经典的进程异步机制。Linux信号机制的基本流程：用户程序为一个信号注册一个信号处理函数，例如SIGQUIT注册了一个sig_hander函数因为某些原因，进程从用户态切换到内核态从内核态要返回到用户态时，内核会去检测有没有给该进程传递一个SIGQUIT信号，如果有会在用户态下面去执行对应的信号处理函数sig_handersig_hander执行完毕之后会自动执行特殊的系统调用sig
APUE学习之路（进程间通信IPC）天连水尾水连天 APUE linux c语言
进程间通信（IPC）分为PIPE（管道）、Socket（套接字）和XSI（SystemV）。XSI又分为msg（消息队列）、sem（信号量数组）和shm（共享内存）。这些手段都是用于进程间通讯的，只有进程间通讯才需要借助第三方机制，线程之间的通讯是不需要借助第三方机制的，因为线程之间的地址空间是共享的。文章目录管道XSI消息队列（msg）信号量共享存储管道管道分为命名管道（FIFO）和匿名管道（P
APUE学习之进程间通信（IPC）（下篇）努力学代码的小信 APUE 学习 linux Unix环境高级编程
目录一、进程间通信（IPC）二、信号量（Semaphore）1、基本概念2、同步关系与互斥关系3、临界区与临界资源4、信号量的工作原理5、信号量编程6、实战演练三、共享内存（SharedMemory）1、基本概念2、共享内存的优点3、共享内存的缺点4、共享内存编程5、实战演练四、消息队列（MessageQueue）1、基本概念2、特点和用途3、消息队列编程4、实战演练五、学习心得一、进程间通信（I
APUE学习之进程间通信（IPC）（上篇）努力学代码的小信 APUE 学习 linux UNIX环境高级编程
目录一、进程间通信（IPC）二、信号（Signal）1、基本概念2、进程对信号的处理（1）signal（）函数（2）sigaction（）函数3、实战演练三、管道（pipe）1、基本概念2、管道的局限性3、管道的创建4、实战演练四、命名管道（fifo）1、基本概念2、命名管道的创建3、实战演练五、命名socket1、基本概念2、命名socket特点3、命名socket编程4、实战演练5、acces
APUE FIFO管道不知者不罪 unix环境高级编程 FIFO APUE
FIFO参考:http://blog.csdn.net/haomcu/article/details/46647843FIFO表示的是命名管道，可以在两个不相关进程之间进行通信(注:未命名管道是pipe)。FIFO也表示一种文件类型，可以通过S_ISFIFO(stat结构的st_mode成员的编码)宏来测试文件是否是FIFO类型.创建FIFO：#include//mode参数和open函数中的mo
APUE——IPC_管道，消息队列 liuge APUE Linux
1.匿名管道1.1匿名管道原理pipe（）创建管道，可以使用的单向数据通道用于进程间通信。数组pipefd用于返回引用管道末端的两个文件描述符。pipefd[0]是指管道的读取端。pipefd[1]是指写管道的末端。写入管道写入端的数据是由内核缓冲，直到从读取端读取管道。pipe函数#includeintpipe(intpipefd[2]);#define_GNU_SOURCE/*Seefeatu
APUE_管道 sicofield APUE Unix
1.引言管道是UNIX系统IPC的最古老形式，在shell下的表现形式为管道线。每当在管道线中输入一个由shell执行的命令序列时，shell为每一条命令单独创建一进程，然后将前一条命令进程的标准输出用管道与后一条命令的标准输入相连接。管道有两个主要局限：①管道是半双工的，即数据只能在一个方向上流动。虽然某些系统提供全双工管道但是为了可移植性，不能假定系统提供此功能。②管道只能在具有公共祖先的进程
[15]APUE：pipe / FIFO weixin_30702413 shell 操作系统
管道pipe一、概述管道(pipe/FIFO)是一种文件，属于pipefs文件系统类型，可以使用read、write、close等系统调用进行操作其本质是内核维护了一块缓冲区与管道相关联，对管道的任何操作，都将被内核转换成读写对应的内存缓冲区只有当所有的写入端描述符均已关闭，且管道中的数据都被读出后，对读端描述符调用read才会返回0(EOF)若所有读端已关闭，此时往管道的写操作会失败，调用进程会
APUE学习之信号（Signal）努力学代码的小信 APUE 学习 Linux环境编程
目录一、信号1、基本概念2、用户处理信号的方式3、查看信号4、可靠信号和不可靠信号5、信号种类6、终止进程信号的区别二、进程对信号的处理1、signal（）函数2、sigaction（）函数3、代码演示4、运行结果三、实战演练四、补充1、alarm（）函数2、wait（）函数3、僵尸进程和孤儿进程一、信号1、基本概念信号是Linux系统中用于进程之间通信或者操作的机制，它给进程提供一种异步的软件中
Linux下进程间通信：命名管道-mkfifo JiePro linux系统管理 IPC linux Linux LINUX mkfifo mknode 命名管道
Linux下进程间通信：命名管道-mkfifo摘要：进程间通信的方法有很多，FIFO与管道是最古老，也是相对来说更简单的一个通信机制。FIFO相对管道有一个优势，就是FIFO只要求两个进程是同一主机的，而不要求进程之间存在亲缘关系。FIFO是存在于文件系统的文件，可以使用诸如open、read、write等函数来操作。本文总结网络和APUE关于FIFO讨论，同时参考了Linux系统手册。目录[隐藏
APUE学习之管道（pipe）与命名管道（fifo）努力学代码的小信 APUE 学习 linux Linux环境编程
目录一、简介二、管道（Pipe）1、管道的基本概念2、管道的局限性3、管道的创建4、管道的读写规则5、实战演练三、命名管道（fifo）1、命名管道的基本概念2、命名管道的创建3、实战演练4、运行结果四、补充1、wait（）函数2、acess（）函数3、Linux下文件系统权限一、简介本篇文章主要讲解Linux环境编程中进程间通信的两种常用方法：管道（Pipe）和命名管道（FIFO）。管道：一种半双
APUE学习总结 weixin_34335458 shell 数据结构与算法运维
简介本文总结了个人，一个数字，对应称号《APUE》第一版的每一章，但是，独立的二级标题和书，人需求进行编写。3.文件I/O本章所说明的函数常常被称之为不带缓存的I/O（与第5章中说明的标准I/O函数相对比）3.1文件I/O函数大多数UNIX文件I/O仅仅需用到5个函数：open、read、write、lseek、close。需注意的是write后如须要read，则须要在read前加入lseek。由
APUE_第7章进程环境_学习笔记 rens111 APUE
7.1引言7.2main函数1）gcc编译器调用ld链接器，链接器一开始启动一个特殊的启动例程（此启动例程是程序的起始地址），启动立场从进程空间高地址处取得命令行参数和环境变量参数，然后调用main函数；7.3进程终止1）exit函数先执行一个标准的IO库的清理关闭操作：调用fclose函数关闭所有的流，使得所有的缓冲数据被冲洗；然后调用_exit或是_Exit;2）atexit函数，用来等级终止
APUE学习之守护进程努力学代码的小信 APUE 学习 linux unix
目录一、什么是守护进程1、守护进程的概念2、如何查看守护进程二、进程组与会话1、进程组2、会话3、总结三、编写守护进程1、编写流程图2、编写规则3、代码演示4、关闭守护进程四、daemon（）函数一、什么是守护进程1、守护进程的概念守护进程（DaemonProcess），也就是通常说的Daemon进程（精灵进程），是Linux中的后台服务进程。它是一个生存期较长的进程，通常独立于控制终端并且周期性
APUE学习之I/O多路复用努力学代码的小信 APUE 学习 linux c语言服务器
目录一、基础概念1、同步（Synchronous）和异步（Asynchronous）2、阻塞（Blocking）和非阻塞（Non-blocking）二、五种IO模型1、同步阻塞IO（BlockingIO）2、同步非阻塞IO（Non-blockingIO）3、IO多路复用（IOMultiplexing）4、信号驱动IO（signaldrivenIO）5、异步IO（AsynchronousIO）三、s
APUE学习之日志系统努力学代码的小信学习网络 unix
目录一、syslog概述二、syslog协议标准三、syslog函数1、openlog（）2、syslog（）3、closelog（）4、演示代码四、关于守护进程调用syslog，找不到/var/log/messages一、syslog概述以守护进程为例，该进程在后台默默运行，我们一般会关闭三个标准I/O，那么程序的运行状态信息该如何查看呢？让我们带这个这个疑问继续往下看吧！对于这个问题，我们可以
APUE学习之多线程编程努力学代码的小信 APUE 学习网络 linux
目录一、多线程编程基本概念二、多线程编程流程图三、多线程编程详解1、创建线程2、互斥锁3、死锁四、多线程改写服务器程序1、多进程服务端代码2、客户端进行温度上报代码3、运行结果一、多线程编程基本概念多线程编程是一种并发编程模型，允许程序同时执行多个独立的执行流（线程）。每个线程都是独立的、有自己的执行路径，但它们共享同一进程的资源，如内存空间、文件描述符等。多线程编程的基本概念包括以下几个方面：1
APUE学习之多进程编程努力学代码的小信 APUE 学习 linux 网络
一、简介服务器按处理方式可以分为迭代服务器和并发服务器两类。服务器每次只能处理一个客户的请求，它实现简单但效率很低，这种服务器通常称为迭代服务器。然而在实际应用中，不可能让一个服务器长时间为一个客户服务，而需要其具有同时处理多个客户请求的能力，这种同时可以处理多个客户请求的服务器称为并发服务器，其效率很高却实现复杂。在实际应用中，并发服务器应用的最广泛。Linux有3种实现并发服务器的方式：多进程
APUE学习笔记第七章进程环境 xuri8888 APUE学习笔记 LINUX APUE学习笔记
第七章进程环境本章中将学习：当程序执行时，其main函数是如何被调用的；命令行参数是如何传递到新程序的；典型的存储空间布局是什么样式；如何分配另外的存储空间；进程如何使用环境变量；进程的各种不同终止方式等。另外，还将说明longjmp和setjmp函数以及它们与栈的交互作用，进程的资源控制。1、main函数C程序总是从main函数开始执行，main函数的原型是：intmain(intargc,ch
APUE学习之socket网络编程努力学代码的小信 APUE linux 网络服务器
目录一、socket通信简介二、socket通信的基本流程三、socket服务器和客户端示例代码1、服务端2、客户端3、运行结果四、socket编程函数详解1、socket（）函数2、bind（）函数3、网络字节序和主机字节序4、listen（）函数5、accept（）函数6、connect（）函数7、close（）、shutdown（）函数一、socket通信简介Socket通信是一种计算机网络
APUE学习笔记（八）进程控制伊库塔花花学习记录
8.1进程标识每个进程都有一个非负整型表示的唯一进程ID。进程ID是可重用的。ID为0的进程通常是调度进程，常常被称为交换进程（swapper）。该进程是内核的一部分，它并不执行任何磁盘上的程序。ID为1通常是init进程，在自举过程结束时由内核调用。#include#include#includeintmain(intargc,char*argv[]){printf("%d\n",getpid(
APUE学习笔记（七）进程环境伊库塔花花学习记录
7.1main函数c程序总是从main函数开始执行。在调用main前先调用一个特殊的启动例程，从内核取得命令行参数和环境变量值。7.2进程终止正常终止（1）从main返回；（2）调用exit；（3）调用_exit或_Exit；（4）最后一个线程从其启动例程返回（5）从最后一个线程调用pthread_exit_exit和_Exit立即进入内核，exit则先执行一些清理处理，对于所有打开流调用fclo
APUE学习（一） SL007766 APUE学习学习 unix linux
UNIX基础概括体系结构操作系统是一个软件，功能主要为控制计算机硬件资源，提供程序运行环境。通常将这种软件称为内核(kernel)，相对较小。内核的接口称为系统调用公用函数库构建在系统调用接口上，应用程序即可使用公用函数库，也可使用系统调用。shell是一个特殊的应用程序，为运行其他应用程序提供了一个接口。广义上来说，操作系统包括了内核和一些其他软件，这些软件使得计算机能够发挥作用，并使计算机具有
APUE学习笔记——进程控制长山互联网未来探索 UNIX/linux 软件学习笔记 unix system thread
1.getpid可以获取进程id。getppid可以获取进程调用进程的id。2.fork函数：一次调用，两次返回：返回0是在子进程中。返回其他值在父进程中。如果大于0为子进程id；否则失败。3.子进程获得了父进程的数据空间（DATA,BSS），堆，栈的副本。进程之间共享正文段。4.目前的实现一般不进行全部复制，而实现的是写时复制：及经常只读共享部分，一个进程去更改一块内存是，为这块内存建立一个副本
APUE学习之进程资源限制努力学代码的小信 APUE 学习 unix linux
目录一、进程资源限制二、getrlimit（）和setrlimit函数1、参数说明2、代码演示3、注意事项如果对多进程编程不熟悉的同学，推荐先看看《APUE学习之多进程编程》这篇文章。通过多进程编程的学习，我们可以使用多进程来实现多个客户端的并发，那是不是一个服务器可以给无限多个客户端提供服务呢？让我们一起带着这个疑问往下学习吧！一、进程资源限制首先，一个服务器肯定是不能给无限多个客户端提供服务。
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu