多线程内存模型及同步和互斥简介

       线程是与进程相关的一个执行单元,它拥有自己的线程ID,栈内存,栈指针,PC(程序计数器),条件变量(condition codes)和通用寄存器等。对于一个进程下的多线程而言,它们在同一个进程下并发执行,并且它们共享代码,数据,堆内存,共享库,信号处理函数和文件描述符。

       从多线程的视角,一个进程可按如下视图理解:

      多线程内存模型及同步和互斥简介_第1张图片

      其中,SP代表stack pointer, PC代表program counter, TID 代表thread ID.

      也就是说,多线程运行在一个进程的上下文中。每一个线程有自己的线程上下文,包括线程ID,栈内存,栈指针,程序计数器,条件代码和通用寄存器等。线程上下文只是进程上下文的一部分,剩余部分(包括整个用户虚拟地址空间,主要由只读文本/代码, 可读/写数据,堆内存及所有共享库代码和数据域)由各个线程共享。线程之间同时共享打开的文件和已安装的信号处理函数。寄存器永远是线程私有的,而虚拟空间则一直是线程间共享的。

     线程同步是指线程之间所具有的一种制约关系,一个线程的执行依赖另一个线程的消息,当它没有得到另一个线程的消息时应等待,直到消息到达时才被唤醒。

     线程互斥是指对于共享的进程系统资源,在各单个线程访问时的排它性。当有若干个线程都要使用某一共享资源时,任何时刻最多只允许一个线程去使用,其它要使用该资源的线程必须等待,直到占用资源者释放该资源。线程互斥可以看成是一种特殊的线程同步(下文统称为同步)。

     线程间的同步方法大体可分为两类:用户模式和内核模式。顾名思义,内核模式就是指利用系统内核对象的单一性来进行同步,使用时需要切换内核态与用户态,而用户模式就是不需要切换到内核态,只在用户态完成操作。
用户模式下的方法有:原子操作(例如一个单一的全局变量),临界区。内核模式下的方法有事件,信号量,互斥量。



附:一些测验

1. 在Windows编程中互斥量与临界区比较类似,请分析一下二者的主要区别。

两者都可以用于同一进程中不同子线程对资源的互斥访问。

临界区是用户模式下的互斥访问手段,互斥量是内核模式下的互斥访问手段。

critical section: 保证在某一时刻只有一个线程能访问数据的简便办法。在任意时刻只允许一个线程对共享资源进行访问。如果有多个线程试图同时访问临界区,那么在有一个线 程进入后其他所有试图访问此临界区的线程将被挂起,并一直持续到进入临界区的线程离开。临界区在被释放后,其他线程可以继续抢占,并以此达到用原子方式操 作共享资源的目的。 
临界区包含两个操作原语: 
EnterCriticalSection() 进入临界区 
LeaveCriticalSection() 离开临界区 
EnterCriticalSection()语句执行后代码将进入临界区以后无论发生什么,必须确保与之匹配的 LeaveCriticalSection()都能够被执行到。否则临界区保护的共享资源将永远不会被释放。虽然临界区同步速度很快,但却只能用来同步本 进程内的线程,而不可用来同步多个进程中的线程。 

mutex: 互斥量是内核对象,因此还可以用于不同进程中子线程对资源的互斥访问。互斥量可以很好的解决由于线程意外终止资源无法释放的问题。

2. 临界区、互斥量、信号、时间的比较分析。

四种进程或线程同步互斥的控制方法
1、临界区:通过对多线程的串行化来访问公共资源或一段代码,速度快,适合控制数据访问。 
2、互斥量:为协调共同对一个共享资源的单独访问而设计的。 
3、信号量:为控制一个具有有限数量用户资源而设计。 
4、事 件:用来通知线程有一些事件已发生,从而启动后继任务的开始。 

 

critical section: 保证在某一时刻只有一个线程能访问数据的简便办法。在任意时刻只允许一个线程对共享资源进行访问。如果有多个线程试图同时访问临界区,那么在有一个线 程进入后其他所有试图访问此临界区的线程将被挂起,并一直持续到进入临界区的线程离开。临界区在被释放后,其他线程可以继续抢占,并以此达到用原子方式操 作共享资源的目的。 
临界区包含两个操作原语: 
EnterCriticalSection() 进入临界区 
LeaveCriticalSection() 离开临界区 
EnterCriticalSection()语句执行后代码将进入临界区以后无论发生什么,必须确保与之匹配的 LeaveCriticalSection()都能够被执行到。否则临界区保护的共享资源将永远不会被释放。虽然临界区同步速度很快,但却只能用来同步本 进程内的线程,而不可用来同步多个进程中的线程。 
MFC提供了很多功能完备的类,我用MFC实现了临界区。MFC为临界区提供有一个CCriticalSection类,使用该类进行线程同步处理是 非常简单的。只需在线程函数中用CCriticalSection类成员函数Lock()和UnLock()标定出被保护代码片段即可。Lock()后代 码用到的资源自动被视为临界区内的资源被保护。UnLock后别的线程才能访问这些资源。

mutex:互斥量跟临界区很相似,只有拥有互斥对象的线程才具有访问资源的权限,由于互斥对象只有一个,因此就决定了任何情况下此共享资源都不会同时被多个线程 所访问。当前占据资源的线程在任务处理完后应将拥有的互斥对象交出,以便其他线程在获得后得以访问资源。互斥量比临界区复杂。因为使用互斥不仅仅能够在同 一应用程序不同线程中实现资源的安全共享,而且可以在不同应用程序的线程之间实现对资源的安全共享。 

互斥量包含的几个操作原语: 
CreateMutex() 创建一个互斥量 
OpenMutex() 打开一个互斥量 
ReleaseMutex() 释放互斥量 
WaitForMultipleObjects() 等待互斥量对象 

同样MFC为互斥量提供有一个CMutex类。使用CMutex类实现互斥量操作非常简单,但是要特别注意对CMutex的构造函数的调用 
CMutex( BOOL bInitiallyOwn = FALSE, LPCTSTR lpszName = NULL, LPSECURITY_ATTRIBUTES lpsaAttribute = NULL) 
不用的参数不能乱填,乱填会出现一些意想不到的运行结果。

 

semaphore: 信号量对象对线程的同步方式与前面几种方法不同,信号允许多个线程同时使用共享资源,这与操作系统中的PV操作相同。它指出了同时访问共享资源的线程 最大数目。它允许多个线程在同一时刻访问同一资源,但是需要限制在同一时刻访问此资源的最大线程数目。在用CreateSemaphore()创建信号量 时即要同时指出允许的最大资源计数和当前可用资源计数。一般是将当前可用资源计数设置为最大资源计数,每增加一个线程对共享资源的访问,当前可用资源计数 就会减1,只要当前可用资源计数是大于0的,就可以发出信号量信号。但是当前可用计数减小到0时则说明当前占用资源的线程数已经达到了所允许的最大数目, 不能在允许其他线程的进入,此时的信号量信号将无法发出。线程在处理完共享资源后,应在离开的同时通过ReleaseSemaphore()函数将当前可 用资源计数加1。在任何时候当前可用资源计数决不可能大于最大资源计数。 
PV操作及信号量的概念都是由荷兰科学家E.W.Dijkstra提出的。信号量S是一个整数,S大于等于零时代表可供并发进程使用的资源实体数,但S小于零时则表示正在等待使用共享资源的进程数。 
P操作 申请资源: 
     (1)S减1; 
     (2)若S减1后仍大于等于零,则进程继续执行; 
     (3)若S减1后小于零,则该进程被阻塞后进入与该信号相对应的队列中,然后转入进程调度。 
   V操作 释放资源: 
     (1)S加1; 
     (2)若相加结果大于零,则进程继续执行; 
     (3)若相加结果小于等于零,则从该信号的等待队列中唤醒一个等待进程,然后再返回原进程继续执行或转入进程调度。 

信号量包含的几个操作原语: 
     CreateSemaphore() 创建一个信号量 
     OpenSemaphore() 打开一个信号量 
     ReleaseSemaphore() 释放信号量 
     WaitForSingleObject() 等待信号量 

 

event: 事件对象也可以通过通知操作的方式来保持线程的同步。并且可以实现不同进程中的线程同步操作。 
信号量包含的几个操作原语: 
     CreateEvent() 创建一个信号量 
     OpenEvent() 打开一个事件 
     SetEvent() 回置事件 
     WaitForSingleObject() 等待一个事件 
     WaitForMultipleObjects()         等待多个事件 
       WaitForMultipleObjects 函数原型: 
        WaitForMultipleObjects( 
        IN DWORD nCount, // 等待句柄数 
        IN CONST HANDLE *lpHandles, //指向句柄数组 
        IN BOOL bWaitAll, //是否完全等待标志 
        IN DWORD dwMilliseconds //等待时间 
        ) 
参数nCount指定了要等待的内核对象的数目,存放这些内核对象的数组由lpHandles来指向。fWaitAll对指定的这nCount个内核 对象的两种等待方式进行了指定,为TRUE时当所有对象都被通知时函数才会返回,为FALSE则只要其中任何一个得到通知就可以返回。 dwMilliseconds在这里的作用与在WaitForSingleObject()中的作用是完全一致的。如果等待超时,函数将返回 WAIT_TIMEOUT。

总结: 
1. 互斥量与临界区的作用非常相似,但互斥量是可以命名的,也就是说它可以跨越进程使用。所以创建互斥量需要的资源更多,所以如果只为了在进程内部是用的话使 用临界区会带来速度上的优势并能够减少资源占用量。因为互斥量是跨进程的互斥量一旦被创建,就可以通过名字打开它。 
2. 互斥量(Mutex),信号灯(Semaphore),事件(Event)都可以被跨越进程使用来进行同步数据操作,而其他的对象与数据同步操作无关,但 对于进程和线程来讲,如果进程和线程在运行状态则为无信号状态,在退出后为有信号状态。所以可以使用WaitForSingleObject来等待进程和 线程退出。 
3. 通过互斥量可以指定资源被独占的方式使用,但如果有下面一种情况通过互斥量就无法处理,比如现在一位用户购买了一份三个并发访问许可的数据库系统,可以根 据用户购买的访问许可数量来决定有多少个线程/进程能同时进行数据库操作,这时候如果利用互斥量就没有办法完成这个要求,信号灯对象可以说是一种资源计数 器。


     注:本文观点来自网络整理。

主要参考了: http://www.cnblogs.com/astwish/articles/3439308.html





你可能感兴趣的:(编程基础)