【Linux/Unix系统编程手册笔记】线程

简介

线程是允许应用程序并发执行多个任务的一种机制。一个进程可以包含多个线程,同一程序中的所有线程均会独立执行相同程序,且共享同一份全局内存区域、其中包括初始化数据段、未初始化数据段、以及内存段。

4个线程的进程图:

image

进程VS线程:

  • 进程间的信息难以共享。由于除去只读代码段外,父子进程并未共享内存,因此必须采用一些进程间通信(IPC)的方式,在进程间进行信息交换。
  • 调用fork()创建进程的代价相对较高,创建线程要快于创建进程,线程间上下文切换器消耗时间一般比进程要短。
  • 多线程编程时,需要保证线程安全。
  • 某个线程的bug可能会危及该进程的所有线程,因为它们共享着相同的地址空间和其他属性。相比之下,进程间隔离更彻底。
  • 每个线程都在争用宿主进程中有限的虚拟地址空间。

线程共享的一些属性:

  • 全局内存
  • 进程ID和父进程ID
  • 进程组ID和会话ID
  • 控制终端
  • 进程凭证
  • 打开的文件描述符
  • 由fcntl()创建的记录锁
  • 信号处置
  • 文件系统的相关信息
  • ...

线程同步

互斥量

临界区是指访问某一共享资源的代码片段,并且这段代码的执行应为原子操作,亦即,同时访问同一共享资源的其他线程不应中断该片段的执行。

为了避免线程更新共享变量时所出现问题,必须使用互斥量来确保同时仅有一个线程可以访问某项共享资源,可以使用互斥量来保证任意共享资源的原子访问。

互斥量有两种状态:已锁定和未锁定。

任何时候,至多只有一个线程可以锁定该互斥量,试图对已经锁定的某一互斥量再次加锁,将可能阻塞线程或者报错失败。

两个方法:

pthread_mutex_lock
pthread_mutex_unlock

互斥量的死锁:有时,一个线程需要同时访问两个或更多不同的共享资源,而每个资源又都由不同的互斥量管理。当超过一个线程加锁同一组互斥量时,就有可能发生死锁。

image

要避免此类死锁问题,当多个线程对一组互斥锁操作时,总是应该以相同顺序对该组互斥量进行锁定。

条件变量

互斥量防止多个线程同时访问同一共享变量,条件变量允许一个线程就某个共享变量的状态变化通知其他线程,并让其他线程等待(阻塞)这一通知。

线程安全

若函数可同时供多个线程安全调用,则称之为线程安全函数,反之,如果函数不是线程安全的,则不能并发调用。(比如函数中修改了全局或静态变量,那么多个线程之间是共享这个数据的,不能保证最终的结果)

实现线程安全的方式:

  • 将函数与互斥量关联使用(并发性能下降)
  • 仅在函数中操作共享变量(临界区)的代码前后加入互斥锁

重入:重入函数不在连续的调用中保存静态数据,也不返回指向静态数据的指针。所有的数据都是由函数的调用程序提供的。重入函数不得调用非重入函数。

可重入函数则无需使用互斥量即可实现线程安全,其要诀在于避免对全局和静态变量的使用,需要返回给调用者的任何信息,亦或是需要在对函数的历次调用间加以维护的信息,都存储于调用者分配的缓冲区内。

线程取消

函数pthread_cancel()向由thread指定的线程发送一个取消请求,要求目标线程终止。该方法会立即返回,不会等待目标线程取消后再返回。

目标线程如何响应,取决于其取消性状态和类型,如果禁用线程的取消性状态,那么请求会保持挂起状态,直至将线程的取消性状态置为启用,如果启用取消性状态,那么线程何时响应请求则依赖于取消性类型。若类型为延迟取消,则在线程下一次调用某个取消点时,取消发生。如果为异步取消类型,取消动作随时可能发生。

线程可以设置一个清理函数栈,其中的清理函数属于由开发人员定义的函数,当线程遭到取消时,会自动调用这些函数以执行清理工作(例如,恢复共享变量状态,或解锁互斥量)

线程栈

创建线程时,每个线程都有一个属于自己的线程栈,且大小固定,除主线程外的所有线程,其栈的缺省大小均为2MB。

你可能感兴趣的:(【Linux/Unix系统编程手册笔记】线程)