Linux 同步方法剖析

 

Linux 同步方法剖析

内核原子,自旋锁,信号量和互斥锁

 

简介: 在学习 Linux® 的过程中,您也许接触过并发(concurrency)、临界段(critical section)和锁定,但是如何在内核中使用这些概念呢?本文讨论了 2.6 版内核中可用的锁定机制,包括原子运算符(atomic operator)、自旋锁(spinlock)、读/写锁(reader/writer lock)和内核信号量(kernel semaphore)。 本文还探讨了每种机制最适合应用到哪些地方,以构建安全高效的内核代码。

 

本文讨论了 Linux 内核中可用的大量同步或锁定机制。这些机制为 2.6.23 版内核的许多可用方法提供了应用程序接口(API)。但是在深入学习 API 之前,首先需要明白将要解决的问题。

并发和锁定

当存在并发特性时,必须使用同步方法。当在同一时间段出现两个或更多进程并且这些进程彼此交互(例如,共享相同的资源)时,就存在并发 现象。

在单处理器(uniprocessor,UP)主机上可能发生并发,在这种主机中多个线程共享同一个 CPU 并且抢占(preemption)创建竞态条件。抢占 通过临时中断一个线程以执行另一个线程的方式来实现 CPU 共享。竞态条件 发生在两个或更多线程操纵一个共享数据项时,其结果取决于执行的时间。在多处理器(MP)计算机中也存在并发,其中每个处理器中共享相同数据的线程同时执行。注意在 MP 情况下存在真正的并行(parallelism),因为线程是同时执行的。而在 UP 情形中,并行是通过抢占创建的。两种模式中实现并发都较为困难。

Linux 内核在两种模式中都支持并发。内核本身是动态的,而且有许多创建竞态条件的方法。Linux 内核也支持多处理(multiprocessing),称为对称多处理(SMP)。可以在本文后面的 参考资料 部分学到更多关于 SMP 的知识。

临界段概念是为解决竞态条件问题而产生的。一个临界段 是一段不允许多路访问的受保护的代码。这段代码可以操纵共享数据或共享服务(例如硬件外围设备)。临界段操作时坚持互斥锁(mutual exclusion)原则(当一个线程处于临界段中时,其他所有线程都不能进入临界段)。

临界段中需要解决的一个问题是死锁条件。考虑两个独立的临界段,各自保护不同的资源。每个资源拥有一个锁,在本例中称为 A 和 B。假设有两个线程需要访问这些资源,线程 X 获取了锁 A,线程 Y 获取了锁 B。当这些锁都被持有时,每个线程都试图占有其他线程当前持有的锁(线程 X 想要锁 B,线程 Y 想要锁 A)。这时候线程就被死锁了,因为它们都持有一个锁而且还想要其他锁。一个简单的解决方案就是总是按相同次序获取锁,从而使其中一个线程得以完成。还需要其他解决方案检测这种情形。表 1 定义了此处用到的一些重要的并发术语。


表 1. 并发中的重要定义

术语

定义

竞态条件

两个或更多线程同时操作资源时将会导致不一致的结果。

临界段

用于协调对共享资源的访问的代码段。

互斥锁

确保对共享资源进行排他访问的软件特性。

死锁

由两个或更多进程和资源锁导致的一种特殊情形,将会降低进程的工作效率。

 

Linux 同步方法

如果您了解了一些基本理论并且明白了需要解决的问题,接下来将学习 Linux 支持并发和互斥锁的各种方法。在以前,互斥锁是通过禁用中断来提供的,但是这种形式的锁定效率比较低(现在在内核中仍然存在这种用法)。这种方法也不能进行扩展,而且不能保证其他处理器上的互斥锁。

在以下关于锁定机制的讨论中,我们首先看一下原子运算符,它可以保护简单变量(计数器和位掩码(bitmask))。然后介绍简单的自旋锁和读/写锁,它们构成了一个 SMP 架构的忙等待锁(busy-wait lock)覆盖。最后,我们讨论构建在原子 API 上的内核互斥锁。

原子操作

Linux 中最简单的同步方法就是原子操作。原子 意味着临界段被包含在 API 函数中。不需要额外的锁定,因为 API 函数已经包含了锁定。由于 C 不能实现原子操作,因此 Linux 依靠底层架构来提供这项功能。各种底层架构存在很大差异,因此原子函数的实现方法也各不相同。一些方法完全通过汇编语言来实现,而另一些方法依靠 c 语言并且使用 local_irq_savelocal_irq_restore 禁用中断。

旧的锁定方法

在内核中实现锁定的一种不太好的方法是通过禁用本地 CPU 的硬中断。这些函数均可用并且仍得到使用(有时用于原子运算符),但我们并不推荐使用。local_irq_save 例程禁用中断,而 local_irq_restore 恢复以前启用过的中断。这些例程都是可重入的(reentrant),也就是说它们可以在其他例程上下文中被调用。

当需要保护的数据非常简单时,例如一个计数器,原子运算符是种理想的方法。尽管原理简单,原子 API 提供了许多针对不同情形的运算符。下面是一个使用此 API 的示例。

要声明一个原子变量(atomic variable),首先声明一个 atomic_t 类型的变量。这个结构包含了单个 int 元素。接下来,需确保您的原子变量使用 ATOMIC_INIT 符号常量进行了初始化。在清单 1 的情形中,原子计数器被设置为 0。也可以使用 atomic_set function 在运行时对原子变量进行初始化。


清单 1. 创建和初始化原子变量

                
atomic_t my_counter ATOMIC_INIT(0);
 
... or ...
 
atomic_set( &my_counter, 0 );

 

原子 API 支持一个涵盖许多用例的富函数集。可以使用 atomic_read 读取原子变量中的内容,也可以使用 atomic_add 为一个变量添加指定值。最常用的操作是使用 atomic_inc 使变量递增。也可用减号运算符,它的作用与相加和递增操作相反。清单 2. 演示了这些函数。


清单 2. 简单的算术原子函数

                
val = atomic_read( &my_counter );
 
atomic_add( 1, &my_counter );
 
atomic_inc( &my_counter );
 
atomic_sub( 1, &my_counter );
 
atomic_dec( &my_counter );

 

该 API 也支持许多其他常用用例,包括 operate-and-test 例程。这些例程允许对原子变量进行操纵和测试(作为一个原子操作来执行)。一个叫做 atomic_add_negative 的特殊函数被添加到原子变量中,然后当结果值为负数时返回真(true)。这被内核中一些依赖于架构的信号量函数使用。

许多函数都不返回变量的值,但两个函数除外。它们会返回结果值( atomic_add_returnatomic_sub_return),如清单 3所示。


清单 3. Operate-and-test 原子函数

                
if (atomic_sub_and_test( 1, &my_counter )) {
  // my_counter is zero
}
 
if (atomic_dec_and_test( &my_counter )) {
  // my_counter is zero
}
 
if (atomic_inc_and_test( &my_counter )) {
  // my_counter is zero
}
 
if (atomic_add_negative( 1, &my_counter )) {
  // my_counter is less than zero
}
 
val = atomic_add_return( 1, &my_counter ));
 
val = atomic_sub_return( 1, &my_counter ));

 

如果您的架构支持 64 位长类型(BITS_PER_LONG 是 64 的),那么可以使用 long_t atomic 操作。可以在 linux/include/asm-generic/atomic.h 中查看可用的长操作(long operation)。

原子 API 还支持位掩码(bitmask)操作。跟前面提到的算术操作不一样,它只包含设置和清除操作。许多驱动程序使用这些原子操作,特别是 SCSI。位掩码原子操作的使用跟算术操作存在细微的差别,因为其中只有两个可用的操作(设置掩码和清除掩码)。使用这些操作前,需要提供一个值和将要进行操作的位掩码,如清单 4 所示。


清单 4. 位掩码原子函数

                
unsigned long my_bitmask;
 
atomic_clear_mask( 0, &my_bitmask );
 
atomic_set_mask( (1<<24), &my_bitmask );

 

原子 API 原型

原子操作依赖于架构,可以在 ./linux/include/asm-<arch>/atomic.h 中找到。

自旋锁

自旋锁是使用忙等待锁来确保互斥锁的一种特殊方法。如果锁可用,则获取锁,执行互斥锁动作,然后释放锁。如果锁不可用,线程将忙等待该锁,直到其可用为止。忙等待看起来效率低下,但它实际上比将线程休眠然后当锁可用时将其唤醒要快得多。

自旋锁只在 SMP 系统中才有用,但是因为您的代码最终将会在 SMP 系统上运行,将它们添加到 UP 系统是个明智的做法。

自旋锁有两种可用的形式:完全锁(full lock)和读写锁。首先看一下完全锁。

首先通过一个简单的声明创建一个新的自旋锁。这可以通过调用 spin_lock_init 进行初始化。清单 5 中显示的每个变量都会实现相同的结果。


清单 5. 创建和初始化自旋锁

                
spinlock_t my_spinlock = SPIN_LOCK_UNLOCKED;
 
... or ...
 
DEFINE_SPINLOCK( my_spinlock );
 
... or ...
 
spin_lock_init( &my_spinlock );

 

定义了自旋锁之后,就可以使用大量的锁定变量了。每个变量用于不同的上下文。

清单 6 中显示了 spin_lockspin_unlock 变量。这是一个最简单的变量,它不会执行中断禁用,但是包含全部的内存壁垒(memory barrier)。这个变量假定中断处理程序和该锁之间没有交互。


清单 6. 自旋锁 lock 和 unlock 函数

                
                spin_lock( &my_spinlock );
 
// critical section
 
spin_unlock( &my_spinlock );

 

接下来是 irqsaveirqrestore 对,如清单 7 所示。spin_lock_irqsave 函数需要自旋锁,并且在本地处理器(在 SMP 情形中)上禁用中断。spin_unlock_irqrestore 函数释放自旋锁,并且(通过 flags 参数)恢复中断。


清单 7. 自旋锁变量,其中禁用了本地 CPU 中断

                
                spin_lock_irqsave( &my_spinlock, flags );
 
// critical section
 
spin_unlock_irqrestore( &my_spinlock, flags );

 

spin_lock_irqsave/spin_unlock_irqrestore 的一个不太安全的变体是 spin_lock_irq/spin_unlock_irq。我建议不要使用此变体,因为它会假设中断状态。

最后,如果内核线程通过 bottom half 方式共享数据,那么可以使用自旋锁的另一个变体。bottom half 方法可以将设备驱动程序中的工作延迟到中断处理后执行。这种自旋锁禁用了本地 CPU 上的软中断。这可以阻止 softirq、tasklet 和 bottom half 在本地 CPU 上运行。这个变体如清单 8 所示。


清单 8. 自旋锁函数实现 bottom-half 交互

                
                spin_lock_bh( &my_spinlock );
 
// critical section
 
spin_unlock_bh( &my_spinlock );

 

读/写锁

在许多情形下,对数据的访问是由大量的读和少量的写操作来完成的(读取数据比写入数据更常见)。读/写锁的创建就是为了支持这种模型。这个模型有趣的地方在于允许多个线程同时访问相同数据,但同一时刻只允许一个线程写入数据。如果执行写操作的线程持有此锁,则临界段不能由其他线程读取。如果一个执行读操作的线程持有此锁,那么多个读线程都可以进入临界段。清单 9 演示了这个模型。


清单 9. 读/写自旋锁函数

                
rwlock_t my_rwlock;
 
rwlock_init( &my_rwlock );
 
write_lock( &my_rwlock );
 
// critical section -- can read and write
 
write_unlock( &my_rwlock );
 
 
read_lock( &my_rwlock );
 
// critical section -- can read only
 
read_unlock( &my_rwlock );

 

根据对锁的需求,还针对 bottom half 和中断请求(IRQ)对读/写自旋锁进行了修改。显然,如果您使用的是原版的读/写锁,那么按照标准自旋锁的用法使用这个自旋锁,而不区分读线程和写线程。

内核互斥锁

在内核中可以使用互斥锁来实现信号量行为。内核互斥锁是在原子 API 之上实现的,但这对于内核用户是不可见的。互斥锁很简单,但是有一些规则必须牢记。同一时间只能有一个任务持有互斥锁,而且只有这个任务可以对互斥锁进行解锁。互斥锁不能进行递归锁定或解锁,并且互斥锁可能不能用于交互上下文。但是互斥锁比当前的内核信号量选项更快,并且更加紧凑,因此如果它们满足您的需求,那么它们将是您明智的选择。

可以通过 DEFINE_MUTEX 宏使用一个操作创建和初始化互斥锁。这将创建一个新的互斥锁并初始化其结构。可以在 ./linux/include/linux/mutex.h 中查看该实现。

                DEFINE_MUTEX( my_mutex );

 

互斥锁 API 提供了 5 个函数:其中 3 个用于锁定,一个用于解锁,另一个用于测试互斥锁。首先看一下锁定函数。在需要立即锁定以及希望在互斥锁不可用时掌握控制的情形下,可以使用第一个函数 mutex_trylock。该函数如清单 10 所示。


清单 10. 尝试使用 mutex_trylock获得互斥锁

                
ret = mutex_trylock( &my_mutex );
if (ret != 0) {
  // Got the lock!
} else {
  // Did not get the lock
}

 

如果想等待这个锁,可以调用 mutex_lock。这个调用在互斥锁可用时返回,否则,在互斥锁锁可用之前它将休眠。无论在哪种情形中,当控制被返回时,调用者将持有互斥锁。最后,当调用者休眠时使用 mutex_lock_interruptible。在这种情况下,该函数可能返回 -EINTR。清单 11 中显示了这两种调用。


清单 11. 锁定一个可能处于休眠状态的互斥锁

                
                mutex_lock( &my_mutex );
 
// Lock is now held by the caller.
 
if (mutex_lock_interruptible( &my_mutex ) != 0)  {
 
  // Interrupted by a signal, no mutex held
 
}

 

当一个互斥锁被锁定后,它必须被解锁。这是由 mutex_unlock 函数来完成的。这个函数不能从中断上下文调用。最后,可以通过调用 mutex_is_locked 检查互斥锁的状态。这个调用实际上编译成一个内联函数。如果互斥锁被持有(锁定),那么就会返回 1;否则,返回 0。清单 12 演示了这些函数。


清单 12. mutex_is_locked测试互斥锁锁

                
                mutex_unlock( &my_mutex );
 
if (mutex_is_locked( &my_mutex ) == 0) {
 
  // Mutex is unlocked
 
}

 

互斥锁 API 存在着自身的局限性,因为它是基于原子 API 的。但是其效率比较高,如果能满足你的需要,还是可以使用的。

大内核锁(Big kernel lock)

最后看一下大内核锁(BLK)。它在内核中的用途越来越小,但是仍然有一些保留下来的用法。BKL 使多处理器 Linux 成为可能,但是细粒度(finer-grained)锁正在慢慢取代 BKL。BKL 通过 lock_kernelunlock_kernel 函数提供。要获得更多信息,请查看 ./linux/lib/kernel_lock.c。

目前来说内核中原子操作多用来做计数使用,其它情况最常用的是两种锁以及它们的变种:一个是自旋锁,另一个是信号量。我们下面就来着重介绍一下这两种锁机制。

自旋锁

自旋锁是专为防止多处理器并发而引入的一种锁,它在内核中大量应用于中断处理等部分(对于单处理器来说,防止中断处理中的并发可简单采用关闭中断的方式,不需要自旋锁)。

自旋锁最多只能被一个内核任务持有,如果一个内核任务试图请求一个已被争用(已经被持有)的自旋锁,那么这个任务就会一直进行忙循环——旋转——等待锁重新可用。要是锁未被争用,请求它的内核任务便能立刻得到它并且继续进行。自旋锁可以在任何时刻防止多于一个的内核任务同时进入临界区,因此这种锁可有效地避免多处理器上并发运行的内核任务竞争共享资源。

事实上,自旋锁的初衷就是:在短期间内进行轻量级的锁定。一个被争用的自旋锁使得请求它的线程在等待锁重新可用的期间进行自旋(特别浪费处理器时间),所以自旋锁不应该被持有时间过长。如果需要长时间锁定的话, 最好使用信号量。

自旋锁的基本形式如下:

    spin_lock(&mr_lock);

    //临界区

    spin_unlock(&mr_lock);

    因为自旋锁在同一时刻只能被最多一个内核任务持有,所以一个时刻只有一个线程允许存在于临界区中。这点很好地满足了对称多处理机器需要的锁定服务。在单处理器上,自旋锁仅仅当作一个设置内核抢占的开关。如果内核抢占也不存在,那么自旋锁会在编译时被完全剔除出内核。

    简单的说,自旋锁在内核中主要用来防止多处理器中并发访问临界区,防止内核抢占造成的竞争。另外自旋锁不允许任务睡眠(持有自旋锁的任务睡眠会造成自死锁——因为睡眠有可能造成持有锁的内核任务被重新调度,而再次申请自己已持有的锁),它能够在中断上下文中使用。

    死锁:假设有一个或多个内核任务和一个或多个资源,每个内核都在等待其中的一个资源,但所有的资源都已经被占用了。这便会发生所有内核任务都在相互等待,但它们永远不会释放已经占有的资源,于是任何内核任务都无法获得所需要的资源,无法继续运行,这便意味着死锁发生了。自死琐是说自己占有了某个资源,然后自己又申请自己已占有的资源,显然不可能再获得该资源,因此就自缚手脚了。

信号量

    Linux中的信号量是一种睡眠锁。如果有一个任务试图获得一个已被持有的信号量时,信号量会将其推入等待队列,然后让其睡眠。这时处理器获得自由去执行其它代码。当持有信号量的进程将信号量释放后,在等待队列中的一个任务将被唤醒,从而便可以获得这个信号量。

    信号量的睡眠特性,使得信号量适用于锁会被长时间持有的情况;只能在进程上下文中使用,因为中断上下文中是不能被调度的;另外当代码持有信号量时,不可以再持有自旋锁。

信号量基本使用形式为:

static DECLARE_MUTEX(mr_sem);//声明互斥信号量

if(down_interruptible(&mr_sem))

    //可被中断的睡眠,当信号来到,睡眠的任务被唤醒

    //临界区

up(&mr_sem);

信号量和自旋锁区别

    虽然听起来两者之间的使用条件复杂,其实在实际使用中信号量和自旋锁并不易混淆。注意以下原则:

    如果代码需要睡眠——这往往是发生在和用户空间同步时——使用信号量是唯一的选择。由于不受睡眠的限制,使用信号量通常来说更加简单一些。如果需要在自旋锁和信号量中作选择,应该取决于锁被持有的时间长短。理想情况是所有的锁都应该尽可能短的被持有,但是如果锁的持有时间较长的话,使用信号量是更好的选择。另外,信号量不同于自旋锁,它不会关闭内核抢占,所以持有信号量的代码可以被抢占。这意味者信号量不会对影响调度反应时间带来负面影响。

自旋锁对信号量

需求                           建议的加锁方法

低开销加锁                     优先使用自旋锁

短期锁定                       优先使用自旋锁

长期加锁                       优先使用信号量

中断上下文中加锁               使用自旋锁

持有锁是需要睡眠、调度         使用信号量

 

结束语

分享这篇文章……

Linux 性能非凡,其锁定方法也一样。原子锁不仅提供了一种锁定机制,同时也提供了算术或 bitwise 操作。自旋锁提供了一种锁定机制(主要应用于 SMP),而且读/写自旋锁允许多个读线程且仅有一个写线程获得给定的锁。最后,互斥锁是一种新的锁定机制,提供了一种构建在原子之上的简单 API。不管你需要什么,Linux 都会提供一种锁定方案保护您的数据。

 

参考资料

学习

  • 您可以参阅本文在 developerWorks 全球站点上的 英文原文。
  • 查阅 developerWorks 上 Tim 的所有 Anatomy of... 文章。
  • “Linux 和对称多处理”(developerWorks,2007 年 3 月)探讨了使用 SMP 进行多处理和开发 Linux 应用程序的思想。引入 SMP 之后,锁定机制就变得更加重要了。
  • Rusty Russell 的 Unreliable Guide to Locking 讨论了关于 Linux 内核锁定的一个早期的话题。
  • 在 LWN.net 上查阅 “The Big Kernel Lock lives on”,了解为什么大内核锁在 Linux 内核中仍然占有一席之地。
  • 在 developerWorks Linux 专区 中查找关于 Linux 开发人员的更多资源,浏览我们的 最流行的文章和教程。
  • 在 developerWorks 上查看所有的 Linux 技巧 和 Linux 教程。
  • 随时关注 developerWorks 技术活动和网络广播。
  • 主要参考 http://www.linuxidc.com/Linux/2011-03/33741.htm 

你可能感兴趣的:(Linux 同步方法剖析)