代码传至并发竞态控制
前面所述的字符驱动都是没有考虑并发竟态的情况,想象一下
一个进程去读一个字符设备,另一个进程在同一时间向这个设备写入(完全有这种情况)
原来设备中存有 A B C D 要想设备写入1 2 3 4 每次读写一个字节
t1 | t2 | t3 | t4 | t5 | t6 | t7 | t8 |
R | W | W | R | W | R | R | W |
A | 1 | 2 | 2 | 3 | 3 | D | 4 |
并发是指 多个进程同时访问相同一段代码(不仅限于内核空间的代码)
竞态 是对共享资源访问的结果, 并发进程访问了相同的数据或结构(硬件资源)等。
解决竞态的思想 主要有两种
1、所有的代码都不使用全局变量
2、使用锁机制确保一次只有一个进程使用共享资源
显然第一种方式是不可能的,我们只能尽量少的使用全局变量,而不能完全避免它
下边介绍 两种锁机制
这个概念对我们来说应该不是很陌生,至少听说过,它有两种操作:通常叫做P操作与V操作
希望进入临界区的进程调用P操作,检测当前信号量,如果信号量大于0,则信号量减1,进入临界区,否则进程等待其他进程释放此信号量,信号量的释放通过一个V操作增加信号量的值,在某些情况下会去唤醒等待此信号量的进程。
以上说到了一个 临界区这个名词 简单来讲就是内部操作了共享数据的代码
Linux 内核中信号量的实现
因为从LLD3(2.6.10)版本出来到现在(3.1)内核函数有了很多的变化,许多书上介绍的函数都已经不存在了,也能几版新kernel之后现在我说的函数也会有变化了。
信号量结构以及相关函数的定义在<linux/semaphore.h>中
void sema_init(struct semaphore *sem, int val)sem: 信号量结构体
val : 初始化信号量的值(代表了资源数)【val 为1时 表示代码在同一时间只允许一个进程访问 称之为互斥锁】
void init_MUTEX(); void init_MUTEX_LOCKED();两个定义互斥锁的函数 ( 最新的内核中已经没有这两个函数了,所以不要用 它)
struct simple_dev{ char *data; loff_t count; struct cdev cdev; struct semaphore semp; }; static __init int simple_init(void) { ... for( index = 0 ; index < DEV_COUNT ; ++index ) { sema_init(&char5_dev[index].semp,1); //init_MUTEX(&(char5_dev[index].semp)); init_waitqueue_head(&(char5_dev[index].queue)); } ... }
void down(struct semaphore *sem); int __must_check down_interruptible(struct semaphore *sem); int __must_check down_killable(struct semaphore *sem); int __must_check down_trylock(struct semaphore *sem); int __must_check down_timeout(struct semaphore *sem, long jiffies)第一个函数在信号量大于0时直接将信号量的值减一程序继续运行,在信号量为0时进程睡眠只有等到有其他进程释放信号量时候才被唤醒( 不推荐使用)
第二个函数 在第一个操作的基础上,如果进程因为没有得到信号量睡眠,在别的进程释放信号量或者发成中断的情况下都会被唤醒,在被中断信号唤醒时候返回-EINTR,成功返回0
第三个函数 如果没有另外的任务会获取此信号量,则可以调用此函数,在收到中断信号时会返回-EINTR
第四个函数 试图去获取信号量,在获取不到的时候不会睡眠,而是继续运行,返回0值表示得到了此信号量, 返回1 表示没能获取到。
第五个函数 可以去设置最长睡眠时间, 但是 此函数不可中断
void up(struct semaphore *sem)此操作 首先检测时候有其他进程等待此信号量,如果有则唤醒此进程,不改变信号量的值,如果没有则将信号量的值加1。
static ssize_t simple_read(struct file *filp, char __user *userstr, size_t count, loff_t *loff) { struct simple_dev *dev = NULL; int data_remain = 0; int err; D("[%s:] In %s \n",current->comm, __func__); dev = filp->private_data; err = down_interruptible(&dev->semp); if(err) { if(err == -EINTR) WAR("return by an interrupt signal\n"); else printk(KERN_ERR "an error occured in down_interruptible\n"); return err; } else { D("have get the mutex %d\n", __LINE__); } /******************************************* * 临界区代码 ********************************************/ up(&dev->semp); return count; }
自旋锁是另一种锁机制,信号量会引起进程的休眠,而在不能睡眠的代码中我们就需要使用自旋锁。
自旋锁也是一个互斥的概念,有“锁定”与“解锁”两个操作,当程序需要锁定时候,则先检测锁是否可用,如果可用则获得锁,程序进入临界区,否则进入忙等待重复检测这个锁是否可用(这就是自旋),临界区代码操作完成则解锁。
信号量实现中其实也用到了自旋锁机制(有兴趣的刻一看内核源码,这边不展开,等以后写内核时候再介绍)
因为自旋锁在得不到锁的时候会“自旋” 即不会让出CPU ,所以我们的临界区执行速度应该尽量的快,最好使用原子操作(不会睡眠)。这也是使用自旋锁的核心规则,在多数情况下我们做不到这一点,所以自旋锁在驱动程序中使用的不如信号量频繁。
spin_lock_init(_lock)
static inline void spin_lock(spinlock_t *lock) static inline int spin_trylock(spinlock_t *lock) static inline void spin_lock_irq(spinlock_t *lock) spin_lock_irqsave(lock, flags) static inline void spin_lock_bh(spinlock_t *lock)第一个函数是 不去禁止中断 直接锁定
第二个函数 会尝试加锁,检测返回之判断是否锁定,在不能锁定时候程序也继续运行
第三个函数 禁止中断,不保存保存原先的中断状态
第四个函数 在禁止中断之前,保存原先的中断状态,
第五个函数 表示只禁止软件中断而保持硬件中断的打开
因为自旋锁本质上要不会被中断,所以调用时候建议使用包含有禁止中断的函数
static inline void spin_unlock(spinlock_t *lock) //static inline void spin_unlock(spinlock_t *lock) static inline void spin_unlock_irq(spinlock_t *lock) static inline void spin_unlock_irqrestore(spinlock_t *lock, unsigned long flags) static inline void spin_unlock_bh(spinlock_t *lock)对应于锁定的五个函数,分别解锁,(对应于锁定的第二个操作,在加锁成功时候需要使用spin_unlock来解锁)
上边只提到了使用锁的好处,以及如何使用锁,但是引入锁机制也会带来风险,那就是死锁,进程死锁最明显的表现就是死机。
如上图所示,A进程占有锁1,并在持有锁1的时候需要得到锁2程序才能继续进行
B进程占有锁2, 并在保持锁2的同时去获取锁1程序才能继续运行,这样A, B 进程就卡在这里,互不相让,这就导致了死锁。
亦或 在一个进程内同时试图获取同样的锁
是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁
1、加解锁顺序一致
在必须使用多个锁的时候,应该始终以相同的顺序获取,也最好以获取锁顺序逆序解锁。
2、使用原子变量
原子变量不会被多个进程并发操作,内核提供了一种原子类型(atomic_t <asm/stomic.h>中)
3、设置加锁timeout值
在一定时间内不能获得锁,就放弃,并释放已占有的锁