本系列参考: 学习开发一个RISC-V上的操作系统 - 汪辰 - 2021春 整理而来,主要作为xv6操作系统学习的一个前置基础。
RVOS是本课程基于RISC-V搭建的简易操作系统名称。
课程代码和环境搭建教程参考github仓库: https://github.com/plctlab/riscv-operating-system-mooc/blob/main/howto-run-with-ubuntu1804_zh.md
前置知识:
并发 指多个控制流同时执行,可能存在下面几种情况
同步是为了保证在并行执行的环境中,各个控制流可以有效执行而采用的一种编程技术。
在并发环境下为了有效控制临界区的执行(同步),我们要做的是当有一个控制流进入临界区时,其他相关控制流必须 等待。
锁是一种最常见的用来实现同步的技术:
可睡眠与不可睡眠的主要区别在于指令流获取不到锁时,是进入等待挂起状态,还是不断轮询锁查看锁是否被释放,也就是我们常说的自旋锁
死锁(Deadlock)问题:
这段逻辑很简单,关键在于spin_lock函数中,获取不到锁,就死循环尝试。
上面这段代码存在什么问题?
可以看到,问题在于我们读取锁状态和上锁的操作并非原子性的,所以在并发环境下,会产生不一致性问题。
1.0版本的问题是,由于读取锁和上锁操作非原子性,所以在并发环境下,可能会存在多个指令流同时看见锁处于空闲状态,随后都重复上锁,也就是一把锁同时被多个任务持有。
为了解决这个问题,我们需要引入原子性指令,该指令由硬件提供支持。
RV32A 有两种类型的原子操作:
图 6.1 是 RV32A 扩展指令集的示意图,图 6.2 列出了它们的操作码和指令格式。
AMO 指令对内存中的操作数执行一个原子操作,并将目标寄存器设置为操作前的内存值。原子表示内存读写之间的过程不会被打断,内存值也不会被其它处理器修改。
AMO 和 LR/SC 指令要求内存地址对齐,因为保证跨 cache 行的原子读写的难度很大。
加载保留和条件存储保证了它们两条指令之间的操作的原子性。
为什么 RV32A 要提供两种原子操作呢?
编程语言的开发者会假定体系结构提供了原子的比较-交换(compare-and-swap)操作:
a3存放内存中的值,a1存放当前内存中期望的值,a2希望设置到内存中的新值
(将当前内存中的值加载到a3保存)
这条指令执行后,如果成功加载了内存数据并保留了锁定状态,则a3寄存器将存储加载的值。如果加载失败,a3寄存器的内容将保持不变。加载保留指令常用于原子操作和同步原语的实现,以确保在多线程或多核环境下的数据一致性。
(也就是比较内存中的值和我们传入的值是否相等)
(确保内存中的值没有变化)
使用amo原子指令,实现临界区保护案例:
a0可以看做是一个锁指针 lk->locked,其指向的内存中存放locked值
(不由分说,先上锁,然后把锁的原始值返回,由t1寄存器保存)
注意:
- 如果锁已经被任务A加上了,那么任务B此时通过amoswap交换拿到的锁值为1,此时我们设置锁为1是没有影响的,因为锁的值本来就为1
- 如果锁还没被加上,那么任务B此时通过amswap交换拿到的锁值为0,此时我们设置锁为1相当于任务A抢到了锁
(如果当前内存中locked值不为0,说明锁已经被其他任务加上了,那么重新尝试获取锁)
注意:
- 对于上面第一种情况而言,由于t1寄存器保存的锁值不为0,说明抢锁失败,需要重试
- 对于上面第二种情况而言,由于t1寄存器保存的锁值为0,说抢锁成功,继续往下执行临界区代码
(与x0寄存器做交换,等同于置零,向x0写入是没有意义的,最终表达意思即为: 释放锁)
另外还提供 AMO 指令的原因是,它们在多处理器系统中拥有比加载保留/条件存储更好的可扩展性,例如可以用它们来实现高效的归约。
AMO 指令在于 I/O 设备通信时也很有用,可以实现总线事务的原子读写。这种原子性可以简化设备驱动,并提高 I/O 性能。
经过上面原子指令的介绍,想必各位也知道如何对1.0版本的漏洞进行改进了,下面给出代码:
typedef struct{
int locked;
} spinlock;
int spin_lock(spinlock *lk)
{
while(__sync_lock_test_and_set(&lk->locked,1)!=0);
return 0;
}
int spin_unlock(spinlock *lk)
{
lk->locked=0;
return 0;
}
_sync_lock_test_and_set
是c编程库提供的一个原子操作函数,常用于多线程编程中实现互斥锁(mutex)的功能,这个函数在不同的编程语言和平台上可能会有不同的实现方式,但它的目的是原子地测试并设置一个锁的状态。
右边是该函数在RISC-V架构下的汇编实现,其利用了我们上面介绍的amoswap原子交换指令:
上面的流程简单而言就是:
在user.c文件中,我们针对user_task0进行代码改造,来测试对临界区加锁运行的效果:
我们期望的是通过加锁,来确保任务0中五个语句的输出总体来看是连续的
#include "os.h"
#define DELAY 4000
#define USE_LOCK
spinlock lk;
void user_task0(void)
{
uart_puts("Task 0: Created!\n");
while (1) {
#ifdef USE_LOCK
spin_lock(&lk);
#endif
uart_puts("Task 0: Begin ... \n");
for (int i = 0; i < 5; i++) {
uart_puts("Task 0: Running... \n");
task_delay(DELAY);
}
uart_puts("Task 0: End ... \n");
#ifdef USE_LOCK
spin_unlock(&lk);
task_yield();
#endif
}
}
void user_task1(void)
{
uart_puts("Task 1: Created!\n");
while (1) {
#ifdef USE_LOCK
spin_lock(&lk);
#endif
uart_puts("Task 1: Begin ... \n");
for (int i = 0; i < 5; i++) {
uart_puts("Task 1: Running... \n");
task_delay(DELAY);
}
uart_puts("Task 1: End ... \n");
#ifdef USE_LOCK
spin_unlock(&lk);
task_yield();
#endif
}
}
/* NOTICE: DON'T LOOP INFINITELY IN main() */
void os_main(void)
{
task_create(user_task0);
task_create(user_task1);
}
2.0 版本引入的原子指令实现思路很好,但是对于本门课程而言,由于只使用到了单个hart, 并且导致读取锁和上锁操作非原子性的根本原因在于中断打断我们任务的执行。
所以,在单hart架构下,最简单的保护临界区代码并发安全的方法就是关中断。
#include "os.h"
int spin_lock()
{
//关闭全局中断
w_mstatus(r_mstatus() & ~MSTATUS_MIE);
return 0;
}
int spin_unlock()
{
//开启全局中断
w_mstatus(r_mstatus() | MSTATUS_MIE);
return 0;
}
在user.c文件中,我们针对user_task0进行代码改造,来测试对临界区加锁和不加锁的两种运行效果:
我们期望的是通过加锁,来确保任务0中五个语句的输出总体来看是连续的
//将USE_LOCK宏定义注释掉
//#define USE_LOCK
void user_task0(void)
{
uart_puts("Task 0: Created!\n");
while (1) {
//如果不存在USER_LOCK宏定义,那么下面的加锁和解锁代码都会在预处理环节被丢弃
#ifdef USE_LOCK
spin_lock();
#endif
uart_puts("Task 0: Begin ... \n");
for (int i = 0; i < 5; i++) {
uart_puts("Task 0: Running... \n");
task_delay(DELAY);
}
uart_puts("Task 0: End ... \n");
#ifdef USE_LOCK
spin_unlock();
#endif
}
}
void user_task1(void)
{
uart_puts("Task 1: Created!\n");
while (1) {
uart_puts("Task 1: Begin ... \n");
for (int i = 0; i < 5; i++) {
uart_puts("Task 1: Running... \n");
task_delay(DELAY);
}
uart_puts("Task 1: End ... \n");
}
}
从输出结果可以观察到,任务0和任务1此时都没加锁,临界区代码总是会被中断打断:
#define USE_LOCK
void user_task0(void)
{
uart_puts("Task 0: Created!\n");
while (1) {
#ifdef USE_LOCK
spin_lock();
#endif
uart_puts("Task 0: Begin ... \n");
for (int i = 0; i < 5; i++) {
uart_puts("Task 0: Running... \n");
task_delay(DELAY);
}
uart_puts("Task 0: End ... \n");
#ifdef USE_LOCK
spin_unlock();
#endif
}
}
void user_task1(void)
{
uart_puts("Task 1: Created!\n");
while (1) {
uart_puts("Task 1: Begin ... \n");
for (int i = 0; i < 5; i++) {
uart_puts("Task 1: Running... \n");
task_delay(DELAY);
}
uart_puts("Task 1: End ... \n");
}
}
由于任务0的临界区代码都加上了锁,所以输出是连续的,没有受到中断影响:
自旋锁的使用:
• 自旋锁可以防止多个任务同时进入临界区(critical region)
• 在自旋锁保护的临界区中不能执行长时间的操作
• 在自旋锁保护的临界区中不能主动放弃CPU