我们可以把一个单独的任务所用到的所有东西封装在一个LDT中,这种思想是多任务处理的雏形。
多任务所用的段类型如下图,使用LDT来隔离每个应用程序任务的方法,正是关键保护需求之一:
进程示意:
我们需要一个数据结构记录一个进程的状态,在进程要被挂起的时候,进程信息就被写入这个数据结构,等到进程重新启动的时候,这个信息重新被读出来。
进程切换的过程:
- 1.进程A运行中
- 2.时钟中断发生,ring1->ring0,时钟中断处理器启动
- 3.进程调度,下一个应运行的进程B被指定
- 4.进程B恢复,ring0->ring1
- 5.进程B运行中
保存进程信息的数据结构称为进程表,或叫进程控制块,即PCB。
esp的位置出现在3个不同的区域:
- 进程栈–进程运行时自身的堆栈
- 进程表–存储进程状态信息的数据结构
- 内核栈–进程调度模块运行时使用的堆栈
开始第一个进程,我们使用iretd
指令来实现由ring0到ring1的转移,转移成功后,就可以认为A进程在运行了。
进程表数据结构
typedef struct s_stackframe { /* proc_ptr points here ↑ Low */
u32 gs; /* ┓ │ */
u32 fs; /* ┃ │ */
u32 es; /* ┃ │ */
u32 ds; /* ┃ │ */
u32 edi; /* ┃ │ */
u32 esi; /* ┣ pushed by save() │ */
u32 ebp; /* ┃ │ */
u32 kernel_esp; /* <- 'popad' will ignore it │ */
u32 ebx; /* ┃ ↑栈从高地址往低地址增长*/
u32 edx; /* ┃ │ */
u32 ecx; /* ┃ │ */
u32 eax; /* ┛ │ */
u32 retaddr; /* return address for assembly code save() │ */
u32 eip; /* ┓ │ */
u32 cs; /* ┃ │ */
u32 eflags; /* ┣ these are pushed by CPU during interrupt │ */
u32 esp; /* ┃ │ */
u32 ss; /* ┛ ┷High */
}STACK_FRAME;
typedef struct s_proc {
STACK_FRAME regs; /* process registers saved in stack frame */
u16 ldt_sel; /* gdt selector giving ldt base and limit */
DESCRIPTOR ldts[LDT_SIZE]; /* local descriptors for code and data */
int ticks; /* remained ticks */
int priority;
u32 pid; /* process id passed in from MM */
char p_name[16]; /* name of the process */
}PROCESS;
当要恢复一个进程时,便将esp指向这个结构体的开始处,然后运行一系列的pop命令将寄存器值弹出。
实现ring0->ring1
而堆栈的信息也不外乎ss和esp两个寄存器。
由于要为下一次ring1->ring0做准备,所以用iretd返回之前要保证tss.esp0是正确的。
restart:
mov esp, [p_proc_ready]
lldt [esp + P_LDT_SEL]
lea eax, [esp + P_STACKTOP]
mov dword [tss + TSS3_S_SP0], eax
restart_reenter:
dec dword [k_reenter]
pop gs
pop fs
pop es
pop ds
popad
add esp, 4
iretd
进程表及相关数据结构对应关系:
第一个进程的启动过程:
由ring0到ring1时,推展的切换直接在指令iretd被执行时就完成了,目标代码的cs、eip、ss、esp等都是从堆栈中得到的,这很简单。但ring1到ring0切换时就免不了用到TSS了。
而堆栈的信息也不外乎ss和esp两个寄存器。
由于要为下一次ring1->ring0做准备,所以用iretd返回之前要保证tss.esp0是正确的。
现在的中断例程:
在中断发生的开始,esp的值是刚刚从TSS里面渠道的进程表A中的regs的最高地址,然后个寄存器的值被压栈入进程表,然后esp指向regs的最低地址处,然后设置tss.esp0的值,准备下一次进程被中断时使用。
mov esp, StackTop ; 切到内核栈
;...
mov esp, [p_proc_ready] ; 离开内核栈
中断程序是被动的。
为了避免这种嵌套现象的发生,我们必须想一个办法让中断程序知道自己是不是在嵌套执行。
只要设置一个全局变量就可以了。
目前我们的处理,如果发现当前是嵌套的,则直接跳到最后,结束中断处理程序的执行。
从进程A切换到进程B之前,如何保留和恢复现场(即各寄存器的值)?
后面会提到。
一个进程只要有一个进程体和堆栈就可以运行了。
typedef void (*task_f) ();
typedef struct s_task {
task_f initial_eip;
int stacksize;
char name[32];
}TASK;
TASK task_table[NR_TASKS] =
{{TestA, STACK_SIZE_TESTA, "TestA"},
{TestB, STACK_SIZE_TESTB, "TestB"}};
void TestA()
{
//...
}
void TestB()
{
//...
}
初始化到proc_table
中,从TASK结构中读取不同任务入口地址、堆栈栈顶和进程名,然后赋值给相应的进程表项。
for(i=0;istrcpy(p_proc->p_name, p_task->name); // name of the process
p_proc->pid = i; // pid
p_proc->ldt_sel = selector_ldt;
memcpy(&p_proc->ldts[0], &gdt[SELECTOR_KERNEL_CS >> 3],
sizeof(DESCRIPTOR));
p_proc->ldts[0].attr1 = DA_C | PRIVILEGE_TASK << 5;
memcpy(&p_proc->ldts[1], &gdt[SELECTOR_KERNEL_DS >> 3],
sizeof(DESCRIPTOR));
p_proc->ldts[1].attr1 = DA_DRW | PRIVILEGE_TASK << 5;
p_proc->regs.cs = ((8 * 0) & SA_RPL_MASK & SA_TI_MASK)
| SA_TIL | RPL_TASK;
//...
p_proc->regs.eip = (u32)p_task->initial_eip;
p_proc->regs.esp = (u32)p_task_stack;
p_task_stack -= p_task->stacksize;
p_proc++;
p_task++;
selector_ldt += 1 << 3;
}
填充 GDT 中进程的 LDT 的描述符。
int i;
PROCESS* p_proc = proc_table;
u16 selector_ldt = INDEX_LDT_FIRST << 3;
for(i=0;i>3],
vir2phys(seg2phys(SELECTOR_KERNEL_DS),
proc_table[i].ldts),
LDT_SIZE * sizeof(DESCRIPTOR) - 1,
DA_LDT);
p_proc++;
selector_ldt += 1 << 3;
}
每个进程都会在GDT中对应一个LDT描述符。
每个进程都有自己的LDT.所以当进程切换时需要重新加载ldtr
无非是将esp指向进程表项的开始处,然后在执行lldt
之后经历一系列pop
指令恢复各个寄存器的值。一切的信息都包含在进程表中。所以,要想恢复不同的进程,只需要将esp指向不同的进程表就可以了。
在离开内核栈时给esp赋值。
;...
mov esp, StackTop ; 切到内核栈
;...
call clock_handler
;...
mov esp, [p_proc_ready] ; 离开内核栈
lldt [esp + P_LDT_SEL]
lea eax, [esp + P_STACKTOP]
mov dword [tss + TSS3_S_SP0], eax
;...
当CPU不再执行该进程的代码指令时,就可以认为这个进程已经睡眠了。
那么这个寄存器的值是怎么保存的呢?肯定是保存在该进程的进程表里的,因为由“睡眠”态变成“运行”态就是从这里获取的信息。
保护的时机就在进程调度切换之前。
我们在时钟中断切换进程时这样写:
hwint00: ; Interrupt routine for irq 0 (the clock).
sub esp, 4
pushad ; `.
push ds ; |
push es ; | 保存原寄存器值
push fs ; |
push gs ; /
mov dx, ss
mov ds, dx
mov es, dx
inc byte [gs:0] ; 改变屏幕第 0 行, 第 0 列的字符
;...
mov esp, StackTop ; 切到内核栈
;...
call clock_handler
;...
mov esp, [p_proc_ready] ; 离开内核栈
lldt [esp + P_LDT_SEL]
lea eax, [esp + P_STACKTOP]
mov dword [tss + TSS3_S_SP0], eax
;...
pop gs ; `.
pop fs ; |
pop es ; | 恢复原寄存器值
pop ds ; |
popad ; /
add esp, 4
iretd
简单来说,在调用clock_handler
之前,
我们保存的是进程A的寄存器到esp所指向的堆栈,也就是进程表A(从ring1跳到ring0,esp的值变成TSS中夜色少的ring0下的esp值)。
之后esp被切换成进程B的堆栈,所以pop
出来的就是保存在进程表B里的寄存器值了。
用户进程因为特权级的关系,无法访问某些权限更高的内存区域,
只能通过系统调用来实现,它是应用程序和操作系统之间的桥梁。
用中断可以方便地实现系统调用。
操作系统给应用程序提供一个get_ticks()
的系统调用,用来获得当前总共发生了多少次时钟中断。
系统调用的过程:
- 1、“问”,告诉操作系统自己要什么;
- 2、操作系统“找”,即处理;
- 3、“回答”,也就是把结果返回给进程。
;syscall.asm
_NR_get_ticks equ 0 ; 要跟 global.c 中 sys_call_table 的定义相对应!
INT_VECTOR_SYS_CALL equ 0x90
global get_ticks ; 导出符号
bits 32
[section .text]
get_ticks:
mov eax, _NR_get_ticks
int INT_VECTOR_SYS_CALL
ret
sys_call_table
是一个函数指针数组,每一个成员都指向一个函数,用以处理相应的系统调用。注意:sys_call
是内核调用的,如果要把返回值告诉应用进程的话,需要把函数的返回值放在进程表eax的位置,以便进程P被恢复执行时eax中装的是正确的返回值。
;kernel.asm
sys_call:
call save
sti
call [sys_call_table + eax * 4]
mov [esi + EAXREG - P_STACKBASE], eax ; 把函数的返回值放在进程表eax的位置,以便进程P被恢复执行时eax中装的是正确的返回值。
cli
ret
在中断发生时,我们要优先级选择下一个要执行的进程时。
PUBLIC void schedule()
{
PROCESS* p;
int greatest_ticks = 0;
while (!greatest_ticks) {
for (p = proc_table; p < proc_table+NR_TASKS; p++) {
if (p->ticks > greatest_ticks) {
greatest_ticks = p->ticks;
p_proc_ready = p;
}
}
if (!greatest_ticks) {
for (p = proc_table; p < proc_table+NR_TASKS; p++) {
p->ticks = p->priority;
}
}
}
}