程峰 原创作品转载请注明出处 《Linux内核分析》MOOC课程 http://mooc.study.163.com/course/USTC-1000029000
本文基于 GitHub 开源项目 mykernel,它实现了一个简单的时间片轮转进程切换功能,下面我们将详细分析其中的关键代码,了解具体的执行过程。
头文件mypcb.h中定义了一些简单的结构体,用来保存必要的信息。
struct Thread {
unsigned long ip;
unsigned long sp;
};
结构体Thread包含两个成员,分别用来保存指令指针ip
和栈顶指针sp
。
typedef struct PCB{
int pid;
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
char stack[KERNEL_STACK_SIZE];
/* CPU-specific state of this task */
struct Thread thread;
unsigned long task_entry;
struct PCB *next;
}tPCB;
结构体PCB表示进程控制块,包含进程号(pid)、状态(state)、栈(stack)、线程(thread)、任务处理函数入口地址(task_entry)以及指向下一个进程控制块的指针(next)。
mymain.c 中定义了内核初始化函数void __inti my_start_kernel(void)
,如下:
void __init my_start_kernel(void)
{
int pid = 0;
int i;
/* Initialize process 0*/
task[pid].pid = pid;
task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].next = &task[pid];
/*fork more process */
for(i=1;i<MAX_TASK_NUM;i++)
{
memcpy(&task[i],&task[0],sizeof(tPCB));
task[i].pid = i;
task[i].state = -1;
task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
task[i].next = task[i-1].next;
task[i-1].next = &task[i];
}
/* start process 0 by task[0] */
pid = 0;
my_current_task = &task[pid];
asm volatile(
"movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp */
"pushl %1\n\t" /* push task[pid].thread.sp */
"pushl %0\n\t" /* push task[pid].thread.ip */
"ret\n\t" /* pop task[pid].thread.ip to eip */
"popl %%ebp\n\t"
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/
);
}
首先,初始化 pid 为0的进程控制块,将其状态设为可执行,任务处理函数为my_process()
(将在下文对my_process
函数进行详细说明),然后将next
指针指向自己,因为此时还只有一个进程控制块。
初始化完成后,启动进程0。启动过程使用的是一段汇编代码(如果对 C 语言中嵌入汇编代码不熟悉,可以先查阅相关知识,再来读这段代码)。先将当前进程栈的栈顶指针赋给寄存器 esp。然后保存栈顶指针,因为此时栈是空的,栈顶指针和栈底指针相同,所以这里相当于保存了栈底指针。再通过先压栈在ret
的方法,将当前进程的 ip 赋给 eip(因为 eip 不允许直接修改)。最后弹栈,将进程的栈顶指针赋给 ebp,完成进程0的启动。
进程启动后,运行任务处理函数my_process
,函数my_process
的代码如下:
void my_process(void)
{
int i = 0;
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}
my_process
其实就是一个简单的循环,每循环一千万次,打印出自己的pid,检查my_need_sched
标志,是否需要进行进程调度,如果需要,则调用函数my_schedule
切换进程。
my_interrupt.c
中定义了一个时钟中断处理函数my_timer_handler()
以及进程切换函数my_schedule()
的实现。
void my_timer_handler(void)
{
#if 1
if(time_count%1000 == 0 && my_need_sched != 1)
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
my_need_sched = 1;
}
time_count ++ ;
#endif
return;
}
每1000个时间片,将my_need_sched标志赋为1,这样上面的任务处理函数my_process()
才能进入if
判断,从而调用my_schedule()
函数。my_schedule()
代码如下:
void my_schedule(void)
{
tPCB * next;
tPCB * prev;
if(my_current_task == NULL
|| my_current_task->next == NULL)
{
return;
}
printk(KERN_NOTICE ">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next;
prev = my_current_task;
if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
{
/* switch to next process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
"1:\t" /* next process start here */
"popl %%ebp\n\t"
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
}
else
{
next->state = 0;
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
/* switch to new process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl %2,%%ebp\n\t" /* restore ebp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
}
return;
}
my_schedule()
执行从当前进程到下一个进程的切换。根据下一个进程的状态,分为两种情况:
若下一个进程状态是可运行的,即就绪,则保存当前进程的上下文,将 ebp 压栈, esp 和 eip 的内容保存到 Thread 结构体中,从下一个进程控制块的 Thread 中取出 sp 和 ip 放到 esp 和 eip 中,从栈中弹出 ebp,完成进程切换。
若下一个进程不可运行,先要将其标记为可运行,然后再进行进程的上下文切换,这里与上面有一点不同的地方是此进程没有运行过,栈是空的,栈顶指针和栈基指针相同,所以是把 Thread 中的 sp 赋给 ebp。
本文所介绍的时间片轮转进程调度内核虽然比传统内核简单的多,但是基本原理大体相同,当CPU分配给进程的时间片用完时,便需要进行进程切换,切换时需要先保存当前运行进程现场,然后加载需要运行的信息,完成切换过程。