Speed up system calls
根据hints查看kernel/proc.c
中的函数proc_pagetable
// kernel/proc.c
// Create a user page table for a given process,
// with no user memory, but with trampoline pages.
pagetable_t
proc_pagetable(struct proc *p)
{
// map the trampoline code (for system call return)
// at the highest user virtual address.
// only the supervisor uses it, on the way
// to/from user space, so not PTE_U.
if(mappages(pagetable, TRAMPOLINE, PGSIZE,
(uint64)trampoline, PTE_R | PTE_X) < 0){
uvmfree(pagetable, 0);
return 0;
}
// map the trapframe just below TRAMPOLINE, for trampoline.S.
if(mappages(pagetable, TRAPFRAME, PGSIZE,
(uint64)(p->trapframe), PTE_R | PTE_W) < 0){
uvmunmap(pagetable, TRAMPOLINE, 1, 0);
uvmfree(pagetable, 0);
return 0;
}
....
}
结合代码以及手册,USYSCALL
页面的位置在heap
之前,trapfram
之后
only read
对应赋予PTE_R | PTE_U
// kernel/proc.c
...
// map the trapframe just below TRAMPOLINE, for trampoline.S.
if(mappages(pagetable, TRAPFRAME, PGSIZE,
(uint64)(p->trapframe), PTE_R | PTE_W) < 0){
uvmunmap(pagetable, TRAMPOLINE, 1, 0);
uvmfree(pagetable, 0);
return 0;
}
// map the usyscall just below TRAPFRAME
if (mappages(pagetable, USYSCALL, PGSIZE,
(uint64) (p->usyscall), PTE_R | PTE_U) < 0) {
uvmunmap(pagetable, USYSCALL, 1, 0);
uvmunmap(pagetable, TRAMPOLINE, 1, 0);
uvmfree(pagetable, 0);
return 0;
}
return pagetable;
分配和初始化页面
- Don't forget to allocate and initialize the page in
allocproc()
.
在allocate
函数中参考empty user page的方式依葫芦画瓢为usyscall
分配空间
同时要记得将pid
返回到用户态,这样才能在用户态直接使用pid
在kernel/proc.h
的struct proc
中添加 struct usyscall* usyscall
....
// Allocate a USYSCALL page.
if((p->usyscall = (struct usyscall *)kalloc()) == 0) {
freeproc(p);
release(&p->lock);
return 0;
}
p->usyscall->pid = p->pid;
// An empty user page table.
p->pagetable = proc_pagetable(p);
if(p->pagetable == 0){
freeproc(p);
release(&p->lock);
return 0;
}
...
解除映射的部分有两个函数要修改
- Make sure to free the page in
freeproc()
.
这里一定要释放,不然后面的test过不了
在函数proc_freepagetable
添加代码
// Free a process's page table, and free the
// physical memory it refers to.
void
proc_freepagetable(pagetable_t pagetable, uint64 sz)
{
// free USYSCALL
uvmunmap(pagetable, USYSCALL, 1, 0);
uvmunmap(pagetable, TRAMPOLINE, 1, 0);
uvmunmap(pagetable, TRAPFRAME, 1, 0);
uvmfree(pagetable, sz);
}
在函数freeproc
添加代码
static void
freeproc(struct proc *p)
{
if(p->trapframe)
kfree((void*)p->trapframe);
p->trapframe = 0;
if (p->usyscall)
kfree((void *) p->usyscall);
if(p->pagetable)
proc_freepagetable(p->pagetable, p->sz);
...
}
Print a page table
在exec.c
文件的return argc
语句前插入if(p->pid==1) vmprint(p->pagetable)
参考freewalk
void
freewalk(pagetable_t pagetable)
{
// 一张页表由512个页表项(PTE)组成
for(int i = 0; i < 512; i++){
// 取出当前页表项
pte_t pte = pagetable[i];
// 当该条目有效,但却无法读、写、执行的时候
// 说明这是一条指向子页面的PTE,递归遍历子页面
if((pte & PTE_V) && (pte & (PTE_R|PTE_W|PTE_X)) == 0){
// this PTE points to a lower-level page table.
uint64 child = PTE2PA(pte);
freewalk((pagetable_t)child);
pagetable[i] = 0;
} else if(pte & PTE_V){
panic("freewalk: leaf");
}
}
kfree((void*)pagetable);
}
我们的vmprint
基本就是copy freewalk
只不过不需要free页面
照着格式来
在kernel/vm.c
编写函数vmprint
,别忘了在kernel/defs.h
中声明
void
backtrace(pagetable_t pagetable, int level)
{
for(int i = 0; i < 512; i++){
pte_t pte = pagetable[i];
if ((pte & PTE_V) && (pte & (PTE_R | PTE_W | PTE_X)) == 0) {
uint64 child = PTE2PA(pte);
for (int j=0; j <= level; j++) {
printf("..");
if ((j+1) <= level) {
printf(" ");
}
}
printf("%d: pte %p pa %p\n", i, pte, child);
backtrace((pagetable_t)child, level+1);
}
else if (pte & PTE_V) {
uint64 child = PTE2PA(pte);
printf(".. .. ..%d: pte %p pa %p\n", i, pte, child);
}
}
}
void vmprint(pagetable_t pagetable)
{
printf("page table %p\n", pagetable);
backtrace(pagetable, 0);
}
Detecting which pages have been accessed
这个实验需要我们判断页面是否被访问过,为此需要添加一个标志位PTE_A
来标识页面是否被访问过
- You'll need to define
PTE_A
, the access bit, inkernel/riscv.h
. Consult the RISC-V manual to determine its value.
在kernel/riscv.h
中添加
#define PTE_A (1L << 6) // access bit
- You'll need to parse arguments using
argaddr()
andargint()
- First, it takes the starting virtual address of the first user page to check. Second, it takes the number of pages to check. Finally, it takes a user address to a buffer to store the results into a bitmask (a datastructure that uses one bit per page and where the first page corresponds to the least significant bit)
根据这两个提示我们可以猜测出三个参数的类型应该分别为uint64,int,uint64,分别是第一个需要检查的用户页的虚拟地址,要检查的页表数,以及输出结果的用户态地址(因为内核态跟用户态的空间是不互通的,所以要借助 copyout 将 bitmask 传给用户态程序)
根据参数可以知道我们是要查看n个页的,问题是只给了第一个用户页的虚拟地址,之后的n个页怎么查看。其实只需要每次循环加上页表大小PGSIZE
就能到下一个页了
同时我们来看一下walk
,它的作用是根据虚拟地址返回页表中对应的PTE
pte_t *
walk(pagetable_t pagetable, uint64 va, int alloc)
{
if(va >= MAXVA)
panic("walk");
for(int level = 2; level > 0; level--) {
// 主要注意这里,请结合下图理解
pte_t *pte = &pagetable[PX(level, va)];
if(*pte & PTE_V) {
pagetable = (pagetable_t)PTE2PA(*pte);
} else {
if(!alloc || (pagetable = (pde_t*)kalloc()) == 0)
return 0;
memset(pagetable, 0, PGSIZE);
*pte = PA2PTE(pagetable) | PTE_V;
}
}
return &pagetable[PX(0, va)];
}
#define PGSHIFT 12 // 对应图中的offset
#define PXSHIFT(level) (PGSHIFT+(9*(level))) //L2 L1 L0 都是9位,+9*level是为了定位到对应的level上
#define PX(level, va) ((((uint64) (va)) >> PXSHIFT(level)) & PXMASK) //获得L2或L1,L0的bits
明白了walk
的功能就可以完成这一部分的任务了
- 通过虚拟地址VA确定
PTE
(walk
来完成) - 检查
PTE
的标志位PTE_A
是否为1,1表示被访问过- 记得将
PTE_A
清0,以防影响再次调用sys_pgaccess
时影响判断
- 记得将
- VA+=PGSIZE得到下一个页面的虚拟地址
#ifdef LAB_PGTBL
uint64
sys_pgaccess(void)
{
uint64 va;
int page_num;
uint64 user_bitmask_addr;
if(argaddr(0, &va) < 0)
return -1;
if(argint(1, &page_num) < 0)
return -1;
if(argaddr(2, &user_bitmask_addr) < 0)
return -1;
// 32是看test得出来的
// It's okay to set an upper limit on the number of pages that can be scanned.
if(page_num < 0 || page_num > 32)
return -1;
uint32 bitmask = 0;
pte_t *pte;
struct proc *p = myproc();
for(int i = 0; i < page_num; i++){
if(va >= MAXVA)
return -1;
// alloc不为0,walk就会为找不到对应pte地址的va申请一个页
// 显然不存在,就表示没有被访问过
// 我们无需创建页,这不是当前函数的职责
pte = walk(p->pagetable, va, 0);
if(pte == 0)
return -1;
if(*pte & PTE_A){
bitmask |= (1 << i);
// Be sure to clear PTE_A after checking if it is set.
*pte &= (~PTE_A);
}
va += PGSIZE;
}
if(copyout(p->pagetable, user_bitmask_addr, (char*)&bitmask, sizeof(bitmask)) < 0)
return -1;
return 0;
}
#endif