系统调用之mprotect源码分析(基于linux1.2.13)

mprotect系统调用是修改内存页属性的,他修改的内容包括vma的内容和页表项内容。linux用vma链表管理一个进程使用的虚拟地址空间。下面是实现代码。

/*
 *	linux/mm/mprotect.c
 *
 *  (C) Copyright 1994 Linus Torvalds
 */
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

#include 
#include 
#include 
// 修改虚拟地址address到address+size的页表项内容
static inline void change_pte_range(pmd_t * pmd, unsigned long address,
	unsigned long size, pgprot_t newprot)
{
	pte_t * pte;
	unsigned long end;

	if (pmd_none(*pmd))
		return;
	if (pmd_bad(*pmd)) {
		printk("change_pte_range: bad pmd (%08lx)\n", pmd_val(*pmd));
		pmd_clear(pmd);
		return;
	}
	// 获取一项页表项地址
	pte = pte_offset(pmd, address);
	// 屏蔽低位
	address &= ~PMD_MASK;
	// 结束地址
	end = address + size;
	// 不能超过该目录项管理的地址范围
	if (end > PMD_SIZE)
		end = PMD_SIZE;
	do {
		pte_t entry = *pte;
		if (pte_present(entry))
			// 更新页表项内容
			*pte = pte_modify(entry, newprot);
		// 下一个待处理的虚拟地址
		address += PAGE_SIZE;
		pte++;
	} while (address < end);
}
// 修改虚拟地址address到address+size区间的页目录项、页表项内容
static inline void change_pmd_range(pgd_t * pgd, unsigned long address,
	unsigned long size, pgprot_t newprot)
{
	pmd_t * pmd;
	unsigned long end;

	if (pgd_none(*pgd))
		return;
	if (pgd_bad(*pgd)) {
		printk("change_pmd_range: bad pgd (%08lx)\n", pgd_val(*pgd));
		pgd_clear(pgd);
		return;
	}
	// 某个页目录项
	pmd = pmd_offset(pgd, address);
	address &= ~PGDIR_MASK;
	end = address + size;
	if (end > PGDIR_SIZE)
		end = PGDIR_SIZE;
	do {
		change_pte_range(pmd, address, end - address, newprot);
		address = (address + PMD_SIZE) & PMD_MASK;
		pmd++;
	} while (address < end);
}
// 修改当前进程虚拟地址start到start+end区间的页目录和页表项内容
static void change_protection(unsigned long start, unsigned long end, pgprot_t newprot)
{
	pgd_t *dir;
	// 返回某页目录项地址 
	dir = pgd_offset(current, start);
	while (start < end) {
		// 修改某页目录项对应的页表内容
		change_pmd_range(dir, start, end - start, newprot);
		start = (start + PGDIR_SIZE) & PGDIR_MASK;
		dir++;
	}
	// 刷新快表
	invalidate();
	return;
}
// 设置vma的读写属性和映射方式
static inline int mprotect_fixup_all(struct vm_area_struct * vma,
	int newflags, pgprot_t prot)
{
	// 用户层面的属性
	vma->vm_flags = newflags;
	// 页的属性,和vm_flags存在映射关系
	vma->vm_page_prot = prot;
	return 0;
}
// 修改开始地址为vma->start,结束地址为end的内存属性
static inline int mprotect_fixup_start(struct vm_area_struct * vma,
	unsigned long end,
	int newflags, pgprot_t prot)
{
	struct vm_area_struct * n;
	// vma的flag和prot是是针对整个vma的,所以这里要切分成两个vma
	n = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
	if (!n)
		return -ENOMEM;
	// 复制原vma结构体内容
	*n = *vma;
	// 修改原vma的start为end,即一分为二
	vma->vm_start = end;
	// 新vma的start不变,end改成切分边界的值
	n->vm_end = end;
	// 重新计算偏移,可能超过end
	vma->vm_offset += vma->vm_start - n->vm_start;
	// 只需要设置新块的标记
	n->vm_flags = newflags;
	n->vm_page_prot = prot;
	// 多了一个vma引用文件
	if (n->vm_inode)
		n->vm_inode->i_count++;
	if (n->vm_ops && n->vm_ops->open)
		n->vm_ops->open(n);
	// 插入进程的vma结构
	insert_vm_struct(current, n);
	return 0;
}
// 设置开始地址为start结束地址为vma的end这片内存的属性
static inline int mprotect_fixup_end(struct vm_area_struct * vma,
	unsigned long start,
	int newflags, pgprot_t prot)
{
	struct vm_area_struct * n;
	// 一分为二,申请一块新的vma
	n = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
	if (!n)
		return -ENOMEM;
	*n = *vma;
	// start为切分边界,修改原vma的end为start
	vma->vm_end = start;
	// 新vma的start为start
	n->vm_start = start;
	// 相当于vm_offset = vm_offset - vma->start + n->vm_start,新地址加上相对偏移
	n->vm_offset += n->vm_start - vma->vm_start;
	// 只需设置新块的属性
	n->vm_flags = newflags;
	n->vm_page_prot = prot;
	// 多了一个vma引用文件
	if (n->vm_inode)
		n->vm_inode->i_count++;
	if (n->vm_ops && n->vm_ops->open)
		n->vm_ops->open(n);
	// 插入进程vma结构
	insert_vm_struct(current, n);
	return 0;
}
// 设置开始地址为start结束地址为end这片内存的属性
static inline int mprotect_fixup_middle(struct vm_area_struct * vma,
	unsigned long start, unsigned long end,
	int newflags, pgprot_t prot)
{
	struct vm_area_struct * left, * right;
	// 一分为三
	left = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
	if (!left)
		return -ENOMEM;
	right = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
	if (!right) {
		kfree(left);
		return -ENOMEM;
	}
	// 复制得到默认值
	*left = *vma;
	*right = *vma;
	// 一块的结束地址是start
	left->vm_end = start;
	// 第二块的开始地址是start,结束地址是end,start和end是用户修改属性的内存范围
	vma->vm_start = start;
	vma->vm_end = end;
	// 第三块的start是end
	right->vm_start = end;
	// 第一块不需要更新offset,第二、第三块需要更新offset,都是新开始地址+之前的相对偏移
	vma->vm_offset += vma->vm_start - left->vm_start;
	right->vm_offset += right->vm_start - left->vm_start;
	// 只需要设置第二块的属性
	vma->vm_flags = newflags;
	vma->vm_page_prot = prot;
	// 多了两个vma引用文件
	if (vma->vm_inode)
		vma->vm_inode->i_count += 2;
	if (vma->vm_ops && vma->vm_ops->open) {
		vma->vm_ops->open(left);
		vma->vm_ops->open(right);
	}
	// 插入两个vma
	insert_vm_struct(current, left);
	insert_vm_struct(current, right);
	return 0;
}
// 修改一个vma某个内存区间的属性
static int mprotect_fixup(struct vm_area_struct * vma, 
	unsigned long start, unsigned long end, unsigned int newflags)
{
	pgprot_t newprot;
	int error;
	// 不变
	if (newflags == vma->vm_flags)
		return 0;
	// 见mmap.c的protection_map,把用户层的标记转成页表项格式的值,第四位表示是否共享
	newprot = protection_map[newflags & 0xf];
	if (start == vma->vm_start)
		if (end == vma->vm_end)
			// 地址完全重合则直接覆盖vma的设置
			error = mprotect_fixup_all(vma, newflags, newprot);
		else
			// start重合则修改start到end的设置
			error = mprotect_fixup_start(vma, end, newflags, newprot);
	// 结束地址重合
	else if (end == vma->vm_end)
		error = mprotect_fixup_end(vma, start, newflags, newprot);
	else
		// 中间部分重合
		error = mprotect_fixup_middle(vma, start, end, newflags, newprot);

	if (error)
		return error;
	// 修改页目录、页表的内容
	change_protection(start, end, newprot);
	return 0;
}
// 设置start开始,大小是len的这片内存的属性为prot
asmlinkage int sys_mprotect(unsigned long start, size_t len, unsigned long prot)
{
	unsigned long nstart, end, tmp;
	struct vm_area_struct * vma, * next;
	int error;
	// 低12位不为0,没有页对齐,报错
	if (start & ~PAGE_MASK)
		return -EINVAL;
	// 长度是页大小的整数倍,~PAGE_MASK表示不够一页则补足一页
	len = (len + ~PAGE_MASK) & PAGE_MASK;
	// 修改的末地址
	end = start + len;
	if (end < start)
		return -EINVAL;
	// 只能设置这三个标记
	if (prot & ~(PROT_READ | PROT_WRITE | PROT_EXEC))
		return -EINVAL;
	// 没有内存需要修改
	if (end == start)
		return 0;
	// 找出地址start对应vma
	vma = find_vma(current, start);
	// 地址无效
	if (!vma || vma->vm_start > start)
		return -EFAULT;
	// 循环处理
	for (nstart = start ; ; ) {
		unsigned int newflags;

		/* Here we know that  vma->vm_start <= nstart < vma->vm_end. */
		/*
			(vma->vm_flags & ~(PROT_READ | PROT_WRITE | PROT_EXEC))表示清掉读写执行三个标记,
			保留其他的标记,然后再与prot。即重新设置读写执行位
		*/
		newflags = prot | (vma->vm_flags & ~(PROT_READ | PROT_WRITE | PROT_EXEC));
		/*
			flag的取值见mm.h
			高四位是标记对应的属性是否可以设置。从低到高分别是可读、可写、可执行
			newflags右移四位把高四位移到第四位,四位中,置一的位说明可以设置,所以不需要校验,
			只需要校验为0的位,所以取反,置0的位变成1,如果最后与的时候非0,说明用户设置了这一位,
			则不合法。(最后&0xf说明只关注低四位。)
		*/
		if ((newflags & ~(newflags >> 4)) & 0xf) {
			error = -EACCES;
			break;
		}
		// 成立的话说明用户设置的内存区间落在一个vma里,直接修改就行,否则需要修改多个vma,见下面
		if (vma->vm_end >= end) {
			error = mprotect_fixup(vma, nstart, end, newflags);
			break;
		}
		// 用户设置的end大于vma的end,所以需要设置多次
		tmp = vma->vm_end;
		// 下一个vma
		next = vma->vm_next;
		// 设置第一个vma的属性,下一轮修改下一个vma的属性
		error = mprotect_fixup(vma, nstart, tmp, newflags);
		if (error)
			break;
		// 重新设置start的值,为当前vma的end,而不是下一个vma的开始地址
		nstart = tmp;
		vma = next;
		// 下一块的start不等于nstart,即不等于上一块的end,说明不连续,用户设置的范围不合法,报错
		if (!vma || vma->vm_start != nstart) {
			error = -EFAULT;
			break;
		}
	}
	// 处理avl树
	merge_segments(current, start, end);
	return error;
}

你可能感兴趣的:(linux1.2.13源码分析)