sys.c程序主要包含有很多系统调用功能的实现函数。其中,若返回值为 -ENOSYS ,则表示本版的Linux 还没有实现该功能,可以参考目前的代码来了解它们的实现方法。所有系统调用的功能说明请参见头文件 include/linux/sys.h 。
该程序中含有很多有关进程ID、进程组ID、用户ID、用户组ID、实际用户ID、有效用户ID以及会话ID(session )等的操作函数。下面首先对这些 ID 作一说明。
一个用户有用户ID(uid)和用户组ID(gid)。这两个ID是passwd文件中对该用户设置的ID,通常被称为实际用户ID(ruid)和实际组ID(rgid)。而在每个文件的i节点信息中都保存着宿主的用户 ID和组 ID ,它们指明了文件拥有者和所属用户组。主要用于访问或执行文件时的权限判别操作。另外,在一个进程的任务数据结构中,为了实现不同功能而保存了 3 种用户 ID 和组 ID 。见下表所示。
表 1 与进程相关的用户 ID 和组 ID
保存的用户 ID ( suid )和保存的组 ID ( sgid )用于进程访问设置了 set-user-ID 或 set-group-ID 标志的文件。当执行一个程序时,进程的 euid 通常就是实际用户 ID , egid 通常就是实际组 ID 。因此进程只能访问进程的有效用户、有效用户组规定的文件或其它允许访问的文件。但是如果一个文件的 set-user-ID标志置位时,那么进程的有效用户 ID 就会被设置成该文件宿主的用户 ID ,因此进程就可以访问设置了这种标志的受限文件,同时该文件宿主的用户 ID 被保存在 suid 中。同理,文件的 set-group-ID 标志也有类似的作用并作相同的处理。 进程的 uid 和 gid 分别就是进程拥有者的用户 ID 和组 ID ,也即实际用户 ID ( ruid )和实际组 ID ( rgid )。超级用户可以使用 set_uid() 和 set_gid() 对它们进行修改。有效用户 ID 和有效组 ID 用于进程访问文件时的许可权判断。
例如,如果一个程序的宿主是超级用户,但该程序设置了 set-user-ID 标志,那么当该程序被一个进程运行时,则该进程的有效用户 ID ( euid )就会被设置成超级用户的 ID ( 0 )。于是这个进程就拥有了超级用户的权限。一个实际例子就是 Linux 系统的 passwd 命令。该命令是一个设置了 set-user-Id 的程序,
因此允许用户修改自己的口令。因为该程序需要把用户的新口令写入 /etc/passwd 文件中,而该文件只有超级用户才有写权限,因此 passwd 程序就需要使用 set-user-ID 标志。
另外,进程也有标识自己属性的进程 ID ( pid )、所属进程组的进程组 ID ( pgrp 或 pgid )和所属会话的会话 ID ( session )。这 3 个 ID 用于表明进程与进程之间的关系,与用户 ID 和组 ID 无关。
/*
* linux/kernel/sys.c
*
* (C) 1991 Linus Torvalds
*/
include // 错误号头文件。包含系统中各种出错号。(Linus 从 minix 中引进的)。
include // 调度程序头文件,定义了任务结构 task_struct、初始任务 0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include // tty 头文件,定义了有关 tty_io,串行通信方面的参数、常数。
#include // 内核头文件。含有一些内核常用函数的原形定义。
#include // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include // 定义了进程中运行时间的结构 tms 以及 times()函数原型。
#include // 系统名称结构头文件。
// 返回日期和时间。
int sys_ftime()
{
return -ENOSYS;
}
//
int sys_break()
{
return -ENOSYS;
}
// 用于当前进程对子进程进行调试(degugging)。
int sys_ptrace()
{
return -ENOSYS;
}
// 改变并打印终端行设置。
int sys_stty()
{
return -ENOSYS;
}
// 取终端行设置信息。
int sys_gtty()
{
return -ENOSYS;
}
// 修改文件名。
int sys_rename()
{
return -ENOSYS;
}
//
int sys_prof()
{
return -ENOSYS;
}
// 设置当前任务的实际以及/或者有效组 ID(gid)。如果任务没有超级用户特权,
// 那么只能互换其实际组 ID 和有效组 ID。如果任务具有超级用户特权,就能任意设置有效的和实际
// 的组 ID。保留的 gid(saved gid)被设置成与有效 gid 同值。
int sys_setregid(int rgid, int egid)
{
if (rgid>0) {
if ((current->gid == rgid) || suser())
current->gid = rgid;
else
return(-EPERM);
}
if (egid>0) {
if ((current->gid == egid) ||
(current->egid == egid) ||
(current->sgid == egid) ||
suser())
current->egid = egid;
else
return(-EPERM);
}
return 0;
}
// 设置进程组号(gid)。如果任务没有超级用户特权,它可以使用 setgid()将其有效 gid
// (effective gid)设置为成其保留 gid(saved gid)或其实际 gid(real gid)。如果任务有
// 超级用户特权,则实际 gid、有效 gid 和保留 gid 都被设置成参数指定的 gid。
int sys_setgid(int gid)
{
return(sys_setregid(gid, gid));
}
// 打开或关闭进程计帐功能。
int sys_acct()
{
return -ENOSYS;
}
// 映射任意物理内存到进程的虚拟地址空间。
int sys_phys()
{
return -ENOSYS;
}
int sys_lock()
{
return -ENOSYS;
}
int sys_mpx()
{
return -ENOSYS;
}
int sys_ulimit()
{
return -ENOSYS;
}
// 返回从 1970 年 1 月 1 日 00:00:00 GMT 开始计时的时间值(秒)。如果 tloc 不为 null,则时间值
// 也存储在那里。
int sys_time(long * tloc)
{
int i;
i = CURRENT_TIME;
if (tloc) {
verify_area(tloc,4); // 验证内存容量是否够(这里是 4 字节)。
put_fs_long(i,(unsigned long *)tloc); // 也放入用户数据段 tloc 处。
}
return i;
}
/*
* Unprivileged users may change the real user id to the effective uid
* or vice versa.
*/
/*
* 无特权的用户可以见实际用户标识符(real uid)改成有效用户标识符(effective uid),反之也然。
*/
// 设置任务的实际以及/或者有效用户 ID(uid)。如果任务没有超级用户特权,那么只能互换其
// 实际用户 ID 和有效用户 ID。如果任务具有超级用户特权,就能任意设置有效的和实际的用户 ID。
// 保留的 uid(saved uid)被设置成与有效 uid 同值。
int sys_setreuid(int ruid, int euid)
{
int old_ruid = current->uid;
if (ruid>0) {
if ((current->euid==ruid) ||
(old_ruid == ruid) ||
suser())
current->uid = ruid;
else
return(-EPERM);
}
if (euid>0) {
if ((old_ruid == euid) ||
(current->euid == euid) ||
suser())
current->euid = euid;
else {
current->uid = old_ruid;
return(-EPERM);
}
}
return 0;
}
// 设置任务用户号(uid)。如果任务没有超级用户特权,它可以使用 setuid()将其有效 uid
// (effective uid)设置成其保留 uid(saved uid)或其实际 uid(real uid)。如果任务有
// 超级用户特权,则实际 uid、有效 uid 和保留 uid 都被设置成参数指定的 uid。
int sys_setuid(int uid)
{
return(sys_setreuid(uid, uid));
}
// 设置系统时间和日期。参数 tptr 是从 1970 年 1 月 1 日 00:00:00 GMT 开始计时的时间值(秒)。
// 调用进程必须具有超级用户权限。
int sys_stime(long * tptr)
{
if (!suser()) // 如果不是超级用户则出错返回(许可)。
return -EPERM;
startup_time = get_fs_long((unsigned long *)tptr) - jiffies/HZ;
return 0;
}
// 获取当前任务时间。tms 结构中包括用户时间、系统时间、子进程用户时间、子进程系统时间。
int sys_times(struct tms * tbuf)
{
if (tbuf) {
verify_area(tbuf,sizeof *tbuf);
put_fs_long(current->utime,(unsigned long *)&tbuf->tms_utime);
put_fs_long(current->stime,(unsigned long *)&tbuf->tms_stime);
put_fs_long(current->cutime,(unsigned long *)&tbuf->tms_cutime);
put_fs_long(current->cstime,(unsigned long *)&tbuf->tms_cstime);
}
return jiffies;
}
// 当参数 end_data_seg 数值合理,并且系统确实有足够的内存,而且进程没有超越其最大数据段大小
// 时,该函数设置数据段末尾为 end_data_seg 指定的值。该值必须大于代码结尾并且要小于堆栈
// 结尾 16KB。返回值是数据段的新结尾值(如果返回值与要求值不同,则表明有错发生)。
// 该函数并不被用户直接调用,而由 libc 库函数进行包装,并且返回值也不一样。
int sys_brk(unsigned long end_data_seg)
{
if (end_data_seg >= current->end_code && // 如果参数>代码结尾,并且
end_data_seg < current->start_stack - 16384) // 小于堆栈-16KB,
current->brk = end_data_seg; // 则设置新数据段结尾值。
return current->brk; // 返回进程当前的数据段结尾值。
}
/*
* This needs some heave checking ...
* I just haven't get the stomach for it. I also don't fully
* understand sessions/pgrp etc. Let somebody who does explain it.
*/
/*
* 下面代码需要某些严格的检查…
* 我只是没有胃口来做这些。我也不完全明白 sessions/pgrp 等。还是让了解它们的人来做吧。
*/
// 设置进程的进程组 ID 为 pgid。
// 如果参数 pid=0,则使用当前进程号。如果 pgid 为 0,则使用参数 pid 指定的进程的组 ID 作为
// pgid。如果该函数用于将进程从一个进程组移到另一个进程组,则这两个进程组必须属于同一个
// 会话(session)。在这种情况下,参数 pgid 指定了要加入的现有进程组 ID,此时该组的会话 ID
// 必须与将要加入进程的相同(193 行)。
int sys_setpgid(int pid, int pgid)
{
int i;
if (!pid) // 如果参数 pid=0,则使用当前进程号。
pid = current->pid;
if (!pgid) // 如果 pgid 为 0,则使用当前进程 pid 作为 pgid。
pgid = current->pid; // [??这里与 POSIX 的描述有出入]
for (i=0 ; ipid==pid) {
if (task[i]->leader) // 如果该任务已经是首领,则出错返回。
return -EPERM;
if (task[i]->session != current->session) // 如果该任务的会话 ID
return -EPERM; // 与当前进程的不同,则出错返回。
task[i]->pgrp = pgid; // 设置该任务的 pgrp。
return 0;
}
return -ESRCH;
}
// 返回当前进程的组号。与 getpgid(0)等同。
int sys_getpgrp(void)
{
return current->pgrp;
}
// 创建一个会话(session)(即设置其 leader=1),并且设置其会话号=其组号=其进程号。
// setsid -- SET Session ID。
int sys_setsid(void)
{
if (current->leader && !suser()) // 如果当前进程已是会话首领并且不是超级用户
return -EPERM; // 则出错返回。
current->leader = 1; // 设置当前进程为新会话首领。
current->session = current->pgrp = current->pid; // 设置本进程 session = pid。
current->tty = -1; // 表示当前进程没有控制终端。
return current->pgrp; // 返回会话 ID。
}
// 获取系统信息。其中 utsname 结构包含 5 个字段,分别是:本版本操作系统的名称、网络节点名称、
// 当前发行级别、版本级别和硬件类型名称。
int sys_uname(struct utsname * name)
{
static struct utsname thisname = { // 这里给出了结构中的信息,这种编码肯定会改变。
"linux .0" , "nodename" , "release " , "version " , "machine "
};
int i;
if (!name) return -ERROR; // 如果存放信息的缓冲区指针为空则出错返回。
verify_area(name,sizeof *name); // 验证缓冲区大小是否超限(超出已分配的内存等)。
for(i=0;iumask;
current->umask = mask & 0777;
return (old);
}