理解进程控制的原理对于理解和修改fio project非常的重要。"fio is an I/O tool meant to be used both for benchmark and stress/hardware verification."
unix提供了大量的从c程序中操作系统的系统调用(别的语言应该也是有的吧)。
每一个进程都有一个正数的id,叫做pid。getpid函数返回调用进程的pid,getppid函数返回它的父进程的pid。
fork
exit
父进程和子进程是并发运行的独立进程。内核能够以任意方式交替执行他们的逻辑控制流中的指令。
如果能够在fork函数在父进程和子进程中返回后立即暂停这两个进程,我们会看到每个进程的地址空间都是相同的。(每个进程有相同的用户栈,相同的本地变量值,相同的堆,相同的全局变量值以及相同的代码。然而他们都有自己独立的地址空间)
关于这个,fio这个程序利用到它的地方就是
while (todo) { struct thread_data *map[REAL_MAX_JOBS]; struct timeval this_start; int this_jobs = 0, left; for_each_td(td, i) { if (td->runstate != TD_NOT_CREATED) continue;
if (td->o.start_delay) { spent = utime_since_genesis();
if (td->o.start_delay > spent) continue; }
if (td->o.stonewall && (nr_started || nr_running)) { dprint(FD_PROCESS, "%s: stonewall wait\n", td->o.name); break; }
init_disk_util(td);
td->rusage_sem = fio_mutex_init(FIO_MUTEX_LOCKED); td->update_rusage = 0;
/* * Set state to created. Thread will transition * to TD_INITIALIZED when it's done setting up. */ td_set_runstate(td, TD_CREATED); map[this_jobs++] = td; nr_started++; ... if (td->o.use_thread) { int ret;
dprint(FD_PROCESS, "will pthread_create\n"); ret = pthread_create(&td->thread, NULL, thread_main, td); if (ret) { log_err("pthread_create: %s\n", strerror(ret)); nr_started--; break; } ret = pthread_detach(td->thread); if (ret) log_err("pthread_detach: %s", strerror(ret)); } else { pid_t pid; dprint(FD_PROCESS, "will fork\n"); pid = fork(); if (!pid) { int ret = fork_main(shm_id, i);
_exit(ret); } else if (i == fio_debug_jobno) *fio_debug_jobp = pid; } |
|
这就相当于这么编程:
#include <stdio.h> int main() { int i=1; int pid; while((i--)>=0){ pid=fork(); if(pid==0){ i--; printf("in the child process.\n"); } else printf("in the parent process.\n"); } } |
编译并执行上面那段程序的结果:
root@localhost ~]# ./a.out in the parent process. in the child process. in the parent process. in the child process. |
一共创建了两个进程,只不过在Fio中的子进程的执行是由另外一个函数fork_main和thread_main来决定的。
note:thread main这个函数做了许多事情,会再分析。
当一个进程由于某种原因终止时,内核并不是立即把它从系统中清除。相反,进程被保持在一种已终止的状态中,直到被它的父进程reap。当父进程回收已经终止的子进程时,内核将子进程的退出状态(这是什么样的退出状态呢,留个心)传递给父进程,然后抛弃已终止的进程,从此时开始,该进程就不存在了。
一个终止了但未被回收的进程称为僵尸zombie。
如果父进程没有回收他的zombie就终止了,那么内核就会安排init进程来回收他们。长时间运行的程序,比如shell或者服务器,总是应该回收他们的zombie(总是在消耗系统的存储器资源)。
一个进程可以通过调用waitpid函数来等待它的子进程终止或者停止。
函数原型:
#include<sys/types.h> waitpid - 函数说明 waitpid()会暂时停止目前进程的执行,直到有信号来到或子进程
|
fio使用waitpid的例子
* Run over the job map and reap the threads that have exited, if any. */ static void reap_threads(unsigned int *nr_running, unsigned int *t_rate, unsigned int *m_rate) { ... realthreads = pending = cputhreads = 0; for_each_td(td, i) { int flags = 0;
/* * ->io_ops is NULL for a thread that has closed its * io engine */ if (td->io_ops && !strcmp(td->io_ops->name, "cpuio")) cputhreads++; else realthreads++; ... flags = WNOHANG; if (td->runstate == TD_EXITED) flags = 0;
/* * check if someone quit or got killed in an unusual way */ ret = waitpid(td->pid, &status, flags); if (ret < 0) { if (errno == ECHILD) { log_err("fio: pid=%d disappeared %d\n", (int) td->pid, td->runstate); td->sig = ECHILD; td_set_runstate(td, TD_REAPED); goto reaped; } perror("waitpid"); } else if (ret == td->pid) { if (WIFSIGNALED(status)) { int sig = WTERMSIG(status);
if (sig != SIGTERM && sig != SIGUSR2) log_err("fio: pid=%d, got signal=%d\n", (int) td->pid, sig); td->sig = sig; td_set_runstate(td, TD_REAPED); goto reaped; } if (WIFEXITED(status)) { if (WEXITSTATUS(status) && !td->error) td->error = WEXITSTATUS(status);
td_set_runstate(td, TD_REAPED); goto reaped; } }
...
|
让进程休眠
sleep函数将一个进程挂起一段指定的时间。sleep函数返回0,否则返回剩下的要休眠的秒数(是可能的,因为可能被信号中断而过早的返回)。
另外一个有用的函数是pause,该函数让调用函数休眠,直到该进程收到一个信号。
另外,如果想要睡眠一段更加精确的时间,可以用usleep函数,usleep函数能把进程挂起一段时间, 单位是微秒(千分之一毫秒)。
for entry in static:
if entry.lower() == "":
httpd.add_static_dir('static', 'www_root', relative=True)
continue
if ':' not in entry:
directory = entry
prefix = os.path.split(directory)
if prefix[1] == '':
prefix = os.path.split(prefix[0])
prefix = prefix[1]
assert prefix != ''
else:
prefix,directory = entry.split(":")
directory = os.path.expanduser(directory)
httpd.add_static_dir(prefix, directory, relative=False)
def run ():
try:
log.debug("Listening on %s:%i" % httpd.socket.getsockname())
httpd.serve_forever()
print "the value of dropped is %d" %(dropped)
except:
pass
log.info("Server quit")
thread = threading.Thread(target=run)
thread.daemon = True
thread.start(的返回)。
Caapp:深入理解计算机系统
源码fio-2.1.10
pox的webcore组件