libvirt 启动 qemu 的过程

1 背景介绍

gdb 调试多任务程序时会有些麻烦: fork 之后没法同时跟踪父进程和子进程,如果在子进程里设置了一个 breakpoint,那么子进程将会收到一个 SIGTRAP 信号并退出。gdb 手册里提到了一种小技巧,那就是在想要插入 breakpoint 的位置添加 sleep() 调用。但经过笔者试验,添加以下代码更加适合:

 
  1. static volatile int hold = 1;
  2. while (hold) ;

然后,重新编译程序并执行。这样,当程序运行到 while 位置的时候就会循环在那里,接下来就可以调试了。

2 调试步骤

多任务基本调试步骤如下:

  1. ps -ef | grep xxx,找到你关心的进程
  2. gdb attach pid,关联到当前 pid 对应的 program
  3. info threads,查看哪个线程正在执行你关心的 path
  4. thread xx,切换到那个线程
  5. set hold=0,设置 hold 为 0,使程序继续运行。

如果发生了进程间通信,数据流从 A 发送往 B 了,此时便可以采取上述方法,同时跟踪 A 和 B。每次发生了 pipe/socket 通信,就重复上述步骤。通过这种方式,一些很复杂的多任务程序也可以清晰调试。

3 调试案例

Libvirt 是用于管理虚拟化平台的开源的 API,后台程序和管理工具。它可以用于管理 KVM、Xen、VMware ESX,QEMU 和其他虚拟化技术。

接下来以 libvirt 的分析过程为例来介绍 gdb 的多任务调试。

libvirt 的基本操作和大概结构是这样的:

  • libvirt 组件有一个 shell,被称为 virsh,提供类似 shell 的界面,可以输入 start、shutdown 等命令操作虚拟机

  • libvirt 有一个守护进程,libvirtd,其对 virsh 的命令做出响应
    • 以 non-root 执行 virsh start 时,将以 qemu://session 的方式运行。libvirtd 将启动一个 non-root 的子进程来与 virsh 进行 socket 通信
    • 以 root 执行 virsh start 时,将以 qemu://system 方式运行,libvirtd 直接与 virsh 进行 socket 通信
  • 无论是上述哪种方式,都会创建多个(一般16个)线程,该线程的的作用是将 socket 传递过来的各个命令和配置进行解析,最终形成一个 cmd。

  • 子线程会将 cmd 通过 pipe 传递给 libvirtd,libvirtd 会 fork 出一个子进程,并 exec cmd

但如果我们想弄清楚 virsh 启动 qemu 的全过程的细节,即在 virsh 里敲入 start xxx_domain,到 exec qemu bin,这中间究竟发生了什么细节呢?这就必须要 gdb 调试了。可以想象,这过程中必定有大量的进程间通信(socket、pipe),这时就出现了文章开头说明的问题:当前 thread 将数据流发给了另外的 thread,而另外的 thread 却没法跟踪并停止。

  1. 我们通过 log 大概知道了 qemuProcessStart 是启动的必经之路,因此在这个函数里添加代码:

     
    1. int
    2. qemuProcessStart(virConnectPtr conn, unsigned int flags)
    3. {
    4. ...
    5. static volatile int hold = 1;
    6. while (hold) ;
    7. }
  2. 重新编译、安装、重启 libvirtd

     
    1. # make && make install
    2. # service libvirtd restart
  3. 跟踪 libvirtd

     
    1. # ps -ef | grep libvirtd
    2. root 16529 1 0 16:34 ? 00:00:00 /usr/local/sbin/libvirtd --listen
    3.  
    4. # gdb /usr/local/sbin/libvirtd 16529
  4. 在其他的 console 里启动虚拟机

     
    1. # virsh start xxx
  5. 按下 Ctrl+c 停止 gdb,查看所有 threads:

     
    1. (gdb) info threads
    2. Id Target Id Frame
    3. 15 Thread 0x7f915bccd700 (LWP 16531) "libvirtd" 0x00007f9156ba3296 in qemuProcessStart (conn=conn@entry=0x7f914c1056e0, flags=flags@entry=1)
    4. ...
    5. * 1 Thread 0x7f916325d840 (LWP 16529) "libvirtd" 0x00007f9160c0ca4d in poll () from /lib64/libc.so.6
    6. (gdb)
  6. 切换到 thread 15,set hold=0

     
    1. (gdb) thread 15
    2. [Switching to thread 15 (Thread 0x7fb9ac921700 (LWP 27260))]
    3. #0 qemuProcessStart (conn=conn@entry=0x7fb97c000aa0, driver=driver@entry=0x7fb99c00da90, vm=vm@entry=0x7fb99c00b910, updatedCPU=updatedCPU@entry=0x0,
    4. asyncJob=asyncJob@entry=QEMU_ASYNC_JOB_START, migrateFrom=migrateFrom@entry=0x0, migrateFd=migrateFd@entry=-1, migratePath=migratePath@entry=0x0,
    5. snapshot=snapshot@entry=0x0, vmop=vmop@entry=VIR_NETDEV_VPORT_PROFILE_OP_CREATE, flags=flags@entry=1) at qemu/qemu_process.c:5878
    6. 5878 while (hold)
    7. (gdb) set hold=0

接下来就可以继续调试下去了。

通过这种办法就可以得知整个过程。以下是通过重复上述步骤获取到的知识:

  • 子线程将 cmd 通过 pipe 传递给 libvirtd

     
    1. (gdb)
    2. #0 virCommandHandshakeNotify (cmd=cmd@entry=0x7f6e4400fa40) at util/vircommand.c:2757
    3. #1 0x00007f6e5e7666cd in qemuProcessLaunch (conn=conn@entry=0x7f6e500009a0, driver=driver@entry=0x7f6e54000e80, vm=vm@entry=0x7f6e54012ec0,
    4. asyncJob=asyncJob@entry=QEMU_ASYNC_JOB_START, incoming=incoming@entry=0x0, snapshot=snapshot@entry=0x0, vmop=vmop@entry=VIR_NETDEV_VPORT_PROFILE_OP_CREATE,
    5. flags=flags@entry=17) at qemu/qemu_process.c:5685
    6.  
    7.  
    8.  
    9. 2729 int virCommandHandshakeNotify(virCommandPtr cmd)
    10. ...
    11. 2749 if (safewrite(cmd->handshakeNotify[1], &c, sizeof(c)) != sizeof(c)) {
    12. 2750 virReportSystemError(errno, "%s", _("Unable to notify child process"));
    13. 2751 VIR_FORCE_CLOSE(cmd->handshakeNotify[1]);
    14. 2752 return -1;
    15. 2753 }
    16. ...
    17. 2756 }
  • libvirtd 收到 cmd 后,会执行 virExec,

     
    1. #0 virExec (cmd=cmd@entry=0x7f72bc0026d0) at util/vircommand.c:491
    2. #1 0x00007f72d2219b07 in virCommandRunAsync (cmd=cmd@entry=0x7f72bc0026d0, pid=pid@entry=0x0) at util/vircommand.c:2452
    3. #2 0x00007f72d221a0c4 in virCommandRun (cmd=cmd@entry=0x7f72bc0026d0, exitstatus=exitstatus@entry=0x7f72c29fab64) at util/vircommand.c:2284
    4. #3 0x00007f72d222c166 in virFirewallCheckUpdateLock (lockflag=lockflag@entry=0x7f72d26768a3 , args=args@entry=0x7f72c29fabc0) at util/virfirewall.c:124
    5. ...
    6. #20 0x00007f72d072035d in clone () from /lib64/libc.so.6
  • virExec() 将会 fork 出子进程,子进程将会执行 exec(qmeu-system-x86_64)

     
    1. 475 virExec(virCommandPtr cmd)
    2. ...
    3. 749 if (cmd->uid != (uid_t)-1 || cmd->gid != (gid_t)-1 || cmd->capabilities || (cmd->flags & VIR_EXEC_CLEAR_CAPS)) {
    4. 753 if (virSetUIDGIDWithCaps(cmd->uid, cmd->gid, groups, ngroups,
    5. ...
    6. 790 if (cmd->env)
    7. 791 execve(binary, cmd->args, cmd->env); <--- 启动了qemu
    8. ...

在执行了 execve 之后,当前父进程就会结束退出了。如果想要继续跟踪子进程 qemu,那么仍然需要重复上述过程。

4 libvirt 分析小结

我们以一张流程图来展示整个 libvirt 启动 qemu 的过程libvirt 启动 qemu 的过程_第1张图片

5 抛砖引玉

在 Windows 调试工具 windbg 上,用户可以选择子进程在创建后,wait 并等待用户调试,从而省去了上述麻烦。gdb 是不是可以引入这个特性呢?

6 附录

GDB online doc – Fork.html:

On most systems, GDB has no special support for debugging programs which create additional processes using the fork function. When a program forks, GDB will continue to debug the parent process and the child process will run unimpeded. If you have set a breakpoint in any code which the child then executes, the child will get a SIGTRAP signal which (unless it catches the signal) will cause it to terminate.

However, if you want to debug the child process there is a workaround which isn’t too painful. Put a call to sleep in the code which the child process executes after the fork. It may be useful to sleep only if a certain environment variable is set, or a certain file exists, so that the delay need not occur when you don’t want to run GDB on the child. While the child is sleeping, use the ps program to get its process ID. Then tell GDB (a new invocation of GDB if you are also debugging the parent process) to attach to the child process (see Attach). From that point on you can debug the child process just like any other process which you attached to.

你可能感兴趣的:(云计算)