用qemu + gdb调试linux内核

对内核进行调试一直个比较麻烦的事情,最近需要研究内核的IO行为,又让我萌生单步跟踪调试的念头。刚好了解到qemu的-gdb选项,然而用起来也不是像傻瓜相机那样简单,还是有一些步骤要做的。另外网上这方面资料也还比较少。

1. 编译debug版本内核

标准的发行版内核是没有debug信息的,需要编译新的内核。下载内核后,在`make menuconfig`这一步,把kernel debugging选项打开, 以及其他几个相关选项。

编译kernel的步骤:

1) # cp /boot/config-`uname -r`.config
2)   # make menuconfig

在这一步,要选择调试选项, 下面的选项要选上:

【Kernel hacking】
 -*- Kernel debugging
    [*] Allow gcc to uninline functions marked 'inline'
    [*] Debug low-level entry code
 Choose kernel unwinder
    (X) Frame pointer unwinder

3)  手工修改Makefile,给`KBUILD_HOSTCFLAGS`, `KBUILD_HOSTCXXFLAGS`, `KBUILD_CFLAGS`都增加了-g -Og选项。-O2的地方改成-Og

注意,优化选项从-O2改成-Og 就可以,如果改成-O0会报告编译错误。

4)配置后对内核make,成功完成后,应该在内核目录下看到` arch/x86_64/boot/bzImage`这个文件。

5)  # make -j4 bzImage 
# make -j4 modules 
# make -j4 modules_install  install 

安装了新内核后按正常模式启动VM, 查看新内核是否正常工作。然后修改 /etc/default/grub 文件, 对GRUB_CMDLINE_LINUX参数上追加nokaslr

GRUB_CMDLINE_LINUX="  nokaslr"

这个nokaslr很关键,否则话kernel加载到内存后他的地址会进行随机化,这样gdb任务的地址和kernel实际的加载地址就不一致,会导致断点完全不工作。

然后执行命令更新grub文件

# sudo grub2-mkconfig -o /boot/grub2/grub.cfg  #对于使用grub的系统

# sudo grub2-mkconfig -o /boot/efi/EFI/centos/grub.cfg   #对于使用uefi的系统

2. 启动qemu

这里要注意下qemu的版本,太旧版本的qemu不工作,vm能启动,但是gdb调试时会报告 “Remote 'g' packet reply is too long:” 这样的错误。从实践看,换到qemu 3.1.0版本是可以工作的。顺便一提的是,为了快速从源代码编译qemu, 减少依赖项,编译qemu时可以尽量少带些功能。可以用这样的configure命令来配置qemu:

qemu# ./configure --target-list=x86_64-softmmu --disable-werror --disable-rbd --disable-bluez --disable-brlapi
qemu# make

编译后启动qemu时的命令做适当的修改:

# /root/qemu3.1.0/x86_64-softmmu/qemu-system-x86_64  -S -s -smp 1

这里的几个参数是这样的

-S 表示启动后就挂起,等待gdb连接
-s 是-gdb :1234的缩小,就是打开1234这个gdb调试端口
为调试方便,不要使用KVM
为调试方便,最后只使用1个CPU核



3. 启动gdb进行调试

在gdb进行调试前,在~/.gdbinit 里增加这样一行
add-auto-load-safe-path /path-to-you-new-kernel-dir

gdb会从kernel目录下面加载脚本。这个目录下面有个vmlinux-gdb.py 文件。

gdb -ex "file /z0/liulele/workspace/newkernel/vmlinux" -ex "target remote :1234"
(gdb) break start_kernel
(gdb) c

这时就可以看到内核中断在start_kernel函数上。可以查看变量,可以单步跟踪。


附几个小窍门:

1. 在guest系统里面做内核编译。为此启动qemu时可以-enable-kvm -smp 8,把硬件加速和多核功能都启用起来。调试时启动qemu不要带这个参数。

2. kernel source code放到Host系统,然后guest通过nfs访问host系统里的source code,且让source code在host和guest系统里的目录路径相同。即nfs挂载时也挂载到和host系统相同的目录下。这样guest系统编译用到的路径,和host系统gdb用到的路径就一致了
3. 修改guest系统的 /boot/grub/grub.cfg, 给准备使用的新linux 内核增加 nokaslr 参数

这样就可以调试完整的linux系统了。

最后安利个gdb神器 -- cgdb. cgdb可以更方便的看代码,设置断点。其实我更习惯用visual studio,但是还没找到用visual studio 2017连接remote gdb 的方法,知道的朋友可以告诉我。

你可能感兴趣的:(用qemu + gdb调试linux内核)