内核模块是一个在需要时能够被加载到内核内存空间代码片段,在合适的时候也可以从内核中移除。内核模块和.so的最大的差别是内核模块一定是被加载到内核空间中的,而so文件(共享对象文件)则可能被加载到用户空间。正因为内核模块的动态加载功能使得在不重启的情况下扩展系统的功能成为可能。
用户可以通过lsmod命令来查看已经加载到内核中的模块信息,这个命令会获取/proc/modules文件中的信息(内核版本为2.6,以后的版本可能会稍微有调整)。/proc属于内存文件系统,里面所有的文件都是在内存中动态生成的,包含当前系统管理的一些信息。当系统需要使用一个当前内核没有提供的功能时,内核精灵程序kmod将会执行modprobe命令来加载模块,如果没有找到模块或者模块加载失败则会报错返回。Kmod会传递一个参数给modprobe命令,参数的格式有下面两种:
1 模块名称字符串,例如softdog
2 一个更加通用的标识符,例如 char-major-10-30
如果传递给modprobe的是一个通用的标识符,那么modprobe命令首先会从配置数据库/etc/modprobe.conf中查找类似下面这种格式的字符串:
Alias char-major-10-30 softdog
该数据库提供通用标识符和模块名称字符串之间的转换映射。通过这一句将通用标志符转换为需要加载的模块的名称softdog.ko。接下来,modprobe命令通过文件/lib/modules/version/modules.dep文件来查看softdog.ko依赖的文件,以便于加载softdog.ko之前将依赖项也加载到内核中。这个文件通过depmod –a命令创建的。这种依赖关系很好理解,就是本模块的一些调用在其他的模块中实现,所以需要将依赖的模块提前加载到内核中。最后modprobe调用insmod命令将所有依赖模块和需要加载的模块给加载到内核中(貌似不能处理链式依赖关系)。由于Modprobe没有指定加载的位置,因此更加倾向于使用默认地址/lib/modules/version/;insmod则不会使用默认地址,加载的地址需要由用户自己指定位置。下面是两种命令对同一个加载的不同方式:
Insmod /lib/modules/2.6.11/kernel/fs/fat/fat.ko Insmod /lib/modules/2.6.11/kernel/fs/msdos/msdos.ko
下面一条命令就解决上面这么多命令所实现的功能
Modprobe msdos
因为Modprobe所需要的一切信息都可以通/lib/modules/version/modules.dep来推断。
#include <linux/module.h> /* Needed by all modules */ #include <linux/kernel.h> /* Needed for KERN_INFO */ int init_module(void) { printk(KERN_INFO "Hello world 1.\n"); return 0; } void cleanup_module(void) { printk(KERN_INFO "Goodbye world 1.\n"); }
内核模块必须有两个函数,一个是初始化函数,这个函数在insmod命令加载模块时被调用;另一个是清除函数,这个函数在模块被rmmod命令卸载时调用。在这里需要注意几点,第一,这里面的init_module和系统调用init_module不是同一个概念,前者是每个模块都具备的,在初始化之后就可以从内存中清除,而后者则是系统中常驻内存的系统调用;第二,init_module和ctors类的函数不是一个概念,后者类似于C++里面的构造函数,这些函数在模块的init_module初始化函数前面调用,而dtors和析构函数类似也要和模块的cleanup_module函数区分开来。
经过上面的分析,下面就进行编译。内核模块的编译和用户程序编译时Makefile会有一些差异。因为最后内核模块需要调用内核编译工具链而并非用户模式下的工具链,下面是一个内核模块的Makefile:obj-m += hello-1.o all: make -C /lib/modules/$(shell uname -r)/build M=$(PWD) modules clean: make -C /lib/modules/$(shell uname -r)/build M=$(PWD) clean上面的makefile指令和常见的用户程序makefile不一样。第一句是为了告诉编译器将当前模块以类似于内核中的可加载模块的方式编译(内核中的可加载模块是指在编译内核时配置为可加载项的模块)。第二句是找到内核的工具链,并制定编译的目标。第三句则是调用相应的工具链进行清理工作。下面是make执行过程:
hostname:~/lkmpg-examples/02-HelloWorld# make make -C /lib/modules/2.6.11/build M=/root/lkmpg-examples/02-HelloWorld modules make[1]: Entering directory `/usr/src/linux-2.6.11' CC [M] /root/lkmpg-examples/02-HelloWorld/hello-1.o Building modules, stage 2. MODPOST CC /root/lkmpg-examples/02-HelloWorld/hello-1.mod.o LD [M] /root/lkmpg-examples/02-HelloWorld/hello-1.ko make[1]: Leaving directory `/usr/src/linux-2.6.11' hostname:~/lkmpg-examples/02-HelloWorld#
编译之后,调用modinfo命令可以看到模块的相关的信息,下表所列出的是以后的一个例子,信息比上面编译出来的要丰富。
hostname:~/lkmpg-examples/02-HelloWorld# modinfo hello-5.ko filename: hello-5.ko license: GPL author: Peter Jay Salzman vermagic: 2.6.11 preempt PENTIUMII 4KSTACKS gcc-3.3 depends: parm: myintArray:An array of integers (array of int) parm: mystring:A character string (charp) parm: mylong:A long integer (long) parm: myint:An integer (int) parm: myshort:A short integer (short) hostname:~/lkmpg-examples/02-HelloWorld#第二个例子中需要注意的是的__init和__exit宏以及后面的module_init和module_exit;这一堆的东西主要是为了告诉加载器,这些代码所占用的内存不需要常驻内存,实现起来很简单,将这部分编译出来的代码单独放到二进制文件的一个特定的节就可以实现。
#include <linux/module.h> /* Needed by all modules */ #include <linux/kernel.h> /* Needed for KERN_INFO */ #include <linux/init.h> /* Needed for the macros */ static int __init hello_2_init(void) { printk(KERN_INFO "Hello, world 2\n"); return 0; } static void __exit hello_2_exit(void) { printk(KERN_INFO "Goodbye, world 2\n"); } module_init(hello_2_init); module_exit(hello_2_exit);在内核版本2.4以后,加载上诉例子编译出来的内核模块时可能会看到如下警告:
# insmod xxxxxx.o Warning: loading xxxxxx.ko will taint the kernel: no license See http://www.tux.org/lkml/#export-tainted for information about tainted modules Module xxxxxx loaded, with warnings
这只是当内核模块版本使用的授权证书不是GPL时才会报警告,因为Linux使用的是GPL授权证书。授权证书由宏 MODULE_LICENSE()实现,还有一些类似的宏:
MODULE_DESCRIPTION()用于表明这个模块能做什么,MODULE_AUTHOR() 声明模块作者,MODULE_SUPPORTED_DEVICE()声明模块支持什么样的设备。#include <linux/module.h> /* Needed by all modules */ #include <linux/kernel.h> /* Needed for KERN_INFO */ #include <linux/init.h> /* Needed for the macros */ #define DRIVER_AUTHOR "Peter Jay Salzman <p@dirac.org>" #define DRIVER_DESC "A sample driver" static int __init init_hello_4(void) { printk(KERN_INFO "Hello, world 4\n"); return 0; } static void __exit cleanup_hello_4(void) { printk(KERN_INFO "Goodbye, world 4\n"); } module_init(init_hello_4); module_exit(cleanup_hello_4); MODULE_LICENSE("GPL"); MODULE_AUTHOR(DRIVER_AUTHOR); /* Who wrote this module? */ MODULE_DESCRIPTION(DRIVER_DESC); /* What does this module do */ MODULE_SUPPORTED_DEVICE("testdevice");到目前为止,内核模块已经可以加载了,不过对内核模块初始化函数的调用还有一点不足之处——不能传递参数。为了允许参数的传递,又需要引入另一个宏 module_param(),在运行时,这个宏定义的一些参数可以由insmod命令行所带的命令行参数进行填充,比如:./insmod mymodule.ko myvariable=5。变量声明宏需要被放在模块的初始位置,module_param 宏包含三个参数,一个是参数变量名称,第二个是参数类型,第三个是参数的权限。
int myint = 3; module_param(myint, int, 0);下面是定义一个数组的形式,为了跟踪参数的数目,第三个参数是一个指向数组个数的指针,第四个才是参数的权限。如果第三个参数是NULL,则表明数组长度为多少不是关注点,定义数组的形式如下:
int myintarray[2]; module_param_array(myintarray, int, NULL, 0); int myshortarray[4]; int count; module_parm_array(myshortarray, short, , 0);一个很好的使用模块变量的典型例子是,设置一个默认值,比如一个端口和一个IO地址。为了定义参数的用途,需要一个新的宏MODULE_PARM_DESC()用于描述参数的用途, 这个宏包含两个参数,一个是变量名称,另一个是字符串描述这个变量。
#include <linux/module.h> #include <linux/moduleparam.h> #include <linux/kernel.h> #include <linux/init.h> #include <linux/stat.h> MODULE_LICENSE("GPL"); MODULE_AUTHOR("Peter Jay Salzman"); static short int myshort = 1; static int myint = 420; static long int mylong = 9999; static char *mystring = "blah"; static int myintArray[2] = { -1, -1 }; static int arr_argc = 0; module_param(myshort, short, S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP); MODULE_PARM_DESC(myshort, "A short integer"); module_param(myint, int, S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH); MODULE_PARM_DESC(myint, "An integer"); module_param(mylong, long, S_IRUSR); MODULE_PARM_DESC(mylong, "A long integer"); module_param(mystring, charp, 0000); MODULE_PARM_DESC(mystring, "A character string"); module_param_array(myintArray, int, &arr_argc, 0000); MODULE_PARM_DESC(myintArray, "An array of integers"); static int __init hello_5_init(void) { int i; printk(KERN_INFO "Hello, world 5\n=============\n"); printk(KERN_INFO "myshort is a short integer: %hd\n", myshort); printk(KERN_INFO "myint is an integer: %d\n", myint); printk(KERN_INFO "mylong is a long integer: %ld\n", mylong); printk(KERN_INFO "mystring is a string: %s\n", mystring); for (i = 0; i < (sizeof myintArray / sizeof (int)); i++) { printk(KERN_INFO "myintArray[%d] = %d\n", i, myintArray[i]); } printk(KERN_INFO "got %d arguments for myintArray.\n", arr_argc); return 0; } static void __exit hello_5_exit(void) { printk(KERN_INFO "Goodbye, world 5\n"); } module_init(hello_5_init); module_exit(hello_5_exit);
上面所提到的所有的模块加载都只是针对/proc文件系统。而普通的用户不具备访问/proc文件系统的权限,因此要对设备进行访问需要一个用户接口。这个用户接口就是/dev目录下的文件,这个目录里面的所有设备文件都是用户可见也是用户程序可以访问的。而在这个目录里面创建文件需要另外一个命令mknod。命令格式如下:mknod /dev/coffee c 12 2。这条命令的含义是创建一个字符设备,主设备号为12,次版本号为2。当一个设备程序被访问,内核使用设备的主版本号来决定使用哪个驱动程序。这意味着内核甚至不需要知道次版本号,驱动程序才会关注次版本号,驱动程序使用次版本号来区分不同的硬件设备。而普通程序员则直接利用设备文件名称就可以对设备进行操作了,这也就是操作系统中所说的设备即文件。