LDD3源码分析之字符设备驱动程序

作者:刘昊昱 

博客:http://blog.csdn.net/liuhaoyutz

编译环境:Ubuntu 10.10

内核版本:2.6.32-38-generic-pae

LDD3源码路径:examples/scull/main.c

 

本文是对LDD3第三章驱动代码的分析记录。LDD3scull源码是一个综合性的驱动程序,内容涵盖了第三章到第六章的内容,初学者在学习过程中可能会有一定困难,这里仅分析LDD3第三章涉及的相关代码。在本文的最后,列出了在2.6.32内核上编译scull可能遇到的问题及解决方法。

本文要分析代码位于examples/scull/main.c中。

前面文章中我们曾经介绍过,分析Linux设备驱动程序,起点是找module_init指定的模块初始化函数。所以,我们打开examples/scull/main.c文件,从module_init开始分析。在该文件的672行即是对module_init宏的调用:

672 module_init(scull_init_module);
673 module_exit(scull_cleanup_module);

可见,模块初始化函数是scull_init_module函数。我们找到这个函数的定义:

615int scull_init_module(void)
616{
617    int result, i;
618    dev_t dev = 0;
619
620/*
621 * Get a range of minor numbers to work with, asking for a dynamic
622 * major unless directed otherwise at load time.
623 */
624    if (scull_major) {
625        dev = MKDEV(scull_major, scull_minor);
626        result = register_chrdev_region(dev, scull_nr_devs, "scull");
627    } else {
628        result = alloc_chrdev_region(&dev, scull_minor, scull_nr_devs,
629                "scull");
630        scull_major = MAJOR(dev);
631    }
632    if (result < 0) {
633        printk(KERN_WARNING "scull: can't get major %d\n", scull_major);
634        return result;
635    }
636
637        /*
638     * allocate the devices -- we can't have them static, as the number
639     * can be specified at load time
640     */
641    scull_devices = kmalloc(scull_nr_devs * sizeof(struct scull_dev), GFP_KERNEL);
642    if (!scull_devices) {
643        result = -ENOMEM;
644        goto fail;  /* Make this more graceful */
645    }
646    memset(scull_devices, 0, scull_nr_devs * sizeof(struct scull_dev));
647
648        /* Initialize each device. */
649    for (i = 0; i < scull_nr_devs; i++) {
650        scull_devices[i].quantum = scull_quantum;
651        scull_devices[i].qset = scull_qset;
652        init_MUTEX(&scull_devices[i].sem);
653        scull_setup_cdev(&scull_devices[i], i);
654    }
655
656        /* At this point call the init function for any friend device */
657    dev = MKDEV(scull_major, scull_minor + scull_nr_devs);
658    dev += scull_p_init(dev);
659    dev += scull_access_init(dev);
660
661#ifdef SCULL_DEBUG /* only when debugging */
662    scull_create_proc();
663#endif
664
665    return 0; /* succeed */
666
667  fail:
668    scull_cleanup_module();
669    return result;
670}

624631行,申请分配设备编号,根据scull_major的值是否为0,分别采用静态分配设备编号(register_chrdev_region)或动态分配设备编号(alloc_chrdev_region)的方法。scull_major代表主设备号,它的值是怎么确定的呢?在main.c41行有如下定义:

41int scull_major =   SCULL_MAJOR;
42int scull_minor =   0;
43int scull_nr_devs = SCULL_NR_DEVS;  /* number of bare scull devices */
44int scull_quantum = SCULL_QUANTUM;
45int scull_qset =    SCULL_QSET;
46
47module_param(scull_major, int, S_IRUGO);
48module_param(scull_minor, int, S_IRUGO);
49module_param(scull_nr_devs, int, S_IRUGO);
50module_param(scull_quantum, int, S_IRUGO);
51module_param(scull_qset, int, S_IRUGO);

SCULL_MAJORSCULL_NR_DEVSSCULL_QUANTUMSCULL_QSET这四个宏在scull.h中有定义如下:

44#define SCULL_MAJOR 0   /* dynamic major by default */
48#define SCULL_NR_DEVS 4    /* scull0 through scull3 */
65#define SCULL_QUANTUM 4000
69#define SCULL_QSET    1000

由此可见,scull驱动程序对于scull_majorscull_minorscull_nr_devsscull_quantumscull_qset这几个变量的值采用了赋默认值,但同时也保留用户在命令行通过模块参数进行设置的可能。以scull_major为例,其默认值是0,在scull_init_module函数中,如果用户没有通过命令行参数给scull_major赋任意大于0的值,则会采用alloc_chrdev_region动态分配设备编号。如果用户给scull_major赋了一个大于0值,则采用register_chrdev_region静态申请设备编号。

我们继续看scull_init_module函数。下面看641行:

641    scull_devices = kmalloc(scull_nr_devs * sizeof(struct scull_dev), GFP_KERNEL);
642    if (!scull_devices) {
643        result = -ENOMEM;
644        goto fail;  /* Make this more graceful */
645    }
646    memset(scull_devices, 0, scull_nr_devs * sizeof(struct scull_dev));

scull_nr_devsscull设备分配内存空间,并将分配得到的内存清0scull_nr_devs默认值为4,即默认创建4scull设备(scull0 - scull3),每个scull设备由scull_dev结构体表示,其定义在scull.h文件中:

87struct scull_dev {
88    struct scull_qset *data;     /* Pointer to first quantum set */
89    int quantum;             /* the current quantum size */
90    int qset;                 /* the current array size */
91    unsigned long size;        /* amount of data stored here */
92    unsigned int access_key;   /* used by sculluid and scullpriv */
93    struct semaphore sem;    /* mutual exclusion semaphore */
94    struct cdev cdev;         /* Char device structure */
95};

scull_dev结构体的每个成员,我们用到时再解释其含义。继续看scull_init_module函数。下面看649行:

649    for (i = 0; i < scull_nr_devs; i++) {
650        scull_devices[i].quantum = scull_quantum;
651        scull_devices[i].qset = scull_qset;
652        init_MUTEX(&scull_devices[i].sem);
653        scull_setup_cdev(&scull_devices[i], i);
654    }

因为我们分配了scull_nr_devsscull_dev结构体,即创建了scull_nr_devsscull设备,所以这里用for循环对前面创建scull设备进行初始化,共循环scull_nr_devs次,每次循环完成对一个scull设备的初始化。

scull_devices[i].quantum代表scull设备当前“量子”大小,这里赋值为scull_quantum,其默认值为4000scull_devices[i].qset代表当前数组大小,这里赋值为scull_qset,其默认值为1000。调用init_MUTEX对每个scull设备的sem成员进行初始化,这是一个互斥体,用于保证对scull设备的互斥访问,这是第5章的内容,这里不详细介绍。

在每次循环的最后,调用了scull_setup_cdev函数对相应scull设备进行设置。我们来看这个函数的完成了什么工作:

598/*
599 * Set up the char_dev structure for this device.
600 */
601static void scull_setup_cdev(struct scull_dev *dev, int index)
602{
603    int err, devno = MKDEV(scull_major, scull_minor + index);
604
605    cdev_init(&dev->cdev, &scull_fops);
606    dev->cdev.owner = THIS_MODULE;
607    dev->cdev.ops = &scull_fops;
608    err = cdev_add (&dev->cdev, devno, 1);
609    /* Fail gracefully if need be */
610    if (err)
611        printk(KERN_NOTICE "Error %d adding scull%d", err, index);
612}

scull_setup_cdev函数完成对scull设备的cdev成员变量(struct cdev类型)的初始化和注册。cdev结构体在内核中代表一个字符设备。

603行,调用MKDEV宏得到设备编号,注意,4scull设备的主设备号都是一样的,但次设备号分别是0 - 3

605行,调用cdev_init函数对cdev结构体进行初始化,指定对应的文件操作函数集是scull_fops,这个scull_fops必须是前面已经定义实现好的。这个是我们后面介绍的重点。

606行指定所有者是THIS_MODULE

607行是多余的,因为在605行已经指定了文件操作函数集是scull_fops

608行,调用cdev_add函数将cdev结构体注册到内核,注册成功后,相应的scull设备就“活”了,其它程序就可以访问scull设备的资源。所以在注册之前,必须确保所有必要的初始化工作都完成了。

经过前面的步骤,scull设备初始化工作就完成了,并将相应的cdev结构体注册给内核。下面我们再次回到scull_init_module函数,现在代码执行到657行:

657    dev = MKDEV(scull_major, scull_minor + scull_nr_devs);
658    dev += scull_p_init(dev);
659    dev += scull_access_init(dev);
660
661#ifdef SCULL_DEBUG /* only when debugging */
662    scull_create_proc();
663#endif
664
665    return 0; /* succeed */
666
667  fail:
668    scull_cleanup_module();
669    return result;

657 - 664行是第4 - 6章相关的代码,这里不做讨论。所以,如果成功,scull_init_module函数就在665行返回0.

667 - 669行,如果前面的执行出现问题,清理已经分配的资源并返回错误信息。

现在scull设备的模块初始化函数就全部结束了。scull驱动程序已经被注册在内核中,该驱动程序不会主动做任何事情,而是等待响应用户程序的访问。我们应该知道,在用户空间,在用户程序看来,设备和其它普通文件一样,都是文件,而操作这些文件的接口就是文件操作函数集,比如openreadwrite等等。

如果用户空间程序通过openreadwrite等函数操作设备文件,驱动程序应该做什么样的响应呢?我们在注册scull设备的cdev时,指定了设备文件操作函数集

605    cdev_init(&dev->cdev, &scull_fops);

scull_fops就指定了如果用户空间程序执行openreadwrite操作,应该调用什么函数进行响应。scull_fops定义如下:

551struct file_operations scull_fops = {
552    .owner =    THIS_MODULE,
553    .llseek =   scull_llseek,
554    .read =     scull_read,
555    .write =    scull_write,
556    .ioctl =    scull_ioctl,
557    .open =     scull_open,
558    .release =  scull_release,
559};

通过scull_fops,内核就知道了,如果用户空间程序调用 open操作打开scull相应设备,内核就会执行scull驱动程序的scull_open函数进行响应。其它函数依次类推。如果驱动程序没有定义对应某个用户空间操作的函数,内核就会执行默认动作响应。

scull_fops结构体中,与第3章相关的是scull_openscull_readscull_writescull_release的实现。下面我们依次来看这几个函数如何响应用户空间的对应操作。

在继续分析之前,我们先来看scull设备是怎么利用内存的,如下图所示

LDD3源码分析之字符设备驱动程序_第1张图片

每个scull设备是一个指针链表,其中每个指针都指向一个scull_qset结构,scull_qset结构在scull.h中定义如下:

82struct scull_qset {
83    void **data;
84    struct scull_qset *next;
85};

每个scull_qset通过一个中间指针数组最多可引用4000000个字节。因为scull.c中,默认情况下,每个指针数组有SCULL_QSET(1000)个指针,每个指针指向一个SCULL_QUANTUM(4000)字节大小的内存区域。每个内存区域称为一个量子(大小为4000字节),而这个指针数组,称为量子集。

下面我们先来看scull_open函数:

238int scull_open(struct inode *inode, struct file *filp)
239{
240    struct scull_dev *dev; /* device information */
241
242    dev = container_of(inode->i_cdev, struct scull_dev, cdev);
243    filp->private_data = dev; /* for other methods */
244
245    /* now trim to 0 the length of the device if open was write-only */
246    if ( (filp->f_flags & O_ACCMODE) == O_WRONLY) {
247        if (down_interruptible(&dev->sem))
248            return -ERESTARTSYS;
249        scull_trim(dev); /* ignore errors */
250        up(&dev->sem);
251    }
252    return 0;          /* success */
253}

242行,调用container_of宏,通过cdev成员得到包含该cdevscull_dev结构。

243行,将得到的scull_dev结构保存在filp->private_data中,因为open结束后,后面的readwrite等操作使用同一个filp变量,它们即可以从filp->private_data中直接取出scull_dev结构体来使用。

246 - 251行,如果scull设备文件是以只写的方式打开,则要调用scull_trimscull设备清空。247250行是进行加锁解锁操作,进行互斥。这里不讨论。

下面看scull_trim函数是怎样清空scull设备的:

 59/*
 60 * Empty out the scull device; must be called with the device
 61 * semaphore held.
 62 */
 63int scull_trim(struct scull_dev *dev)
 64{
 65    struct scull_qset *next, *dptr;
 66    int qset = dev->qset;   /* "dev" is not-null */
 67    int i;
 68
 69    for (dptr = dev->data; dptr; dptr = next) { /* all the list items */
 70        if (dptr->data) {
 71            for (i = 0; i < qset; i++)
 72                kfree(dptr->data[i]);
 73            kfree(dptr->data);
 74            dptr->data = NULL;
 75        }
 76        next = dptr->next;
 77        kfree(dptr);
 78    }
 79    dev->size = 0;
 80    dev->quantum = scull_quantum;
 81    dev->qset = scull_qset;
 82    dev->data = NULL;
 83    return 0;
 84}

66行,qset = dev->qset;  dev->qset的值为1000,即量子集的大小。

69行,dptr = dev->data;  dev->data指向第一个量子集scull_qset。所以这个for循环每次循环处理一个scull_qset

71行,这个for循环循环1000次,因为每个量子集有1000个量子。

72行,每次kfree释放一个量子的内存空间。

73行,释放量子集数组占用的内存空间。

74行,将指针重新初始化为NULL。防止野指针。

76行,next指向下一个量子集。

77行,释放scull_qset占用的内存空间。

79 - 82行,恢复初始状态。

下面我们看scull_release函数的实现:

255int scull_release(struct inode *inode, struct file *filp)
256{
257    return 0;
258}

这个函数直接返回0。因为scull设备是内存设备,关闭设备时也没有什么需要特别清理的。所以这个函数比较简单。

下面我们看scull_read函数的实现:

292ssize_t scull_read(struct file *filp, char __user *buf, size_t count,
293                loff_t *f_pos)
294{
295    struct scull_dev *dev = filp->private_data;
296    struct scull_qset *dptr;    /* the first listitem */
297    int quantum = dev->quantum, qset = dev->qset;
298    int itemsize = quantum * qset; /* how many bytes in the listitem */
299    int item, s_pos, q_pos, rest;
300    ssize_t retval = 0;
301
302    if (down_interruptible(&dev->sem))
303        return -ERESTARTSYS;
304    if (*f_pos >= dev->size)
305        goto out;
306    if (*f_pos + count > dev->size)
307        count = dev->size - *f_pos;
308
309    /* find listitem, qset index, and offset in the quantum */
310    item = (long)*f_pos / itemsize;
311    rest = (long)*f_pos % itemsize;
312    s_pos = rest / quantum; q_pos = rest % quantum;
313
314    /* follow the list up to the right position (defined elsewhere) */
315    dptr = scull_follow(dev, item);
316
317    if (dptr == NULL || !dptr->data || ! dptr->data[s_pos])
318        goto out; /* don't fill holes */
319
320    /* read only up to the end of this quantum */
321    if (count > quantum - q_pos)
322        count = quantum - q_pos;
323
324    if (copy_to_user(buf, dptr->data[s_pos] + q_pos, count)) {
325        retval = -EFAULT;
326        goto out;
327    }
328    *f_pos += count;
329    retval = count;
330
331  out:
332    up(&dev->sem);
333    return retval;
334}

295 - 300行,进行必要的初始化。

302行,获得互斥锁。

310行,item = (long)*f_pos / itemsize; item代表要读的数据起始点在哪个scull_qset中。

311行,rest = (long)*f_pos % itemsize; rest是一个中间值。在312行使用。

312行,s_pos = rest / quantum; q_pos = rest % quantum; s_pos代表要读的数据起始点在哪个量子中。q_pos代表要读的数据的起始点在量子的具体哪个位置。

315行,dptr = scull_follow(dev, item);调用scull_follow函数,这个函数的第二个参数代表要读的数据在哪个scull_qset中,该函数的作用是返回item指定的scull_qset。如果scull_qset不存在,还要分配内存空间,创建指定的scull_qset。下面看scull_follow函数的实现:

262struct scull_qset *scull_follow(struct scull_dev *dev, int n)
263{
264    struct scull_qset *qs = dev->data;
265
266        /* Allocate first qset explicitly if need be */
267    if (! qs) {
268        qs = dev->data = kmalloc(sizeof(struct scull_qset), GFP_KERNEL);
269        if (qs == NULL)
270            return NULL;  /* Never mind */
271        memset(qs, 0, sizeof(struct scull_qset));
272    }
273
274    /* Then follow the list */
275    while (n--) {
276        if (!qs->next) {
277            qs->next = kmalloc(sizeof(struct scull_qset), GFP_KERNEL);
278            if (qs->next == NULL)
279                return NULL;  /* Never mind */
280            memset(qs->next, 0, sizeof(struct scull_qset));
281        }
282        qs = qs->next;
283        continue;
284    }
285    return qs;
286}

scull_follow函数的作用是返回第二个参数指定的scull_qset。如果该scull_qset不存在,分配内存空间创建该scull_qset

我们再返回到scull_read函数中,代码现在运行到了317行:

317    if (dptr == NULL || !dptr->data || ! dptr->data[s_pos])
318        goto out; /* don't fill holes */

如果指定的scull_qset不存在,或者量子指针数组不存在,或者量子不存在,都退出。

321 - 322行,设置scull_read一次最多只能读一个量子。

320    /* read only up to the end of this quantum */
321    if (count > quantum - q_pos)
322        count = quantum - q_pos;

324行,调用copy_to_user(buf, dptr->data[s_pos] + q_pos, count)函数,将数据拷贝到用户空间。

328行,*f_pos += count;读取完成后,新的文件指针位置向前移动count个字节。

329 行,retval = count;返回读取到的字节数,即count

最后,我们来分析scull_write函数:

336ssize_t scull_write(struct file *filp, const char __user *buf, size_t count,
337                loff_t *f_pos)
338{
339    struct scull_dev *dev = filp->private_data;
340    struct scull_qset *dptr;
341    int quantum = dev->quantum, qset = dev->qset;
342    int itemsize = quantum * qset;
343    int item, s_pos, q_pos, rest;
344    ssize_t retval = -ENOMEM; /* value used in "goto out" statements */
345
346    if (down_interruptible(&dev->sem))
347        return -ERESTARTSYS;
348
349    /* find listitem, qset index and offset in the quantum */
350    item = (long)*f_pos / itemsize;
351    rest = (long)*f_pos % itemsize;
352    s_pos = rest / quantum; q_pos = rest % quantum;
353
354    /* follow the list up to the right position */
355    dptr = scull_follow(dev, item);
356    if (dptr == NULL)
357        goto out;
358    if (!dptr->data) {
359        dptr->data = kmalloc(qset * sizeof(char *), GFP_KERNEL);
360        if (!dptr->data)
361            goto out;
362        memset(dptr->data, 0, qset * sizeof(char *));
363    }
364    if (!dptr->data[s_pos]) {
365        dptr->data[s_pos] = kmalloc(quantum, GFP_KERNEL);
366        if (!dptr->data[s_pos])
367            goto out;
368    }
369    /* write only up to the end of this quantum */
370    if (count > quantum - q_pos)
371        count = quantum - q_pos;
372
373    if (copy_from_user(dptr->data[s_pos]+q_pos, buf, count)) {
374        retval = -EFAULT;
375        goto out;
376    }
377    *f_pos += count;
378    retval = count;
379
380        /* update the size */
381    if (dev->size < *f_pos)
382        dev->size = *f_pos;
383
384  out:
385    up(&dev->sem);
386    return retval;
387}

339 - 344行,完成必要的初始化工作。

346行,取得互斥锁。

350行,item = (long)*f_pos / itemsize; item代表要写入的位置在哪个scull_qset中。

351行,rest = (long)*f_pos % itemsize; rest中一个中间值,在352行用到它。

352行,s_pos = rest / quantum; q_pos = rest % quantum; s_pos代表要写入的位置在哪个量子中,q_pos代表要写入的位置在量子的具体位置。

355行,dptr = scull_follow(dev, item);调用scull_follow函数,返回item指定的scull_qsetscull_follow函数在前面分析scull_read函数时已经分析过了。

358 - 363行,如果指定的量子指针数组不存在,则分配内存空间,创建量子指针数组。

364 - 368行,如果指定量子不存在,则分配内存空间,创建量子。

370 - 371行,限定一次最多只能写满一个量子。

373行,调用copy_from_user,将用户数据写到量子中。

377行,将文件指针后移count字节。

378行,设置返回值为count,即写入字节数。

382行,更新文件大小。

至此,LDD3第三章相关的源码我们就都分析完了。

在我的系统上(2.6.32-38-generic-pae),编译scull代码时,遇到如下图所示错误:

LDD3源码分析之字符设备驱动程序_第2张图片

解决办法是将Makefile的第12,13,38行的CFLAGS替换为EXTRA_CFLAGS即可。但是再执行make,又出现另一个错误如下图所示:

LDD3源码分析之字符设备驱动程序_第3张图片

只要把main.c17行的#include <linux/config.h>屏蔽掉即可解决这个问题。但是再执行make,又出现如下图所示问题:

LDD3源码分析之字符设备驱动程序_第4张图片

pipe.c文件中加入如下语句:#include <linux/sched.h>即可解决,再次make,又出现如下图所示错误:

LDD3源码分析之字符设备驱动程序_第5张图片

access.c文件中加入如下语句:#include <linux/sched.h>,再次make,又出现如下图所示错误:

LDD3源码分析之字符设备驱动程序_第6张图片

task_struct结构体在iclude/linux/sched.h中定义,这个错误因为task_struct结构体有改动,将uideuid等变量挪到了cred中,cred结构体定义在include/linux/cred.h中,这个头文件已经在include/linux/sched.h中包含。所以,需要将报错的代码做如下修改:

current->uid改为current->cred->uid

current->euid改为current->cred->euid

再次make,编译通过,如下图所示:

LDD3源码分析之字符设备驱动程序_第7张图片

安装/卸载scull模块使用LDD3源码中自带的scull_loadscull_unload脚本。如下图所示:(注意,在我的系统上,我修改了scull_load文件的第5行,将mode设置为”666”,否则当往/dev/scull0写入数据时会提示没有操作权限。)

LDD3源码分析之字符设备驱动程序_第8张图片

测试scull测试如下图所示:

LDD3源码分析之字符设备驱动程序_第9张图片

你可能感兴趣的:(struct,Module,REST,Semaphore,null,debugging)