中断也属于一种“异常”,导致中断发生的情况有很多,比如:
众多的“中断源”,汇集到“中断控制器”,由“中断控制器”选择优先级最高的中断并通知 CPU,中断控制器也可以屏蔽中断信号。
arm 对异常(中断)处理过程:
u-boot 或是 Linux 内核,都有类似如下的代码:
_start: b reset
ldr pc, _undefined_instruction
ldr pc, _software_interrupt
ldr pc, _prefetch_abort
ldr pc, _data_abort
ldr pc, _not_used
ldr pc, _irq // 发生中断时,CPU 跳到这个地址执行该指令 ** 假设地址为 0x18**
ldr pc, _fiq
这就是异常向量表,每一条指令对应一种异常。
在向量表里,一般都是放置一条跳转指令
,发生该异常时,CPU 就会执行向量表中的跳转指令,去调用更复杂的函数。当然,向量表的位置并不总是从 0 地址开始,很多芯片可以设置某个vector base 寄存器,指定向量表在其他位置,比如设置 vector base 为0x80000000,指定为 DDR 的某个地址。但是表中的各个异常向量的偏移地址,是固定的:复位向量偏移地址是 0,中断是 0x18。
ARM 芯片属于精简指令集计算机(RISC:Reduced Instruction SetComputing),它所用的指令比较简单,有如下特点:
比如对于 a=a+b 这样的算式,需要经过下面 4 个步骤才可以实现,CPU 运行时,先去取得指令,再执行指令:
如果要暂停一个程序,中断一个程序,就需要把这些寄存器的值保存下来:这就称为保存现场。
寄存器保存在内存中,这块内存就称之为栈。程序要继续执行,就先从栈中恢复那些 CPU 内部寄存器的值。如图所示:概括程序 A、B 的切换过程
这个场景并不局限于A、B 的切换过程,也可以中断,函数调用等
① 函数调用:
② 中断处理
CPU 强制跳到中断异常向量地址去执行,
可以保存在进程 A 的内核态栈,也可以保存在进程 A 的内核结构体中
。③ 进程切换
进程的调度也是使用栈来保存、恢复现场;在linux中,线程才是调度的最小单位,这些线程共用打开的文件句柄、全局变量等等。而这些线程,之间是互相独立的,“同时运行”,也就是说:每一个线程,都有自己的栈
,那么在同一个进程里面,所有的线程共享代码段和数据段,同时,他们还有各自的栈内存,保存CPU寄存器里面的值
对于按键中断等硬件产生的中断,称之为“硬件中断”(hard irq)。每个硬件中断都有对应的处理函数
可以认为对硬件中断的处理是用数组来实现的,数组里存放的是函数指针:
当硬件触发中断,系统会根据中断号调用中断处理函数
如何触发软中断?——由软件决定,对于 X 号软件中断,只需要把它的 flag 设置为 1 就表示发生了该中断
软件中断何时处理?——Linux 系统中,各种硬件中断频繁发生,例如定时器中断每 10ms 发生一次,那将软件中断设计在处理完硬件中断后,再去处理软件中断
有哪些软件中断?——查内核源码 include/linux/interrupt.h
enum
{
HI_SOFTIRQ=0,
TIMER_SOFTIRQ,
NET_TX_SOFTIRQ,
NET_RX_SOFTIRQ,
BLOCK_SOFTIRQ,
TASKLET_SOFTIRQ
SCHED_SOFTIRQ,
#ifdef CONFIG_HIGH_RES_TIMERS
HRTIMER_SOFTIRQ,
#endif
};
怎么触发软件中断?——最核心的函数是 raise_softirq,简单地理解就是设置 softirq_veq[nr]的标记位:
extern void raise_softirq(unsigned int nr) //用于引发一个软中断(类似普通中断)
怎么设置软件中断的处理函数:
extern void open_softirq(int nr, void (*action) (struct soft_action*));
Linux系统中,中断不能嵌套,否则会导致栈不够用
中断处理要越快越好,即在注册中断 handler 函数中指定中断处理函数,代码尽可能高效
在 Linux 系统中使用中断是挺简单的,为某个中断 irq 注册中断处理函数handler,可以使用 request_irq
函数:
如果中断要做的事情就是很多,没办法加快,则需要将耗时的事情拆分
当一个中断要耗费很多时间来处理时,它的坏处是:在这段时间内,其他中断无法被处理。换句话说,在这段时间内,系统是关中断的
耗时的中断:中断分为上半部分/下半部分;在 handler 函数里只做紧急的事,然后就重新开中断
,让系统得以正常运行;那些不紧急的事,以后再处理,处理时是开中断的。
中断下半部的实现有很多种方法,主要讲2种:
当下半部比较耗时但是能忍受,并且它的处理比较简单时,可以用tasklet 来处理下半部。tasklet 是使用软件中断
来实现。
使用流程图简化一下:
中断下半部分属于软件中断的一种,在枚举类型里面对应TASKLET_SOFTIRQ
在中断下半部的执行过程中,虽然是开中断的,期间可以处理各类中断。但是毕竟整个中断的处理还没走完,这期间 APP 是无法执行的
。在中断上半部唤醒内核线程。内核线程和APP 都一样竞争执行,APP 有机会执行,系统不会卡顿。
这个内核线程是系统帮我们创建的,一般是 kworker 线程,内核中有很多这样的线程:
kworker 线程要去“工作队列”(work queue)上取出一个一个“工作”(work 结构体),来执行它里面的函数。
使用:
①创建 work:
你得先写出一个函数,然后用这个函数填充一个 work 结构体。比如:
static DECLARE_WORK(aer_recover_work,aer_recover_work_fun);
//第一参数是work结构体
② 要执行这个函数时,把 work 提交给 work queue 就可以了:
schedule_work(&aer_recover_work);
上述函数会把 work 提供给系统默认的 work queue:system_wq,它是一个队列。
在中断上半部调用 schedule_work 函数,触发 work 的处理
③ 谁来执行 work 中的函数?
schedule_work 函数不仅仅是把 work 放入队列,还会把kworker 线程唤醒。此线程抢到时间运行时,它就会从队列中取出 work,执行里面的函数。
④ 谁把 work 提交给 work queue?
在中断场景中,可以在中断上半部调用 schedule_work 函数。
工作队列只是创建一个线程,对于多核CPU来说,可以处理多个线程,所以将中断下部分实现的技术换为threaded irq,这样每个中断下半部分为一个线程,在任意一个CPU中都可以执行
你可以只提供 thread_fn
,系统会为这个函数创建一个内核线程。发生中断时,内核线程就会执行这个函数。
以前用 work 来线程化地处理中断,一个 worker 线程只能由一个 CPU 执行,多个中断的 work 都由同一个 worker线程来处理,在单 CPU 系统中也只能忍着了。但是在 SMP 系统中,明明有那么多 CPU 空着,你偏偏让多个中断挤在这个CPU 上?新技术threaded irq,为每一个中断都创建一个内核线程;多个中断的内核线程可以分配到多个 CPU 上执行,这提高了效率。
本节内容,可以从request_irq
函数(头文件:include/linux/interrupt.h)一路分析得到。
注意:如果内核配置了CONFIG_SPARSE_IRQ,那么它就会用基数树(radixtree)来代替irq_desc数组。SPARSE的意思是“稀疏”,假设大小为1000的数组中只用到2个数组项,那不是浪费嘛?所以在中断比较“稀疏”的情况下可以用基数树来代替数组。
irq_desc结构体在include/linux/irqdesc.h
中定义,主要内容如下图:
每一个irq_desc数组项中都有一个函数:handle_irq
,还有一个action链表
。要理解它们,需要先看中断结构图:硬件中断的信号从左到右,函数的处理从右到左(函数主要是读取寄存器确定中断的来源)。由图可知共享中断会出现两个中断号:A号中断和B号中断
在Linux内核中对于每一个硬件中断,都有一个数组成员项,所以下图有GIC结构体和GPIO结构体,每个结构体都有:handle_irq
,还有一个action链表
。
首先GIC中断CPU时,CPU读取GIC状态得到中断A。
① GIC的处理函数:
再去调用irq_desc[B]. handle_irq。
② 模块的中断处理函数:
③ 外部设备提供的处理函数:
irqaction结构体在include/linux/interrupt.h
中定义,主要内容如下图:
当调用request_irq、request_threaded_irq
注册中断处理函数时,内核就会构造一个irqaction结构体。在里面保存name、dev_id等,最重要的是handler、thread_fn、thread。
可以提供handler而不提供thread_fn,就退化为一般的request_irq函数。
可以不提供handler只提供thread_fn,完全由内核线程来处理中断。
也可以既提供handler也提供thread_fn,这就是中断上半部、下半部。
在调用reqeust_irq
函数时可以传入dev_id
作用有2个:
irq_domain结构体在include/linux/irqdomain.h
中定义,主要内容如下图:
在设备树中有这样的属性:
interrupt-parent = <&gpio1>;
interrupts = <5 IRQ_TYPE_EDGE_RISING>;
它表示要使用gpio1里的第5号中断,hwirq就是5。
但是我们在驱动中会使用request_irq(irq, handler)这样的函数来注册中断,irq是软件中断号
,它应该从“gpio1的第5号中断”转换得来。
谁把hwirq转换为irq?由gpio1的相关数据结构,就是gpio1对应的irq_domain结构体
。即每个一GPIO都有自己的irq_domain结构体
irq_domain结构体中有一个irq_domain_ops结构体,里面有各种操作函数,主要是:
map函数会完成映射关系,会保存在unsigned int linear_revmap[];
数组里面
例如:读取GPIO寄存器得到hwirq,根据hwirq得到之前映射的irq(软件中断号B)
irq_data结构体在include/linux/irq.h
中定义,主要内容如下图:
它就是个中转站,里面有irq_chip指针 irq_domain指针,都是指向别的结构体。
irq是软件中断号,hwirq是硬件中断号。比如上面我们举的例子,在GPIO中断B是软件中断号,可以找到irq_desc[B]这个数组项;GPIO里的第x号中断,这就是hwirq。
谁来建立irq、hwirq之间的联系呢?由irq_domain来建立。irq_domain会把本地的hwirq映射为全局的irq,什么意思?比如GPIO控制器里有第1号中断,UART模块里也有第1号中断,这两个“第1号中断”是不一样的,它们属于不同的“域”──irq_domain。
irq_chip结构体在include/linux/irq.h
中定义,主要内容如下图:
这个结构体跟“chip”即芯片相关,里面各成员的作用在头文件中也列得很清楚,摘录部分如下:
@irq_startup: start up the interrupt (defaults to ->enable if NULL)
@irq_shutdown: shut down the interrupt (defaults to ->disable if NULL)
@irq_enable: enable the interrupt (defaults to chip->unmask if NULL)
@irq_disable: disable the interrupt
@irq_ack: start of a new interrupt
@irq_mask: mask an interrupt source
@irq_mask_ack: ack and mask an interrupt source
@irq_unmask: unmask an interrupt source
@irq_eoi: end of interrupt
我们在request_irq后,并不需要手工去使能中断,原因就是系统调用对应的irq_chip里的函数帮我们使能了中断。
我们提供的中断处理函数中,也不需要执行主芯片相关的清中断操作,也是系统帮我们调用irq_chip中的相关函数。
但是对于外部设备相关的清中断操作,还是需要我们自己做的。
就像上面图里的“外部设备1“、“外部设备n”,外设备千变万化,内核里可没有对应的清除中断操作
可以参考文档:内核的Documentation\devicetree\bindings\interrupt-controller\interrupts.txt
在硬件上,“中断控制器”只有 GIC 这一个,但是我们在软件上也可以把上图中的“GPIO”称为“中断控制器”。很多芯片有多个 GPIO 模块,比如 GPIO1、GPIO2 等等。所以软件上的“中断控制器”就有多个。各个中断控制器之间有父子关系。
假设 GPIO1 有 32 个中断源,但是它把其中的 16 个汇聚起来向 GIC 发出一个中断,把另外 16 个汇聚起来向 GIC 发出另一个中断。这就意味着 GPIO1 会用到 GIC 的两个中断,会涉及 GIC 里的 2 个 hwirq。这些层级关系、中断号(hwirq),都会在设备树中有所体现。
在设备树中,中断控制器节点中必须有一个属性:interrupt-controller
,表明它是“中断控制器”。还必须有一个属性:#interrupt-cells
,表明引用这个中断控制器的话需要多少个 cell。
#interrupt-cells
的值一般有如下取值:
第 2 个 cell 的 的 bits[3:0] 用来表示中断触发类型(trigger type and level flags) :
1 = low-to-high edge triggered ,上升沿触发
2 = high-to-low edge triggered ,下降沿触发
4 = active high level-sensitive ,高电平触发
8 = active low level-sensitive , 低电平触发
如果中断控制器有级联关系,下级的中断控制器还需要表明它的“ interrupt-parent ”
是 谁 , 用 了 interrupt-parent ” 中的哪一个“interrupts”
一个外设,它的中断信号接到哪个“中断控制器”的哪个“中断引脚”,这个中断的触发方式是怎样的?这 3个问题,在设备树里使用中断时,都要有所体现。
例如:
i2c@7000c000 {
gpioext: gpio-adnp@41 {
compatible = "ad,gpio-adnp";
//用哪一个中断控制器里的中断?
interrupt-parent = <&gpio>;
//用哪一个中断?Interrupts 里要用几个 cell,由 interrupt-parent 对应的中断控制器决定
interrupts = <160 1>;
gpio-controller;
#gpio-cells = <1>;
interrupt-controller;
#interrupt-cells = <2>;//指明子节点的指定中断控制器的话需要多少个 cell
};
......
};
新的写法:interrupts-extended,指明了上述的三个问题
一个“interrupts-extended”属性就可以既指定“interrupt-parent”,也指定“interrupts”,比如:
interrupts-extended = <&intc1 5 1>, <&intc2 1 0>;
从设备树文件里面将有关中断的部分内容抽取出来:
对于第一个节点,是GIC控制器,使用到该控制器需要三个cell,因为对于多CPU系统,GIC可以发出两种信号(SPI,PPI)而CPU之间可以通过SGI进行通信,所以GIC控制器的第一个cell必须要指定是哪种信号(SPI或PPI或SGI)
从设备树反推 IMX6ULL 的中断体系,如下,比之前的框图多了一个“GPC INTC”
根据博文:哪些设备树节点会被转换为 platform_device提到,设备树中的节点有些能被转换为内核里的platform_device,有些不能
一个节点能被转换为 platform_device,如果它的设备树里指定了中断属性,那么可以从platform_device 中获得“中断资源”,函数如下,可以使用下列函数获得 IORESOURCE_IRQ 资源,即中断号:
/**
* platform_get_resource - get a resource for a device
* @dev: platform device
* @type: resource type // 取哪类资源?IORESOURCE_MEM 、IORESOURCE_REG
* // IORESOURCE_IRQ 等
* @num: resource index // 这类资源中的哪一个?
*/
struct resource *platform_get_resource(struct platform_device *dev,
unsigned int type,
unsigned int num);
对于 I2C 设备节点,I2C 总线驱动在处理设备树里的 I2C 子节点时,也会处理其中的中断信息。一个 I2C 设备会被转换为一个 i2c_client 结构体,中断号会保存在 i2c_client 的 irq 成员里,代码如下(drivers/i2c/i2c-core.c):
对于 SPI 设备节点,SPI 总线驱动在处理设备树里的 SPI 子节点时,也会处理其中的中断信息。一个 SPI 设备会被转换为一个 spi_device 结构体,中断号会保存在 spi_device 的 irq 成员里,代码如下(drivers/spi/spi.c):
如果你的设备节点既不能转换为 platform_device,它也不是 I2C 设备,不是 SPI 设备,那么在驱动程序中可以自行调用 of_irq_get 函数
去解析设备树,得到中断号。
参考:drivers/input/keyboard/gpio_keys.c;可以使用 gpio_to_irq 或 gpiod_to_irq 获得中断号。
举例,假设在设备树中有如下节点:
gpio-keys {
compatible = "gpio-keys";
pinctrl-names = "default";
user {
label = "User Button";
gpios = <&gpio5 1 GPIO_ACTIVE_HIGH>;
gpio-key,wakeup;
linux,code = <KEY_1>;
};
};
那么可以使用下面的函数获得引脚和 flag:
button->gpio = of_get_gpio_flags(pp, 0, &flags);
bdata->gpiod = gpio_to_desc(button->gpio);
再去使用 gpiod_to_irq 获得中断号:
irq = gpiod_to_irq(bdata->gpiod);