ARM big-LITTLE技术简介

1. 背景

        为满足在移动设备应用领域中的节能需求,ARM于2011年首次提出了big.LITTLE技术。
big.LITTLE技术是一种使用两种不同ARM处理器的处理架构技术,即big处理器和LITTLE处理器,big处理器用于提供高性能,LITTLE处理器用于追求最大能效。big.LITTLE技术特别适用于功耗动态变化的手机、平板等移动设备领域;以手机为例,在游戏、高质量视频等高能耗场景,切换到big处理器进行处理,而对于文字输入、听音乐、待机等低能耗场景,切换到LITTLE处理器进行处理。

2. 原理

        以最早的ARM big.LITTLE处理架构为例,讲述big.LITTLE技术的原理。
        big.LITTLE技术的基本要求是使用的两种处理器采用的指令集相同。最早的ARM big.LITTLE处理架构由Cortex-A15和Cortex-A7处理器组成,两者支持相同的ARMv7-A指令集,相同的指令集保证了程序指令在两种处理器上连续执行。
下图是一个典型的big.LITTLE架构示例,其中big处理器是双核的Cortex-A15 cluster,LITTLE处理器是双核的Cortex-A7 cluster,每个cluster个各包含一个L2 Cache,连接到Cache Coherent Interconnect IP CCI-400进行Cache一致性管理;通过GIC-400中断控制器根据当前任务使用的处理器动态分发中断信号。

ARM big-LITTLE技术简介_第1张图片

        big.LITTLE技术的基本理念是根据瞬时性能需求将任务动态分配给合适的处理器,并关闭空闲处理器的电源开关,以达到最优的能耗比。这里假定如下应用场景,通常情况下,对于大多数任务Cortex-A7 处理器足以应对,此时Cortex-A15处理器的供电处于关断状态;当某个任务对性能的要求超过Cortex-A7 处理器的能力时,Cortex-A15处理器被打开,该任务切换到Cortex-A15处理器进行处理;当任务对性能的要求降低后,Cortex-A15处理器的电源再次被关断,转由Cortex-A7 处理器进行处理,从而降低了整体能耗。

3. 硬件要求

        big.LITTLE技术对硬件的要求包括:

      (1)两种处理器cluster的架构相同,采用相同的指令集,每个cluster内的处理器类型相同,即包括一个big处理器cluster和一个LITTLE处理器cluster;

      (2)包含一个GIC中断控制器,根据当前任务使用的处理器动态分发中断信号;

      (3)具有Cache一致性支持

        下面对Cache一致性支持进行详细介绍。Cache一致性是big.LITTLE技术的关键要素。以如下big.LITTLE架构为例,该CPU子系统主要由Cortex-A7 处理器cluster、Cortex-A15 处理器cluster、GIC-400中断控制器、CCI-400控制器组成。Cortex-A7 处理器cluster和Cortex-A15 处理器cluster利用AMBA AXI Coherency Extensions (ACE) 接口和CCI-400控制器实现了Cache一致性,保证了不同处理器cluster间的无缝数据传输,无需外部DDR存储器的参与。

ARM big-LITTLE技术简介_第2张图片

4. 软件模型

4.1 两种主要模型

        big.LITTLE技术使用的两种软件模型为CPU Migration和Global Task Scheduling。

ARM big-LITTLE技术简介_第3张图片

4.2 CPU Migration

        对于CPU Migration软件模型,每个big处理器均与一个LITTLE处理器配对使用,在任何时刻,配对的big处理器和LITTLE处理器只有一个上电工作,另一个断电,上电工作的处理器根据当前负载情况进行选择。此模型要求每个处理器cluster的CPU核心数量相同。

4.3 Global Task Scheduling

        对于Global Task Scheduling软件模型,任务调度器根据每个任务的性能需求以及big和LITTLE处理器的处理能力,对该任务使用的处理器进行分配,且可以分配到任意一个处理器。此外,在任务分配的响应时间方面,比CPU migration模型更快。

4.4 Global Task Scheduling比CPU Migration的优势

     (1)big和LITTLE处理器的数量可以不同,因此使得芯片架构配置更加灵活;

     (2)可以使用任意数量的处理器。在性能需求峰值情况下能够使用所有处理器,然而对于CPU Migration,在任意时刻只能有一半数量的处理器工作

        综上,高效和灵活的优势使得Global Task Scheduling软件模型成为主流。其中,ARM公司对Global Task Scheduling软件模型的实现被称为big.LITTLE MP

你可能感兴趣的:(arm开发)