ARM V8A体系结构-第二章 体系结构和处理器

ARM发展历程

ARM适于1985年,且一直处理更新换代之中,历程如下:
ARMv4及更早的版本:
仅使用ARM32位指令集
ARMv4T:
将新增16位的thumb指令集到32位指令集中,这是收到广泛任何的一个架构
ARMv5TE:
改善DSP类型的运算
ARMv6:
优化架构,新增非对齐内存的访问、内存结构优化、新增多处理器支持。此外,新增32位寄存器对于SIMD(Single Instruction Multiple Data,单指令多数据流,能够复制多个操作数,并把它们打包在大型寄存器的一组指令集)操作中字节和半字类型的操作。
新增thumb2和Security Extensions (TrustZone),thumb2拓展了thumb指令,混合了16位和32位指令集。
ARMv7-A:
ARMv7-A体系结构使Thumb-2扩展成为必需的,并添加了高级SIMD扩展(NEON)
在ARM11之后的处理器家族,改采Cortex命名,并针对高、中、低阶分别划分为A、R、M三大处理器。
ARMv7-A提供了支持Linux等平台操作系统所需的所有功能,多用来做应用型处理器
ARMv7-R提供可预测的实时高性能,专为高性能、可靠性和容错能力而设计的,其行为具有高确定性,同时保持很高的能效和成本效益
ARMv7-M的目标是深度嵌入式微控制器,专用于需要较高性能、或是实时处理的系统

1、ARMv8-A

采用64位指令集,拥有32bit模式和64bit模式,同时保持向后兼容,可兼容ARMv7。
ARM V8A体系结构-第二章 体系结构和处理器_第1张图片
ARMv8体系做了许多改变,处理器的性能有了较大提升
物理地址范围加大:这使处理器能够访问超过4GB的物理内存
64位的虚拟地址空间:这将使虚拟内存超过4GB限制,在桌面应用和服务器中是重要的提升。
信号事件自动化:这就实现了节能、高性能的自旋锁
寄存器增多:31个64位的通用寄存器,减少了栈的使用(函数传参可使用8个寄存器)
基于PC指针的相对寻址范围加大:一个+/-4GB的寻址范围,用于在共享库中高效地进行数据寻址,并定位独立的可执行文件
新增16KB和64KB的转换粒度:减少了查找转换表(TLB)时的丢失率和深度
全新异常模式:这降低了操作系统和虚拟机监控程序软件的复杂性
高效的缓存管理:用户空间缓存操作提高了动态代码生成效率。提供快速清除data cache的指令
高速硬件加密:比软件加密性能高3~10倍。对于小粒度的加解密很高效,例如https
加载和发布:为C++11、C11、Java内存模型设计。使用消除显式内存屏障指令保证线程安全
NEON双精度浮点高级SIMD:这使得SIMD矢量化能够应用于更广泛的算法集,例如,科学计算、高性能计算(HPC)和超级计算机

2、ARMv8-A 处理器属性

下表提供了给予ARMv8-A处理器的属性参数
ARM V8A体系结构-第二章 体系结构和处理器_第2张图片

2.1 ARMv8 processors

2.1.1 The Cortex-A53 processor

Cortex-A53处理器是一种中端低功耗处理器,一片可集成1~4个内核,每个内核都拥有一个1级缓存子系统、一个可选配的GICV3/V3接口和一个可选配的二级缓存控制器。
Cortex-A53处理器是一款极为节能的处理器,能够支持32位和64位编码。它相对于cortex-A7来说性能有显著提高,它能够部署为独立的应用程序处理器,或与Cortex-A57处理器以大小核的方式的配置搭配,以实现最佳性能、可扩展性和能耗
ARM V8A体系结构-第二章 体系结构和处理器_第3张图片
Cortex-A53具有以下特性:

  • 支持8级流程线
  • 采用门时钟、能量域和高级的保持模式来达到较低的功耗
  • Increased dual-issue capability from duplication of execution resources and dual instruction decoders
  • 二级缓存的最有电源设计方案降低了系统延迟并均衡了对性能的影响
2.1.2 The Cortex-A57 processor

Cortex-A57处理器面向移动和企业计算应用,包括计算密集型64位应用,如高端计算机、平板电脑和服务器产品,它可以与Cortex-A53处理器一起使用,通过配置以大小核的形式以达到可扩展的性能和更高效能耗。
Cortex-A57处理器具有与其他处理器的高速缓存操作的一致性,包括ARM旗下的GPU产品。
它提供了比ARMv7 Cortex-A15更高的性能,具有更高的电源效率。新增的加密模块使加密算法的性能比上一代processo提高了10倍
ARM V8A体系结构-第二章 体系结构和处理器_第4张图片
Cortex-A57处理器完全实现了ARMv8-A体系结构,它支持多核操作,在单个集群内进行一到四个核的多处理,通过AMBA 5 CHI或AMBA 4 ACE技术,可以实现多个一致的SMP集群。可通过CoreSight技术进行调试和跟踪

Cortex-A57具有以下特性:

  • 无序的15+级流水线
  • 节能功能包括分支预测、减少标记和抑制缓存查找
  • 通过复制执行资源提高了峰值指令吞吐量,采用本地解码和3-wide带宽解码方式保证解码的能耗最优性
  • 高性能的二级缓存设置,让多个内核可同时访问二级缓存区域

你可能感兴趣的:(arm,arm开发,嵌入式硬件)