本章主要是是一些描述性的内容,我们先来看下4个术语。
ARM64中参数1~参数8 分别保存到 X0~X7 寄存器中 ,剩下的参数从右往左一次入栈,被调用者实现栈平衡,返回值存放在 X0 中。调用者保存的
寄存器x8–x18是每个函数的临时寄存器。 因此,无法在返回函数时对其值进行任何假设。 实际上,这些寄存器也是调用者保存的。
寄存器x19–x28是寄存器,如果由函数使用,则必须保留其值,然后在返回函数时将其恢复。 此寄存器称为被调用者保存的。
AArch64体系结构的过程调用标准:
在开始处理参数之前,此阶段仅执行一次。
下一个通用寄存器号(NGRN)设置为零。
下一个SIMD和浮点寄存器号(NSRN)设置为零。
下一个堆栈参数地址(NSAA)设置为当前堆栈指针值(SP)。
对于列表中的每个参数,将应用以下列表中的第一个匹配规则。如果没有规则匹配,则不修改参数。
如果参数类型是一个复合类型,其大小不能同时由调用方和被调用方静态确定,则将参数复制到内存中,并将该参数替换为指向副本的指针。 (在C / C ++中没有这样的类型,但是它们以其他语言或语言扩展存在)。
如果参数类型是HFA或HVA,则该参数将未经修改地使用。
如果参数类型是大于16个字节的Composite Type,则将参数复制到调用方分配的内存中,并将该参数替换为指向副本的指针。
如果参数类型为“复合类型”,则参数的大小将四舍五入为最接近的8字节倍数。
对于列表中的每个参数,依次应用以下规则,直到分配了参数为止。将自变量分配给寄存器时,寄存器中任何未使用的位都具有未指定的值。如果将参数分配给堆栈插槽,则任何未使用的填充字节均具有未指定的值。
如果自变量是半精度,单精度,双精度或四精度浮点或短向量类型,并且NSRN小于8,则将自变量分配给寄存器v [NSRN]的最低有效位。 NSRN增加1。现在已分配了参数。
如果自变量是HFA或HVA,并且有足够的未分配SIMD和浮点寄存器(NSRN +成员数≤8),则将自变量分配给SIMD和浮点寄存器,每个成员一个寄存器HFA或HVA。 NSRN增加所用寄存器的数量。现在已分配了参数。
如果参数是HFA或HVA,则将NSRN设置为8,并且将参数的大小四舍五入到8个字节的最接近倍数。
如果自变量是HFA,HVA,四精度浮点或短向量类型,则将NSAA向上舍入为8或自变量类型的自然对齐中的较大者。
如果参数是半精度或单精度浮点类型,则参数的大小设置为8个字节。效果就好像该参数已被复制到64位寄存器的最低有效位,而其余位则填充了未指定的值。
如果参数是HFA,HVA,半精度,单精度,双精度或四精度浮点或短向量类型,则将参数复制到调整后的NSAA处的内存中。 NSAA增加自变量的大小。现在已分配了参数。
如果参数是整数或指针类型,则参数的大小小于或等于8个字节,并且NGRN小于8,则将参数复制到x [NGRN]中的最低有效位。 NGRN加1。现在已分配了参数。
如果参数的对齐方式为16,则NGRN会四舍五入到下一个偶数。
如果参数是整数类型,则参数的大小等于16,并且NGRN小于7,则将参数复制到x [NGRN]和x [NGRN + 1]。 x [NGRN]应包含自变量的内存表示形式的低位寻址双字。 NGRN增加2。现在已分配了参数。
如果参数是Composite Type,并且参数的双字大小不超过8减去NGRN,则将参数复制到连续的通用寄存器中,从x [NGRN]开始。传递自变量,就好像它已从双字对齐的地址加载到寄存器中一样,并带有适当顺序的LDR指令,这些指令会从内存中加载连续的寄存器。该标准未规定寄存器中任何未使用部分的内容。 NGRN增加所用寄存器的数量。现在已分配了参数。
NGRN设置为8。
NSAA向上舍入为8或参数类型的自然对齐中的较大者。
如果参数是复合类型,则将参数复制到调整后的NSAA的内存中。 NSAA增加自变量的大小。现在已分配了参数。
如果参数的大小小于8个字节,则参数的大小将设置为8个字节。效果就好像该参数已复制到64位寄存器的最低有效位,而其余位都填充有未指定的值。
该参数将复制到调整后的NSAA的内存中。 NSAA增加自变量的大小。 现在已分配了参数。
带有可变数量参数的函数的处理方式与上面所述不同,如下所示:
所有复合材料均一视同仁; 没有对HFA或HVA的特殊处理。
不使用SIMD和浮点寄存器。
实际上,将参数分配给虚拟堆栈与遵循规则C.12–C.15相同,其中,堆栈的前64个字节被加载到x0-x7中,而其余的堆栈参数则被正常放置。
整数值以x0返回。
浮点值将根据需要以s0,d0或v0返回。
HFA和HVA值视情况以s0-s3,d0-d3或v0-v3返回。
根据值返回的类型是否具有某些属性,将对其进行不同的处理。具有所有这些属性的类型,
使用以下返回样式:
所有其他类型使用此约定:
调用者应保留足够大小和对齐的内存块以保存结果。存储块的地址应作为附加参数传递给函数x0,如果$this传递x0,则应传递x1。被调用方可以在执行子例程的任何时候修改结果存储块。被调用方以x0返回存储块的地址。
按照ARM提出的ABI,堆栈必须始终保持16字节对齐。 AArch64包含一项硬件功能,只要SP不按16字节对齐并且完成了相对于SP的加载或存储,它就会生成堆栈对齐错误。
分配4k或更多堆栈值的函数必须确保依次触摸最后一页之前的每一页。此操作可确保没有代码可以“越过” Windows用于扩展堆栈的保护页。通常,触摸是由__chkstk帮助程序完成的,该帮助程序具有自定义的调用约定,该约定将x15中的总堆栈分配除以16。
当前堆栈指针正下方的16字节区域保留供分析和动态修补方案使用。该区域允许插入精心生成的代码,该代码在[sp,#-16]中存储两个寄存器,并将它们临时用于任意目的。
b: (branch)跳转到某地址(无返回), 不会改变 lr (x30) 寄存器的值;一般是本方法内的跳转,如 while 循环,if else 等 ,如:
b LBB0_1 ; 直接跳转到标签 ‘LLB0_1’ 处开始执行
复制代码
bl: 跳转到某地址(有返回),先将下一指令地址(即函数返回地址)保存到寄存器 lr (x30)中,再进行跳转 ;一般用于不同方法直接的调用 ,如:
bl 0x100cfa754 ; 先将下一指令地址(‘0x100cfa754’ 函数调用后的返回地址)保存到寄存器 ‘lr’ 中,然后再调用 ‘0x100cfa754’ 函数
复制代码
blr: 跳转到 某寄存器 (的值)指向的地址(有返回),先将下一指令地址(即函数返回地址)保存到寄存器 lr (x30)中,再进行跳转 ;如:
blr x20 ; 先将下一指令地址(‘x20’指向的函数调用后的返回地址)保存到寄存器 ‘lr’ 中,然后再调用 ‘x20’ 指向的函数
复制代码
br: 跳转到某寄存器(的值)指向的地址(无返回), 不会改变 lr (x30) 寄存器的值。
brk: 可以理解为跳转指令特殊的一种。
ret: 子程序(函数调用)返回指令,返回地址已默认保存在寄存器 lr (x30) 中。或者br x30等同ret指令。