最近在分析u-boot的源代码,看到这一行:
.balignl 16,0xdeadbeef
不理解了,不知道为什么要这样写,0xdeadbeef,明显是个单词组,写在这里有何意义呢?然后在查阅了众多资料的时候才晃然大悟。
下面我一步步来说明:
首先要弄明白.balignl的意思,这个其实应该算是一个伪操作符,伪操作符的意思就是机器码里,并没有一个汇编指令与其对应,是编译器来实现其功能的。.balignl是.balign的变体,.balign是意思是,在以当前地址开始,地址计数器必须是以第一个参数为整数倍的地址为尾,在前面记录一个字节长度的信息,信息内容为第二个参数。
.balign 8, 0xde
它的意思就是在以当前地址开始,在地址为8的倍数的位置的前面填入一个字节内容为0xde的内容。如果当前地址正好是8的倍数,则没有东西被写入到内存。
那么以此类推,.balignw则表示第二个参数存入的内容长度为一个字长,即16位,所以一般有这样的形式出现:
.balignw 4,0x368d
因为现在填入的内容为16位了,那就存在以下几种情况
1.当前地址没有偏移就满足了以4为倍数的地址
2.当前地址偏移了1个字节就满足了要求
3.当前地址偏移了2个字节就满足了要求
4.当然地址编移了3个字节就满足了要求
当没有偏移的时候,地址中间肯定没有办法填上信息;
当偏移1个字节的时候,地址中间空隙不够,所以填入的数值,是末定义,也就是说,填入的什么值,不清楚;
当偏移为2个字节的时候,地址中间的空隙正好填入手面的数据,所以就填上了;
当偏移为3个字节的时候,地址中间的空隙大于所要填的内容。手册上给的定义是末定义,在我的理解,其实这个未定义,是指这三个偏移的地址整体的内容是末知的。但是其中必定含有要填的2个字节,只是另一个被填充的字节内容不知道而已
所以以此类推,
.balignl,这个指令用来填与一个长字,即内容长度为长字,即4个字节的长度
如果仔细分析一下填入的情况就知道,如果想要0xdeadbeef一定填到当前地址后面某个部分,就一定得是偏移量为16字节才行,这样才能保证在任何情况下,偏移的地址所留的空隙都能填入所要填的内容。
那0xdeadbeef是什么意思呢?经过我查找才发现,类似这样的值很多,像0xabababab,它的作用大概就是为内存做标记,有点儿像个小旗子,插在那里,表示从这个位置往后,就是干什么的内存,这个位置往前,禁止访问。
以上仅仅是我个人的理解,有可能由于记忆的关系有所不一致,请有更了解这块的大侠给予指正
重要更正:
关于.balignl 16,0xdeadbeef这句中的偏移量,我的理解有误,现在特此更正,希望引用了我这篇博客的同学能修正由我带来的错误认识。那些直接拷贝、粘贴而不注明出处的朋友就惨了,他们对这个知识点的理解将永远是错的。
为了跟以前的有个比较,我把更正内容直接写在下面,使用蓝色的字区别开来,而不修改以前错误的说明,这样给那些引用过本博文的朋友以参考。
其实关于.balignl 16,0xdeadbeef这句,功能说明没有错,就是想在某个位置插入0xdeadbeef这个特殊的内存值。错就错在我对这个16的理解上面。16是16个字节,这是没有错的,但是这个16的由来,并不是我所理解的得至少为16个字节,才能在任何情况下保证插入这个特殊的内存值。我在此篇博客的留言中,回答某位网友的提问,举了个pc为0x00000007地址,偏移量某为8字节时,这个时候就不够4字节的内容了,以此推导出的,至少有16个字节才能保证这个特殊的内存值的插入也是完全错误的。
举个反例,如果按给那位网友的解释,那就算有16个字节的偏移量,那如果pc地址为0x0000000F时,也只有一个字符的空间,那这个deadbeef的值还是不够。以此类推,就算这个值为任意一值,按我之前解释的错误逻辑,也都是有不满足的情况的,呵呵。所以我之前的推论有误,特此更正。我现在把16这个值的由来进行说明。
ARM920T处理器核心,支持32位与16位两种指令长度,16位的指令叫thumb指令集,由于我使用的是32位指令集,所以一切都是以32位指令集进行说明。
既然是32位指令集,所以一条指令就占32位,即4字节,所以在调试器中,地址的显示也是4字节一跳的(调试器的截图在这篇博文的评论中有链接),所以pc的值,也是4字节一跳的,并不存在可能pc的值为0x00000007的情况,呵呵。
这个地方填16个偏移量,是因为
.globl _start //不占内存
_start: b start_code //占4字节内存
ldr pc, _undefined_instruction //占4字节内存
ldr pc, _software_interrupt //占4字节内存
ldr pc, _prefetch_abort //占4字节内存
ldr pc, _data_abort //占4字节内存
ldr pc, _not_used //占4字节内存
ldr pc, _irq //占4字节内存
ldr pc, _fiq //占4字节内存
占了4x8=32字节内存。
_undefined_instruction: .word undefined_instruction //占4字节内存
_software_interrupt: .word software_interrupt //占4字节内存
_prefetch_abort: .word prefetch_abort //占4字节内存
_data_abort: .word data_abort //占4字节内存
_not_used: .word not_used //占4字节内存
_irq: .word irq //占4字节内存
_fiq: .word fiq //占4字节内存
占了4x7=32字节内存。
所以在这个.balignl 16,0xdeadbeef指令之前,一共占了4x15=60个字节的内存,所以本代码的作者当时就简单的在15这个数上,加了个1,即16,把当前指针往后移到地址为64的位置,然后在前面插上了0xdeadbeef这个特殊的值。
我不知道这个地方是作者一个错误,歪打正着呢,还是怎么回子事,其实这个偏移的值还有好多种情况。如果说最小的值的话,那么也可以写成.balignl 8,0xdeadbeef,也可以达到同样的目的。因为60不是8的倍数,但是64是8的倍数,如果写8,也正好插到64前面,也即60这个内存起始地址。如果更大一点儿的呢,那么填32也可以达到同样的效果,即.balignl 32,0xdeadbeef,道理同上。当然,不能为4,因为pc值在任何时候,都是4的倍数,只要不为0就为4的倍数,呵呵,这个值不行,如果用了这个值,0xdeadbeef永远也插不进去,呵呵。