这相当于计算((x<<2) + x) >> 3,根据题目要求,无需考虑5 * x时产生溢出,但要考虑 x 为负数时的舍入。
假设 x 的位模式为[b(w-1), b(w-2), ... , b(0)],那么我们需要计算:
[b(w-1),b(w-2),b(w-3), ... ,b(0), 0, 0]+ [b(w-1),b(w-2),...,b(2), b(1), b(0)],相加后的结果整体右移3位。
右移三位时,b(1)+0和b(0)+0对结果无影响,b(0)+b(2)如果产生进位,则结果再加一。
int mul5div8(int x)
{
int b0 = x&1, b2 = (x>>2)&1;
int ans = ((x<<2) + x) >> 3;
ans += (b0&b2);
return ans;
}
溢出:
考虑下面的汇编代码:
movl 8(%ebp),%esi
movl 12(%ebp),%ebx
movl $1431655765,%edi
movl $-2147483648,%edx
.L2:
movl %edx,%eax
andl %esi,%eax
xorl %eax,%edi
movl %ebx,%ecx
shrl %cl,%edx
testl %edx,%edx
jne .L2
movl %edi,%eax
以上代码是以下整体形式的C代码编译产生的:
int loop(int x,int n)
{
int result = ;
int mask;
for(mask= ;mask ;mask=)
{
result^ = ;
}
return result;
}
这个函数的结果是在寄存器%eax中返回的。检查循环之前、之中、之后的汇编代码,形成一个寄存器和程序变量之间一致的映射。
A.哪个寄存器保存着程序值x、n、result和mask?
B.result和mask的初始值是什么?
C.mask的测试条件是什么?
D.mask是如何被修改的?
E.result是如何被修改的?
F.填写这段代码中所有缺失部分
x at %ebp+8,n at %ebp+12,返回值为result,且存在%eax中,由此得出
寄存器 变量
%esi x
%ebx n
%edi result
%edx mask
以及result和mask的初始值result = 1431655765,mask = -2147483648;
检查循环之中的代码可得出,每次循环的运算结果为result^ = mask & x;
由跳转语句jne .L2得知循环的判断条件为是否等于0,结合测试 条件testl %edx,%edx,edx中存放的变量为mask,所以循环条件为mask!= 0
movl %ebx,%ecx将n放入%ecx寄存器中,而shrl %cl,%edx语句取%ecx的低八位。说明n是一个不大的数字,每次循环之后将mask左移n位。
int loop(int x,int n)
{
int result = 1431655765;
int mask;
for(mask = -2147483648;mask!= 0 ;mask = mask>>n)
{
result^ = mask & x;
}
return result;
}
IA32pushl指令被描述成要减少栈指针,然后将寄存器存储在栈指针的位置。因此,如果我们有一条指令形如对于某个寄存器REG,pushl REG,它等价于下面的代码序列:
subl $4,%esp
movl REG,(%esp)
A.这段代码序列正确的描述了指令pushl %esp的行为吗?请解释。
B.你该如何改写这段代码序列,使得它能够像对REG是其他寄存器时一样,正确地描述REG是%esp的情况?
A.%esp和其余寄存器的不同之处就在于,%esp是栈指针,始终指向栈顶,pushl %esp 是将 esp 当前的内容入栈。
B.如果想要描述%esp的情况, REG 是 esp,那么代码是先减去了 esp,然后将减了 4 以后的 REG 移入了 esp。
A.没有正确执行 pushl %esp,pushl %esp 是将 esp 当前的内容入栈。
B.修改:
movl REG, %eax
subl $4, %esp
movl %eax, (%esp)
考虑下面的矩阵转置函数:
typedef int array[4][4];
void transpose2(array dst,array src)
{
int i,j;
for(i=0;i<4;i++)
{
for(j=0;j<4;j++)
{
dst[i][j]=src[j][i];
}
}
}
假设这段代码运行在一台具有如下属性的机器上:
对于每个row和col,指明对src[row][col]和dst[row][col]的访问是命中(h)还是不命中(m)。
对于写分配的高速缓存,每次写不命中时,需要读取数据到高速缓存中。
该高速缓存只有 2 个组,src[0] src[2] 对应组 0,src[1] src[3] 对应组 1。
同理,dst[0] dst[2] 对应组 0,dst[1] dst[3] 对应组 1。
对于一个总大小为128数据字节的高速缓存,重复习题6.35。
缓存能完全容得下两个数组,所以只会出现冷不命中。