早就想知道浮点数的存储原理; 从 Single 开始理解.
Single(单精度浮点数 - 32 位):
如浮点数: 13.625 (1*10
1 + 3*10
0 + 6*10
-1 + 2*10
-2 + 5*10
-3)
其二进制表示是: 1101.101(1*2
3 + 1*2
2 + 0*2
1 + 1*2
0 + 1*2
-1 + 0*2
-2 + 1*2
-3)
系数(或叫尾数)规范化: 1101.101 = 1.101101 * 2
3
系数规范化以后, 都可成为 1.xxxxx... 的样子, 所以为节省空间, "点" 前面的 1 就无须储存了.
这样可以知道此数的指数(e)是 00000011(十进制的 3)、尾数(f) 是 101101(省去了前面的 1. 回算时必须加上)
符号位(s)只占一个二进制位, 非常简单: 0 是正, 1 是负.
指数(e)在这里还有一个规则: 实际储存 = e+127; 这是为了协调指数的正负.
重新落实最后的结果:
s: 应该是 0, 这里是个正数;
e: 应该是: 10000010, 这对应 10 进制的 130(3+127);
f: 10110100000000000000000, 尾数占 23 位.
结果应该是: 01000001010110100000000000000000
测试下:
{查看二进制的函数}
function ToBin(p: PByteArray; b: Integer): string;
var
i,j: Integer;
begin
Result := StringOfChar('0', b * 8);
for i := 0 to b - 1 do for j := 0 to 7 do
if Odd(p^[b-1-i] shr j) then Result[i*8 + 8 - j] := '1';
end;
{测试一}
procedure TForm1.Button1Click(Sender: TObject);
var
f1,f2: Single;
s1,s2: string;
begin
f1 := 13.625;
f2 := -13.625;
s1 := ToBin(@f1, SizeOf(f1));
s2 := ToBin(@f2, SizeOf(f2));
Memo1.Lines.Add(s1); //01000001010110100000000000000000
Memo1.Lines.Add(s2); //11000001010110100000000000000000
end;
{测试二}
procedure TForm1.Button2Click(Sender: TObject);
var
f1,f2: Single;
begin
asm
mov f1, 01000001010110100000000000000000B
mov f2, 11000001010110100000000000000000B
end;
ShowMessageFmt('%g, %g', [f1,f2]); //13.625, -13.625
end;
其他浮点数的储存规则:
Double 或 Real(双精度浮点数 - 64 位):
Extended(扩展精度浮点数 - 80 位):
Real48(已经淘汰的 48 位浮点数):