var s: AnsiString; begin s := '1234567890'; showmessage(s); end;
变量s的内存结构为
A8 03 01 00 FF FF FF FF 0A 00 00 00 31 32 33 34 35 36 37 38 39 30 00
01~02 字节是代码页,如上面的0x03A8为十进制的936,表示简体中文GBK
03~04 字节表示每个字符所占的字节数(ANSI为1,Unicode为2)
05~08 字节是该字符串的引用计数
09~12 字节是该字符串的字符个数
13~?? 字节就是字符串实际的内容了
?? 最后一个字节是00,字符串的结束符
对于string变量类型s,它实际上是一个指针,指向字符串首个字符的地址,也就是第13个字节
这里需要注意的是,在Delphi 2009以前的版本中是没有描述代码页的4字节的,而是直接从第05字节开始。
上面的字符串引用计数为什么会是0xFFFFFFFF呢?因为该字符串是常量,对于常量字符串,引用计数总是-1
若有N处相同的字符串常量时,就有N份的拷贝,这样就造成了空间上的浪费,Delphi并未作出优化
下面的代码就可以说明问题,两次显示的字符串内存地址不同。
procedure Foo(); var s: AnsiString; begin s := '1234567890'; ShowMessage(IntToHex(Integer(@s[1]), 8)); end; procedure TForm1.Button1Click(Sender: TObject); var s: AnsiString; begin s := '1234567890'; ShowMessage(IntToHex(Integer(@s[1]), 8)); Foo; end;
接着看看下面的代码
var s: AnsiString; begin s := Caption; ShowMessage(IntToHex(Integer(@s[1]), 8)); end;
由于没有使用常量字符串,所以引用计数不再是-1
A8 03 01 00 01 00 00 00 05 00 00 00 46 6F 72 6D 31 00
在知道了string的内存结构后,我们就可以通过代码来观测引用计数的值了
var s, s2: AnsiString; p: ^Integer; begin s := Caption; p := Pointer(@s[1]); Dec(p, 2); ShowMessage(IntToStr(p^)); // 1 s2 := s; // 引用计数+1了 ShowMessage(IntToStr(p^)); // 2 end;