char, array of char, PChar都是简单类型,简单类型当然通用性好,这个很容易理解,只要保证内存布局一样就可以了,在这个前提下如果有必要可以采取手段欺骗编译器的强类型检查。Delphi为什么提出string类型?肯定有它的道理。什么道理?用C的同志们都知道处理什么类型都没有处理字串类型费劲,Delphi作为如此优秀的RAD工具自然要想办法解决这个问题。事实上,如果你能充分的理解string,你就会赞叹Delphi的精妙了。
处理字串时候最恼人的问题之一就是内存的分配与释放,如果你用char数组(array [0..l] of char等同于C中的char[l+1]),则内存被静态分配,这种情况主要用在定宽字符串中。但是对于最常见的变长字串可就费劲了。string解决这个问题的手段是,由编译器通过引用计数和长度信息自动维护字串内存区域。事实上,当把一个string类型的变量当成字符指针看的时候,他的内存布局是这样的:
s: string = 'CSDN ';
则有PChar(s)^ = 'C ',(PChar(s)+1)^= 'S ',……(PChar(s)+4)^=#0。
且:PInteger(Integer(Pointer(s))-1*sizeof(DWORD))^=length(s)
和:PInteger(Integer(Pointer(s))-2*sizeof(DWORD))^=refcount(s)
可视化一下就是:
[RefCount: DWORD][Length: DWORD]^[ 'C '][ 'S '][ 'D '][ 'N '][#0]
(^处即为s所指内存地址)
可以看到string在s之后的内存布局同PChar完全一致,都是ASCIIZ标准的字串,因此任何string类型的变量都可以通过强制类型转换的语法欺骗编译器的强类型检查而作为PChar直接使用,如: PChar(s)。而且由于字串的长度存放在偏移-4处,因此求字串长度的时候速度极快,因为length(s) = PInteger(Integer(Pointer(s))-4)^,不用像PChar和array那样从头数到尾直到#0。那引用计数是干哈的呢?首先要明确一点,Delphi对于string是从堆中自动分配和释放内存,分配好说,但是什么时候释放呢?如果你了解COM的引用计数原理就知道,通过维护refCount系统就能够确定可以安全释放对象的时机了。因为Delphi对于string类型的字串使用了copy-on-write技术,因此如果简单的两个string都包含相同的内容,则实际上内存中仅有一份拷贝。如:
s1 := 'I love Delphi '; // line 1
s2 := s1; // line 2
s1 := s1 + '! '; // line 3
在第一行,Delphi将为s1分配内存并设定好负偏移处的长度信息与引用计数(初始为1);在第二行,事实上没有任何的内存分配操作,s2简单的被赋予s1的指针信息,同时他们指向的字串的引用计数+1(事实上Delphi程序内部还有一张表来记录这些引用信息和变量实例的关系);在第三行,s1进行了改变,根据内部的逻辑规则,Delphi将自动分配新的内存并实际拷贝s1+ '! '的内容到新的内存中,然后改变s1的地址和s2指向字串的引用计数就搞定了。这就是所谓的copy-on-write。你说了,这没什么用啊,哪儿这么多直接的赋值啊?其实像返回字串的函数这类情况都能发挥copy-on-write的好处,经济、快速。
综合一下,在Delphi编程中应该尽可能的使用string类型简化代码、减少出错并提高程序的运行效率。在调用C或者其他应用PChar的场合可以直接拿PChar(string)来用,不存在效率问题(因为只是强制转换而已)。字符数组主要用于定宽字串和定义结构时候用,不过只有下标为0且数组成员类型为char的array才和PChar兼容。