网络上有很多讨论C++ 的“引用”与“指针“的区别的文章,谈到区别,其中有一条:“引用不能为空(NULL),引用必须与合法的存储单元关联,指针则可以是NULL)”,但在实际应用中,有时候为了保持一致性,我们会抛开这个规则,人为创造出一个“空引用”。
很多情况下,“空引用”确实可以工作,以致于“引用不能为空”的忠告,被嘲笑为形式主义,仅仅是标准制定者的耸人听闻。一个“空引用”的例子是:
int * a = NULL; int & b = *a;
于是当访问b的时候,程序异常出现了:
void f(int & p) { p = 0; } f(b);
当然,可以增加点判断,修正这个问题:
void f(int & p) { if (&p) p = 0; }
怎么样,是不是有点别扭?但是如果换成成指针,你要输入的字符数是一模一样的:
void f(int * p) { if (p) *p = 0; }
于是,到底是使用“引用”还是“指针”,好像就是智者见智仁者见仁的事情了。
然而,然而。。。。。。
这真的一样吗?
我们来看看复杂一点的例子:
// test.cpp #include <iostream> class A { int a; }; class B { int b; }; class C : public A, public B { int c; }; void fb(B & b) { std::cout << &b << std::endl; } void fb(B * b) { std::cout << b << std::endl; } int main(int argc, char* argv[]) { C * c = NULL; fb(c); fb(*c); return 0; }
编译运行一下看看:
$ ./test 0 0x4
咦,怎么&b不是0,也就是不是“空引用”了,这时候,即使加上判断,if (&b),也无济于事了。
大家也许注意到了,上面是linux环境运行,那么windows环境呢:
>test.exe 00000000 00000000
这时候,“空引用”保持了他的“空”属性,仅在windows平台做C++的开发者,可以松口气了。
这是怎么回事呢,是你的眼睛欺骗了你?也许是,但是CPU不会欺骗我们,从汇编代码可以看出本质。下面是linux平台编译的代码:
Dump of assembler code for function main: 0x0804870a <+0>: push %ebp 0x0804870b <+1>: mov %esp,%ebp 0x0804870d <+3>: and $0xfffffff0,%esp 0x08048710 <+6>: sub $0x20,%esp 0x08048713 <+9>: movl $0x0,0x1c(%esp) 0x0804871b <+17>: cmpl $0x0,0x1c(%esp) 0x08048720 <+22>: je 0x804872b <main+33> 0x08048722 <+24>: mov 0x1c(%esp),%eax 0x08048726 <+28>: add $0x4,%eax 0x08048729 <+31>: jmp 0x8048730 <main+38> 0x0804872b <+33>: mov $0x0,%eax 0x08048730 <+38>: mov %eax,(%esp) 0x08048733 <+41>: call 0x80486df <fb(B*)> 0x08048738 <+46>: mov 0x1c(%esp),%eax 0x0804873c <+50>: add $0x4,%eax 0x0804873f <+53>: mov %eax,(%esp) 0x08048742 <+56>: call 0x80486b4 <fb(B&)> 0x08048747 <+61>: mov $0x0,%eax 0x0804874c <+66>: leave 0x0804874d <+67>: ret
这是windows平台的:
wmain: 004114D0 push ebp 004114D1 mov ebp,esp 004114D3 sub esp,0DCh 004114D9 push ebx 004114DA push esi 004114DB push edi 004114DC lea edi,[ebp-0DCh] 004114E2 mov ecx,37h 004114E7 mov eax,0CCCCCCCCh 004114EC rep stos dword ptr es:[edi] 004114EE mov dword ptr [c],0 004114F5 mov eax,dword ptr [c] 004114F8 mov dword ptr [rc],eax 004114FB cmp dword ptr [c],0 004114FF je wmain+3Fh (41150Fh) 00411501 mov eax,dword ptr [c] 00411504 add eax,4 00411507 mov dword ptr [ebp-0DCh],eax 0041150D jmp wmain+49h (411519h) 0041150F mov dword ptr [ebp-0DCh],0 00411519 mov ecx,dword ptr [ebp-0DCh] 0041151F push ecx 00411520 call fb (411118h) 00411525 add esp,4 00411528 cmp dword ptr [rc],0 0041152C je wmain+6Ch (41153Ch) 0041152E mov eax,dword ptr [rc] 00411531 add eax,4 00411534 mov dword ptr [ebp-0DCh],eax 0041153A jmp wmain+76h (411546h) 0041153C mov dword ptr [ebp-0DCh],0 00411546 mov ecx,dword ptr [ebp-0DCh] 0041154C push ecx 0041154D call fb (41108Ch) 00411552 add esp,4 00411555 xor eax,eax 00411557 pop edi 00411558 pop esi 00411559 pop ebx 0041155A add esp,0DCh 00411560 cmp ebp,esp 00411562 call @ILT+345(__RTC_CheckEsp) (41115Eh) 00411567 mov esp,ebp 00411569 pop ebp 0041156A ret
汇编代码有兴趣自己研究,不细说了。
回过头想想,两个平台的编译器的两种处理方式,都有他的合理性,windows平台增加了容错性,而linux平台在处理引用时减少判断,增加性能。这隐隐体现出windows与linux开发理念的不同。
最后,请大家记住,引用不能为空,如果可能存在空对象时,请使用指针。