Chapter 2 构造函数语义学
关于C++,最常听到的一个抱怨就是:编译器背着程序员干了太多的事情。
默认构造函数 default constructor
如果没有程序员定义的构造函数,则会有一个default constructor被隐式(implicity)声明出来。一个被隐式声明的default ctor有时候会是一个trivial的ctor(完全什么也不做,连成员变量也不初始化,等于没有这个ctor,只是概念上有而已)。在以下四种情况下,这个隐式声明的default ctor会是nontrivial ctor。
情况1:这个类含有带有default ctor的成员。
例如:
classFoo {public: Foo(),Foo(int);...};
classBar {public: Foofoo; charstr;};
void foo_bar(){
Bar bar; //Bar::foo应在此处被初始化
if(str){...}
}
被合成的Bar default ctor内含必要的代码,能够调用class Foo的default ctor来处理member object Bar::foo,但并不处理Bar::str。即被合成的default ctor只是为了满足编译器的需要(编译器需要有个地方来初始化Bar::Foo,因为它有自己的default ctor),而不是程序的需要(初始化Bar::str是程序员的动作)。
如果程序员在ctor只显式初始化了Bar::str,则一些代码会被插入到这个ctor中。例如
Bar::Bar(){ str=0; }
会被编译器扩展为
Bar::Bar(){ foo.Foo::Foo(); //附加上的编译器代码
str=0;//显式的程序员代码
}
情况2:这个类派生自一个带有default ctor的Base Class。
同样的道理,这个类既然派生自一个带有default ctor的Base Class,则它需要一个地方来调用Base Class的default ctor。
情况3:这个类带有Virtual Function。
这种情况包括两个更细的情况:
1. 这个类自己声明(或者继承)了Virtual Function。
2. 这个类继承自一个继承串链,其中有virtual base class。
这种情况下,编译时,要做如下工作:
1.编译器需要生成一个virtual function table(vtbl)并填充。
2.在class object中,一个额外的pointer member(就是vptr,指向vtbl)会被编译器合成出来。此外虚拟调用会被替换(w.vf() => w.vprt[1])。
为了支持这种功能,编译器必须为每个w对象设置它的vptr(这是成员变量,此时需要指向合适的vtbl),因此编译器需要在default ctor中安插一些代码来完成这种工作。
情况4:这个类带有Virtual Base Class。
考虑这样的代码:
classX { public: inti; };
classA : publicvirtualX { public: intj; };
classB : publicvirtualX { public: doubled; };
classC : publicA, publicB { public: intk; };
//无法在编译期间解析出 pa->i 的位置(给一个pa无法确定i的地址)。
void foo( constA* pa ) { pa->i = 1024; }
main() {
foo( new A );
foo( new C );
// ...
}
由于pa的真正类型不确定,所以某些编译器会记录一个指针例(如 __vbcX)来记录X,然后通过这个指针来定位pa指向的i。上述
void foo( constA* pa ) { pa->i = 1024; }
变成了:
void foo( constA* pa ) { pa-> __vbcX ->i = 1024; }
因此,__vbcX这个指针需要在object构造期间设置好。于是编译器需要一个default ctor来完成这个工作。
复制构造函数Copy ctor的构造
何时用到copy ctor:显式用t1初始化t2;传参;返回一个类对象。
如果程序员显式定义了copy ctor,则调用它。
如果没有,其内部是通过 default memberwise initialization的手法完成的(将源对象的所有member复制给目的对象,对于member class object,会递归执行memberwise initialization)。
这些操作是如何构造的:
概念上讲,这些操作是被一个copy ctor实现的。
上述强调“概念上讲”,是因为有时候copy ctor是trivial的。
copy ctor何时是nontrivial:简单的答案为当class没有展现bitwise copy semantics时,copy ctor是nontrivial的。
那么什么时候class没有展现bitwise copy semantics:答案为有四种情况。
情况1:这个类的某个member object有copy ctor。(编译器要在这个类的copy ctor来调用其member object的copy ctor)。
情况2:这个类继承自某个有copy ctor的base class。(编译器要在这个类的copy ctor来调用其base class的copy ctor)。
情况3:这个类声明了若干个virtual function。
如下代码
void draw(const ZooAnimal& zoey) {zoey.draw();}
void foo() {
ZooAnimal franny = yogi;
draw (yogi); //调用 Bear::draw()
draw (franny); //调用 ZooAnimal::draw()
}
如果ZooAnimal按照bitwise copy进行复制(ZooAnimal franny = yogi;),则会出现franny的vptr设置成了yogi的vptr,于是draw (franny);调用的会是Bear的draw。(事实上不是,因为franny是一个实例,不是指针也不是引用)。
因此ZooAnimal的复制构造函数需要显式设定vptr(使之指向ZooAnimal的vtbl),这个设置动作需要在合成的copy ctor中完成。
情况4:这个类派生自的继承链中有virtual base class。
同构造函数的情况4。 __vbcXXX需要显式重设,这个设置动作需要在合成的copy ctor中完成。
Raccoon和RedPanda中含有指向virtual base class subobject的指针(设为__vbcZooAnml),则当用RedPanda初始化Raccoon时( Raccoon rc=rp;),将Raccoon-> __vbcZooAnml 设置为RedPanda->__vbcZooAnml是不对的。因此需要重新设置__vbcZooAnml,这个动作需要在copy ctor中完成。
总结以上4种情况,bitwise copy semantics的意思可以理解为:类的某些成员变量(包括程序员定义的成员变量和编译器所需要的变量如vptr、__vbc等)不能按位复制时,需要调用成员变量的copy ctor或者重设vptr等编译器所需类的成员变量,这些动作都需要在发生对象复制的时候完成,因此编译器会合成一个copy ctor(入股没有的话)。
程序转化语义学 Program Transformation Semantics
显式的初始化操作 Explicit Initialization
X x0;
void foo_bar(){
X x1(x0); //定义了x1
X x2 = x0; //定义了x2
X x3 = X(x0); //定义了x3
}
转化的两个动作:重写每一个定义,其初始化部分被剥除;用copy ctor初始化。
即变成了
void foo_bar(){
X x1; //定义被重写,初始化操作被剥除
X x2; //定义被重写,初始化操作被剥除
X x3; //定义被重写,初始化操作被剥除
//编译器安插X copy ctor。
x1.X::X( x0 );
x2.X::X( x0 );
x3.X::X( x0 );
}
其中x1.X::X( x0 );会表现为对copy ctor(即 X::X( constX& xx);)的调用。
参数初始化 Argument Initialization
如下代码的变化
void foo(X x0);
...
X xx;
foo(xx)
变成了
void foo(X& x0);
...
X __tmp;
__tmp.X::X( XX );
foo(__tmp);
其中X声明了destructor,它在foo调用完成后销毁__tmp。
另一种变化是拷贝构建(copy construct),将实际参数直接建在其应该在的位置上。
返回值的初始化 Return Value Initialization
X bar(){
X xx;
...
return xx;
}
变成了
void bar(X& _result){
X xx;
...
_result.X::X(xx);
return;
}
对函数的调用
X xx=bar();
变为:
X xx;
bar(xx);
对函数的调用
bar().memfunc();
变为:
X _tmp;
(bar(_tmp),_tmp).memfunc();
在使用者层面做优化 Optimization at the User Level
在编译器层面做优化 Optimization at the Compiler Level
针对这种转化:
X bar(){
X xx;
...
return xx;
}
变成
void bar(X& _result){
X xx;
...
_result.X::X(xx);
return;
}
这一转换的一个优化为:转变成如下代码
void bar(X& _result){
_result.X::X(xx);
//原来处理xx,现在变为处理_result。
return;
}
这一优化称之为NRV(Named Return Value)。
虽如此,NRV饱受批评。主因有二:编译器实现程度不一致(有些编译器)。函数变得复杂时,优化难以实施。
成员初始化列表 Member Initialization List