本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/kevinyujm/archive/2009/02/18/3907964.aspx
在学校学C的那会儿,就已经知道switch...case的执行效率要相对if...else较高了(大体上讲),因为从字面上和逻辑上看,switch...case是不用像if...else那样做一系列比较判断就可以直接定位到相应的条件分支的。不过也没有深究过其中的原理。后来由于一偶然原因,就明白了其中的细节。今日碰巧看到一篇blog,是讲作者对此问题的思考,我觉得作者的理解大体上都是对的,不过下面跟帖的人,有人鄙夷,有人讽刺,实在是影响网容网貌,对作者本人也是没有起码的尊重,无法建立起平等的沟通,实在是不河蟹呀~~~:)
switch...case与if...else的根本区别在于,switch...case会生成一个跳转表来指示实际的case分支的地址,而这个跳转表的索引号与switch变量的值是相等的。从而,switch...case不用像if...else那样遍历条件分支直到命中条件,而只需访问对应索引号的表项从而到达定位分支的目的。
具体地说,switch...case会生成一份大小(表项数)为最大case常量+1的跳表,程序首先判断switch变量是否大于最大case常量,若大于,则跳到default分支处理;否则取得索引号为switch变量大小的跳表项的地址(即跳表的起始地址+表项大小*索引号),程序接着跳到此地址执行,到此完成了分支的跳转。如下代码(gcc编译,不开优化):
int main()
{
int j = 0;
int i = 1;
switch (i)
{
case 1:
j = 11;
break;
case 2:
j = 22;
break;
case 3:
j = 33;
break;
case 4:
j = 44;
break;
case 10:
j = 10;
default:
j = 88;
break;
}
return 0;
}
这是编译后的部分汇编码:
.file "test.c"
.text
.globl main
.type main, @function
main:
leal 4(%esp), %ecx
andl $-16, %esp
pushl -4(%ecx)
pushl %ebp
movl %esp, %ebp
pushl %ecx
subl $16, %esp
movl $0, -8(%ebp)
movl $1, -12(%ebp)
cmpl $10, -12(%ebp)
ja .L2
movl -12(%ebp), %eax
sall $2, %eax
movl .L8(%eax), %eax
jmp *%eax
.section .rodata
.align 4
.align 4
.L8:
.long .L2
.long .L3
.long .L4
.long .L5
.long .L6
.long .L2
.long .L2
.long .L2
.long .L2
.long .L2
.long .L7
.text
.L3:
movl $11, -8(%ebp)
jmp .L9
.L4:
movl $22, -8(%ebp)
jmp .L9
.L5:
movl $33, -8(%ebp)
jmp .L9
.L6:
movl $44, -8(%ebp)
jmp .L9
.L7:
movl $10, -8(%ebp)
.L2:
movl $88, -8(%ebp)
.L9:
movl $0, %eax
addl $16, %esp
popl %ecx
popl %ebp
leal -4(%ecx), %esp
ret
可以打个比方,switch...case访问条件分支的方式像数组一样,是随机访问;而if...else是顺序访问。
他们各自的特点:
1、 总体上说,switch...case 效率要高于同样条件下的if...else,特别是当条件分支较多时。
2、switch...case占用较多的代码空间,因为它要生成跳表,特别是当case常量分布范围很大但实际有效值又比较少的情况,switch...case的空间利用率将变得很低。例如上面的代码,如果把case 10改成case 100,则会生成101个表项,而大部分表项是指向同一分支(default分支)。switch...case是在以空间换时间。
3、switch...case只能处理case为常量的情况,对非常量的情况是无能为力的。例如 if (a > 1 && a < 100),是无法使用switch...case来处理的。
***注意:如果把例子中的case分支减少一个,则生成的汇编码与if...else差别不大,此时不会生成跳表项,可见对于分支较少的情况,编译器会做特殊处理。