C++性能剖析教程之switch语句
前言
几乎每本面向初学者的C语言或C++书籍在前面两章都会提到分支控制语句if……else和switch……case,在某些情况下这两种分支控制语句可以互相替换,但却很少有人去深究在if……else和switch……case语句的背后到底有什么异同?应该选择哪一个语句才能使得效率最高?要回答这些问题,只能走到switch语句的背后,看看这些语句到底是怎么实现的。
基本格式
switch语句的基本格式如下:
switch(表达式){
case常量表达式1:《语句序列1》《break;》//《》中的内容可省
……
case常量表达式n:《语句序列n》《break;》//同上,下同
《default:语句序列》
}
其中:
- 表达式——称为“条件表达式”,用作判断条件,取值为整型、字符型、布尔型或枚举型。
- 常量表达式——由常量构成,取值类型与条件表达式相同。
- 语句序列——可以是一个语句也可以是一组语句。
if语句与switch语句
相信学过C/C++的同学对这两个语句的异同早就了如指掌,if语句作为条件判断,满足条件进入if语句块,不满足条件则进入else语句块,而且if和else语句块又可以继续嵌套if语句。switch则是通过判断一个整型表达式的值来决定进入到哪一个case语句中,如果所有case条件都不满足则进入到default语句块。
//简单的if语句 if(a==1) i=1; elseif(a==2) i=2; else i=3;
//简单的switch语句 switch(a){ case1:i=1; case2:i=2; default:i=3; }
编译器如何实现switch语句?
现在编译器已经足够智能和强大,经过测试,g++实现switch语句的方式就至少有三种,编译器会根据代码的实际情况,权衡时间效率和空间效率,去选择一个对当前代码而言综合效率最高的一种。
编译器实现switch语句的三种方式:
- 逐条件判断
- 跳转表
- 二分查找法
后面我们将就这三种实现方法适用的代码场景进行测试和分析。
1.逐条件判断法
逐条件判断法其实就是和if……else语句的汇编实现相同,编译器把switch语句中各个case条件逐个进行判断,直到找到正确的case语句块。这种方法适用于switch语句中case条件很少的情况,即使逐个条件判断也不会导致大量时间和空间的浪费,比如下面这段代码:
#includeinttest_switch(){ inti; inta=std::rand(); switch(a){ case0:i=0;break; case1:i=1;break; case2:i=2;break; default:i=3;break; } returni; }
该代码对应的汇编代码如下:
movl-4(%rbp),%eax cmpl$1,%eax je.L3 cmpl$2,%eax je.L4 testl%eax,%eax jne.L8 movl$0,-8(%rbp) jmp.L6 .L3: movl$1,-8(%rbp) jmp.L6 .L4: movl$2,-8(%rbp) jmp.L6 .L8: movl$3,-8(%rbp) nop
eax寄存器存储的是判断条件值(对应于C++代码中的a值),首先判断a是否等于1,如果等于1则跳转到.L3执行a==1对应的代码段,然后判断a是否等于2,如果等于2则跳转到.L4执行a==2对应的代码段……可能难理解的是第6行代码testl%eax,%eax,其实这只是编译器提高判断一个寄存器是否为0效率的一个小技巧,如果eax不等于0则跳转到.L8代码段,执行default代码段对应的代码,如果eax等于0则执行a==0对应的代码段。
由上面对编译器生成汇编代码的分析,我们可以发现:编译器在这种情况下使用逐个条件判断来实现switch语句。
2.跳转表实现法
在编译器采用这种switch语句实现方式的时候,会在程序中生成一个跳转表,跳转表存放各个case语句指令块的地址,程序运行时,首先判断switch条件的值,然后把该条件值作为跳转表的偏移量去找到对应case语句的指令地址,然后执行。这种方法适用于case条件较多,但是case的值比较连续的情况,使用这种方法可以提高时间效率且不会显著降低空间效率,比如下面这段代码编译器就会采用跳转表这种实现方式:
#includeinttest_switch(){ inti; inta=std::rand(); switch(a){ case0:i=0;break; case1:i=1;break; case2:i=2;break; case3:i=3;break; case4:i=4;break; case5:i=5;break; case6:i=6;break; case7:i=7;break; case8:i=8;break; case9:i=9;break; default:i=10;break; } returni; }
该代码对应的汇编代码如下:
movl-4(%rbp),%eax movq.L4(,%rax,8),%rax jmp*%rax .L4: .quad.L3 .quad.L5 .quad.L6 .quad.L7 .quad.L8 .quad.L9 .quad.L10 .quad.L11 .quad.L12 .quad.L13 .text .L3: movl$0,-8(%rbp) jmp.L14 .L5: movl$1,-8(%rbp) jmp.L14 #后面省略……
在x64架构中,eax寄存器是rax寄存器的低32位,此处我们可以认为两者值相等,代码第一行是把判断条件(对应于C++代码中的a值)复制到eax寄存器中,第二行代码是把.L4段偏移rax寄存器值大小的地址赋值给rax寄存器,第三行代码则是取出rax中存放的地址并且跳转到该地址处。我们可以清楚的看到.L4代码段就是编译器为switch语句生成的存放于.text段的跳转表,每种case均对应于跳转表中一个地址值,我们通过判断条件的值即可计算出来其对应代码段地址存放的地址相对于.L4的偏移,从而实现高效的跳转。
3.二分查找法
如果case值较多且分布极其离散的话,如果采用逐条件判断的话,时间效率会很低,如果采用跳转表方法的话,跳转表占用的空间就会很大,前两种方法均会导致程序效率低。在这种情况下,编译器就会采用二分查找法实现switch语句,程序编译时,编译器先将所有case值排序后按照二分查找顺序写入汇编代码,在程序执行时则采二分查找的方法在各个case值中查找条件值,如果查找到则执行对应的case语句,如果最终没有查找到则执行default语句。对于如下C++代码编译器就会采用这种二分查找法实现switch语句:
#includeinttest_switch(){ inti; inta=std::rand(); switch(a){ case4:i=4;break; case10:i=10;break; case50:i=50;break; case100:i=100;break; case200:i=200;break; case500:i=500;break; default:i=0;break; } returni; }
改代码段对应的汇编代码为:
movl-4(%rbp),%eax cmpl$50,%eax je.L3 cmpl$50,%eax jg.L4 cmpl$4,%eax je.L5 cmpl$10,%eax je.L6 jmp.L2 .L4: cmpl$200,%eax je.L7 cmpl$500,%eax je.L8 cmpl$100,%eax je.L9 jmp.L2
代码第二行条件值首先与50比较,为什么是50而不是放在最前面的4?这是因为二分查找首先查找的是处于中间的值,所以这里先与50进行比较,如果eax等于50,则执行case
50对应代码,如果eax值大于50则跳转到.L4代码段,如果eax小于50则继续跟4比较……直至找到条件值或者查找完毕条件值不存在。可以看出二分查找法在保持了较高的查询效率的同时又节省了空间占用。
总结
何时应该使用if……else语句,何时应该使用switch……case语句?
通过上面的分析我们可以得出结论,在可能条件比较少的时候使用if……else和switch……case所对应的汇编代码是相同的,所以两者在性能上是没有区别的,使用哪一种取决于个人习惯。如果条件较多的话,显而易见switch……case的效率更高,无论是跳转表还是二分查找都比if……else的顺序查找效率更高,所以在这种情况下尽量选用switch语句来实现分支语句。当然如果我们知道哪种条件出现的概率最高,我们可以将这个条件放在if判断的第一个,使顺序查找提前结束,这时使用if……else语句也可以达到较高的运行效率。
switch语句也有他本身的局限性,即switch语句的值只能为整型,比如当我们需要对一个double型数据进行判断时,便无法使用switch语句,这时只能使用if……else语句来实现。
好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对毛票票的支持。