0级(Constan folding)的优化包括:
a、常数折叠:只要有可能,编译器就执行将表达式化为常数数字的计算,其中包括运行地址的计算。
b、 简单访问优化:对8051系统的内部数据和位地址进行访问优化。
c、 跳转优化:编译器总是将跳转延至最终目标上,因此跳转到跳转之间的命令被删除。
特点:最少的优化,可以最大程度上配合产生代码调试信息,可以在任何代码行打断点,特别是死代码处。
1级(Dead code elimination)的优化包括:
a、 死码消除:无用的代码段被消除。
b、 跳转否决:根据一个测试回溯,条件跳转被仔细检查,以决定是否能够简化或删除。
特点:有限的优化,去除无用的inline和无用的static函数、死代码消除等,在影响到调试信息的地方均不进行优化。在适当的代码体积和充分的调试之间平衡,代码编写阶段最常用的优化等级。
2级(Data overlaying)的优化包括:
a、数据覆盖:适于静态覆盖的数据和位段被鉴别并标记出来。连接定位器BL51通过对全局数据流的分析,选择可静态覆盖的段。
特点:高度优化,调试信息不友好,有可能会修改代码和函数调用执行流程,自动对函数进行内联等。
3级(Peephole optimization)的优化包括:
a、“窥孔”优化:将冗余的MOV命令去掉,包括不必要的从存储器装入对象及装入常数的操作。另外如果能节省存储空间或者程序执行时间,复杂操作将由简单操作所代替。
特点:最大程度优化,产生极少量的调试信息。会进行更多代码优化,例如循环展开,更激进的函数内联等。
另外,可以通过单独设置 --loop_optimization_level=option 来控制循环展开的优化等级。
4级(Register variables)的优化包括:
a、寄存器变量:使自动变量和函数参数尽可能位于工作寄存器中,只要有可能,将不为这些变量保留数据存储器空间。
b、扩展访问优化:来自IDATA、XDATA、PDATA和CODE区域的变量直接包含在操作之中,因此大多数时候没有必要将其装入中间寄存器。
c、局部公共子式消除:如果表达式中有一个重复执行的计算,第一次计算的结果被保存,只要有可能,将被用作后续的计算,因此可从代码中消除繁杂的计算。
d、CASE/SWITCH语句优化:将CASE/SWITCH语句作为跳转表或跳转串优化。
5级(Common subexpression elimination)的优化包括:
a、全局公共子式消除:只要有可能,函数内部相同的子表达式只计算一次。中间结果存入一个寄存器以代替新的计算。
b、简单循环优化:以常量占据一段内存的循环再运行时被优化。
6级(Loop rotation)的优化包括:
a、回路循环:如果程序代码能更快更有效地执行,程序回路将进行循环。
7级(Extended Index Access optimizing)的优化包括:
a、扩展入口优化:在适合时对寄存器变量使用DPTR数据指针,指针和数组访问被优化以减小程序代码和提高执行速度。
8级(Reuse Common Entry Code)的优化包括:
a、公共尾部合并:对同一个函数有多处调用时,一些设置代码可被重复使用,从而减小程序代码长度
9级(Common Block Subroutines)的优化包括:
a、公共子程序块:检测重复使用的指令序列,并将它们转换为子程序。C51甚至会重新安排代码以获得更多的重复使用指令序列。