首先请大家看这么一个简单的小程序:
#include void main() { int i, b[10]; for ( i = 0; i <= 10; i++ ) { b[i] = 0; } } |
请问这个程序是否有错?A.正常 B.越界 C.死循环
正确答案是C,相信选A或选B的朋友一定会很纳闷。事实上我也是如此,单单从程序的表面上看,按定义这应该是个越界,因为当循环进行到i == 10的时候,程序将试图将b[10]赋值为0,而C语言中,b[10]的声明就是指定b[0]~b[9]可用。
然而程序的结果你看到了,这是个死循环无疑。
也好,那么让汇编来告诉你——以及我——这一切的真相吧,在这之前请你把i和b[10]的定义改成:
int i = 0, b[10] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; |
然后,将这个程序反汇编,可以得到:
让我来解释一下这段汇编代码的含义吧。在系统的实现中,i和数组b[10]是分配在栈上的变量,在内存中的分布如下图:
现在你看到了,i所占据的正是b[10]的位置,而b[10] = 0;这一句会被这样运行:
*(&b[0] + 10) = 0; |
所以这一句的结果,就是把0赋值给i。这样一来在第11次循环的时候,i将会被重新置为0,那么循环结束的条件也就永远不会满足了,循环也就是个死循环了。
事实上单单讨论C语言的内部实现并没有什么意义,而且这样书写的循环在程序设计中也绝对不能够出现。所以我所想要讨论的,就是如何让汇编帮助我们解决表面上无法看清楚的东西,仅此而已。