首先看如下代码:
1 int main(int argc, char** argv) 2 { 3 int a[5] = {1,2,3,4,5}; 4 int* ptr = (int*)(&a + 1); 5 printf("%d,%d\n", *(a+1), *(ptr-1)); 6 return 0; 7 }
这道题在很多所谓经典C语言面试题里是常见的不能再常见,你知道输出结果吗?
答案是:2,5
但是仍有许多人不能答对,也包括当初的我。这道题简简单单,但是考察了不少于如下内容:数组指针、数组首地址概念、数组指针和数组首地址和数组首元素地址之间的关系,指针运算规则,指针类型,int型长度,指针长度,类型转换…这些概念如果有一个及以上不是那么太清楚的话,很容易答错。
为方便讨论,先开始理解如下关系:
以下是某次在Ubuntu 10.10-desktop-i386 + gcc 4.4.5的运行结果:
size of a: 20 (bytes) (Why? 因为机器是32位的, size of int 为 4 bytes,a有5个int)
size of ptr: 4 (bytes) (ptr是指针,永远不要忘记,32位字长的机器,指针长度是4)
ptr的地址:bfb5c52c (取决于具体情况,这里只是为了方便理解和讨论)
a的地址(&a):bfb5c518
a[0]的地址:bfb5c518
a[1]的地址:bfb5c51c
&a + 1:bfb5c52c (&a[0]:bfb5c518 -- &a[1]:bfb5c51c -- &a[2]:bfb5c520 -- &a[3]:bfb5c524 -- &a[4]:bfb5c528 -- &a[5]:bfb5c52c)
注意&a[5]只是这里的书面表示,其实已经在数组范围之外了,当然利用数组地址a取a[5]的地址本身是合法的。
下面具体解释:
- a是数组地址,根据C语言语义,即数组首元素的地址,首元素是int类型,故首元素地址应为int*类型,故a的类型为int*;
- &a是数组指针,其值与a相同,但含义却不同,即类型不同,各位能准确给出&a的类型吗?是 int (*)[5],难理解吗?还记得我那篇《C堆上申请二维数组》里面提到的a的类型吗?这正是C语言指针较晦涩和难懂的地方。
理解了这两点的话,上述问题则十分简单:
a + 1:现在把a看作一个指针,指针+1操作,根据C语言语义,实际增加偏移量的是指针指向类型的长度,即32位机器下的int型,即4字节,故a+1就是&a[1],那么*(a+1)就是a[1],即2;
&a + 1:现在把&a看作一个指针(不知道怎么“看作”? int (*b)[5] = &a),那么&a + 1实际增加的偏移量是其指向类型(int (*)[5])的长度,即20字节,故&a + 1其实是a+5,即&a[5](虽然a[5]是越界访问,但&a[5]没啥问题,这就是C语言)。
好了,现在已知&a+1的值是a+5,但其类仍然是int (*)[5],现在ptr指向&a+1且通过强制类型转换变成了int*,那么ptr-1是什么呢?因为ptr已经是int*类型了,ptr-1即向前移动4字节,即a+4,即&a[4],那么*(ptr-1)就是a[4],即5。
是否觉得十分困难?慢慢来吧。这也正是C语言难和强大的冰山一角。
再补充一句:以下关系的值(地址)是一样的:
a = &a = &a[0],不信可以试试喔!