揭开C/C++中数组形参的迷雾

副标题#e#

楔子

去年，周星星年迈曾经在VCKBASE/C++论坛颁发过一篇文章“数组引用"以制止"数组降阶”，其时我不能深入领略这种用法的寄义；时隔一年，我的常识有几经锻炼，终于对此文章渐有所悟，所以把吾所知作想具体道来，竟也成了一篇文章。但愿本文能对新手有所启迪，同时也但愿各人发明本文中的疏漏之处后不惜留言指教。

故事发源于周星星年迈给出的两个Demo，为了节减处所，我把两个Demo合二为一，也能说明同样的问题：

#include <iostream> using namespace std; void Foo1(int arr[100]) { cout << "pass by pointer:　 " << sizeof(arr) << endl; } void Foo2(int (&arr)[100]) { cout << "pass by reference: " << sizeof(arr) << endl; } void main() { int a[100]; cout << "In main function : " << sizeof(a) << endl; Foo1(a); Foo2(a); }其运行功效如下：In main function : 400 pass by pointer: 4 pass by reference: 400

这段代码说明白，假如数组形参是数组名形式(可能指针形式，下文接头)时，利用sizeof运算符，将得不到本来数组的长度；假如用通报原数组引用的要领，则没有问题。

这段代码简直很难领略，因为这短短的十几行涉及到了形参加实参的干系、数组名和指针的干系、引用的意义、声名和表达式的干系这4大类问题，只要有1层次解不透、可能领略不正确，就领略不透上面的这段代码。本文也就从这4个问题入手，把这4个问题首先办理掉，然后再探讨上面的这段代码。固然这样看来极端繁复，可是我认为从根上入手来领略、进修，是条似远实近的阶梯。

一、函数形参和实参的干系

void Foo(int a); Foo(10);

这里的a叫做形式参数（parameter），简称形参；这里的10叫做实际参数（argument），简称实参。形参和式参之间是什么干系呢？他们是赋值的干系，也就是说：把实参通报给形参的进程，可以看作是把实参赋值给形参的进程。上面的例子中，实参10通报给形参a，就相当于a=10;这个赋值的进程。（因为数据范例多的很，无法举例子举全面，所以这里就不举例子了；假如以为欠好领略，就在vc中写个sample调试一下各类数据范例的环境，你就可以或许验证这个结论了。）

二、数组名和指针的干系

这个问题是个汗青性的问题了，在C语言中，数组名是看成指针来处理惩罚的。更确切的说，数组名就是指向数组首元素地点的指针，数组索引就是距数组首元素地点的偏移量。领略这一点很重要，很大都组应用的问题就是有此而起的。这也就是为什么C语言中的数组是从0开始计数，因为这样它的索引就较量好对应到偏移量上。在C语言中，编译进程中碰着有数组名的表达式，城市把数组名替换成指针来处理惩罚；编译器甚至无法区分a[4]和4[a]的区别！*2 可是下面这一点需要留意：

int a[100]; int *b;

这两者并不等价，第一句话声明白数组a，并界说了这个数组，它有100个int型元素，sizeof(a)将获得整个数组所占的内存巨细，是400；第二句话只是声明并界说了一个int型的指针，sizeof(b)将获得这个指针所占的内存巨细，是4。所以说，固然数组名在表达式中一般会看成指针来处理惩罚，可是数组名和指针照旧有差距的，最起码有a==&a[0]可是sizeof(a)!=sizeof(a[0])。

而且在ANSI C尺度中，也明文划定：在函数参数的声明中，数组名北边一起看成指向该数组第一个元素的指针。所以，下面的几种书写形式是等效的：

void Foo1(int arr[100]){} void Foo2(int arr[]){} void Foo3(int *arr){} C++尽大概的全面兼容C语言，所以这一部门的语法沟通。

#p#副标题#e#

三、引用的意义

“引用“是C++中引进的观念，C语言中没有。它的目标在于，在某些方面代替指针。假如你认为引用和指针并无大差异，必定会为指针报不服，颇有一种“即生亮何生瑜”的感应；可是，引用确实有新的特色，也确实在许多处所的表示和指针有所差异，本文就是一例。利用引用，我们要掌握这它最最最重要的一点，这也是它和指针最大的区别：引用一经界说，就和被它引用的变量牢牢地团结在一起，再不分隔，对引用的任何操纵都反应在它引用的变量上；而指针，只是会见它指向变量的另一种方法，两者虽有接洽，可是并不像引用那样密不行分。:)

#include <iostream> using namespace std; void main() { int a = 10; int & a_ref = a; int b = 20; 　// 界说引用时就要初始化,说明引用跟它指向的元素密不行分　//int & b_ref ; // error C2530: ''b_ref'' : references must be initialized　 int & b_ref = b; int * p; int * q; //下面的功效证明白：引用一经界说，就不能再指向其他方针；　//把一个引用b_ref赋值给另一个引用a_ref，其实就是把b赋值给了a. cout << a_ref << " " << b_ref << endl; a_ref = b_ref; cout << a_ref << " " << b_ref << endl; cout << a << " " << b << endl; cout << endl; 　//纵然对一个引用a_ref取地点，取得也是a的地点。已经“恶鬼附体”了:) p = &a; q = &a_ref; cout << p << " " << q << endl; cout << endl; //下面这段代码展示了指针与引用的差异 p = &a; q = &b; cout << p << " "<< q << endl; p = q; cout << p << " "<< q << endl; cout << endl; system("pause"); }

下面是运行的功效，以供参考：

10 20 20 20 20 20 0012FED4 0012FED4 0012FED4 0012FEBC 0012FEBC 0012FEBC四、声明和表达式的干系

#p#分页标题#e#

这里想说明的是，阐明一个声明可以把它看作一个表达式，凭据表达式中的运算符优先级顺序来声明。好比int (&arr)[100]，你首先要找到声明器arr，那么&arr说明arr是一个引用。什么引用呢？在看括号外面，[]说明白这一个数组，100说明这个数组有100个元素，前面的int说明白这个数组的每个元素都是int型的。所以，这个声明的意思就是：arr就是指向具有100个int型元素的数组的引用。假如你以为这种领略很艰涩，那你就不妨用typedef来简化声明中的巨大的运算符优先级干系，好比下面的形式就很好领略，其结果是和最初的谁人例子是一样的：

#include <iostream> using namespace std; typedef int INTARR[100]; //这个，这个...也可以用表达式来领略，有点“GNU is not UNIX“的味道是吧？ void Foo(INTARR &arr)　　//noh,这样看就很大白了，就是传了个引用进去 { cout << "pass by reference: " << sizeof(arr) << endl; } void main() { INTARR a;　　　　　　//用范例别名来界说a INTARR &a_ref=a;　　 //用范例别名来界说引用a_ref cout << "In main function : " << sizeof(a) << endl; Foo(a); system("pause"); }

#p#副标题#e#

大了局

吐沫星乱飞了半天，各人感受还好吧，快竣事了，各人再忍耐一下。看看下面这段措施：

#include <iostream> using namespace std; void main() { int a[100]; int * pa = a; int (&a_ref)[100] = a; cout << sizeof(a) << endl; cout << sizeof(pa) << endl; cout << sizeof(a_ref) << endl; system("pause"); }　　怎么样，是不是对输出功效感想很自然呢？假如是，那就好办了。我总结一下就下课哈！^_^ 数组名在表达式中，往往被看成是指向首元素a[0]地点的指针，可是在sizeof(a)中，返回的功效是数组a占用内存的巨细；pa是指向a的指针，他也指向a[0]，可是sizeof(pa)中，返回功效是pa这个指针所占内存空间的巨细，之所以这样，因为pa这个指针和数组a的团结不足细密，属于会见数组a的第二被选方案；a_ref这个引用，就是对数组a的引用，就像“恶鬼附体”一样，一旦附体附上了，你怎么也甩不掉它，对它的任何操纵，全部都反应在a上。在看本文最初的谁人例子，比这个例子所增加的操纵就是函数实参到形参的通报，我们在上面说过了，从实参到形参的通报可以看作是把实参赋值给形参。所以本文最初的谁人例子，其实际的操纵进程就和本文最后的这个例子是一样的。所以，并非函数把数组给“降阶”了，而是它原原本本就该这样，千万不必奇怪。 :p

意犹未尽，在PS一段：在C语言中，没有引用，是怎么办理这种问题呢。下面是常用的几种作法：

通报数组的时候，在增加一个参数，用来记录数组的元素个数可能长度。main(int argc, char ** args)就是这种做法；这种要领还可以防备溢出，安详性较量高。

在数组的最后一个有效元素后头作一个符号，指明数组已经竣事了。C语言顶用char数组暗示字符串，传给相关的字符串函数，用的就是这种做法。这种要领担保了C的所谓字符串是无限长度的，因为用一个变量暗示数组的长度的话，终归会受到这个变量范例的限制，例如说这个变量是unsigned byte型的，那么字符串长度就不能高出256，不然这个变量就溢出了。

#p#分页标题#e#

对付多维数组，凡是的要领是在最后一个有效维后头做一行符号，好比a[3][3]={{1,0,2},{2,2,5},{-1,-1,-1}}。假如我的措施用不到-1，我可以拿-1来填充最后一行，作为符号。这样在函数内部检测到某一维的元素都是-1，就说明到底了。

要领是机动多变的，要害看人怎么用了。C老爹Dennis Ritchie曾经说过：C诡异怪僻，缺陷重重，却得到了庞大的乐成。

注1：本文将不再引用“降阶”这个术语，原因是我认为这个“降阶”的观念有种把雷同2维数组压扁到1维的意思，其实本文接头的并不是这个问题，本文接头的是数组形参通报进程中数组长度损失的问题（这么说也禁绝确，照旧看文中的接头吧）。

注2：C语言的编译器碰着数组元素arr[i]，就会替换成*(arr+i)的形式。

关键字：