副标题#e#
楔子
去年,周星星年迈曾经在VCKBASE/C++论坛颁发过一篇文章“数组引用"以制止"数组降阶”,其时我不能深入领略这种用法的寄义;时隔一年,我的常识有几经锻炼,终于对此文章渐有所悟,所以把吾所知作想具体道来,竟也成了一篇文章。但愿本文能对新手有所启迪,同时也但愿各人发明本文中的疏漏之处后不惜留言指教。
故事发源于周星星年迈给出的两个Demo,为了节减处所,我把两个Demo合二为一,也能说明同样的问题:
#include <iostream>
其运行功效如下:
using namespace std;
void Foo1(int arr[100])
{
cout << "pass by pointer: " << sizeof(arr) << endl;
}
void Foo2(int (&arr)[100])
{
cout << "pass by reference: " << sizeof(arr) << endl;
}
void main()
{
int a[100];
cout << "In main function : " << sizeof(a) << endl;
Foo1(a);
Foo2(a);
}In main function : 400
pass by pointer: 4
pass by reference: 400
这段代码说明白,假如数组形参是数组名形式(可能指针形式,下文接头)时,利用sizeof运算符,将得不到本来数组的长度;假如用通报原数组引用的要领,则没有问题。
这段代码简直很难领略,因为这短短的十几行涉及到了形参加实参的干系、数组名和指针的干系、引用的意义、声名和表达式的干系这4大类问题,只要有1层次解不透、可能领略不正确,就领略不透上面的这段代码。本文也就从这4个问题入手,把这4个问题首先办理掉,然后再探讨上面的这段代码。固然这样看来极端繁复,可是我认为从根上入手来领略、进修,是条似远实近的阶梯。
一、函数形参和实参的干系
void Foo(int a);
Foo(10);
这里的a叫做形式参数(parameter),简称形参;这里的10叫做实际参数(argument),简称实参。形参和式参之间是什么干系呢?他们是赋值的干系,也就是说:把实参通报给形参的进程,可以看作是把实参赋值给形参的进程。上面的例子中,实参10通报给形参a,就相当于a=10;这个赋值的进程。(因为数据范例多的很,无法举例子举全面,所以这里就不举例子了;假如以为欠好领略,就在vc中写个sample调试一下各类数据范例的环境,你就可以或许验证这个结论了。)
二、数组名和指针的干系
这个问题是个汗青性的问题了,在C语言中,数组名是看成指针来处理惩罚的。更确切的说,数组名就是指向数组首元素地点的指针,数组索引就是距数组首元素地点的偏移量。领略这一点很重要,很大都组应用的问题就是有此而起的。这也就是为什么C语言中的数组是从0开始计数,因为这样它的索引就较量好对应到偏移量上。在C语言中,编译进程中碰着有数组名的表达式,城市把数组名替换成指针来处理惩罚;编译器甚至无法区分a[4]和4[a]的区别!*2 可是下面这一点需要留意:
int a[100];
int *b;
这两者并不等价,第一句话声明白数组a,并界说了这个数组,它有100个int型元素,sizeof(a)将获得整个数组所占的内存巨细,是400;第二句话只是声明并界说了一个int型的指针,sizeof(b)将获得这个指针所占的内存巨细,是4。所以说,固然数组名在表达式中一般会看成指针来处理惩罚,可是数组名和指针照旧有差距的,最起码有a==&a[0]可是sizeof(a)!=sizeof(a[0])。
而且在ANSI C尺度中,也明文划定:在函数参数的声明中,数组名北边一起看成指向该数组第一个元素的指针。所以,下面的几种书写形式是等效的:
void Foo1(int arr[100]){}
void Foo2(int arr[]){}
void Foo3(int *arr){}
C++尽大概的全面兼容C语言,所以这一部门的语法沟通。
#p#副标题#e#
三、引用的意义
“引用“是C++中引进的观念,C语言中没有。它的目标在于,在某些方面代替指针。假如你认为引用和指针并无大差异,必定会为指针报不服,颇有一种“即生亮何生瑜”的感应;可是,引用确实有新的特色,也确实在许多处所的表示和指针有所差异,本文就是一例。利用引用,我们要掌握这它最最最重要的一点,这也是它和指针最大的区别:引用一经界说,就和被它引用的变量牢牢地团结在一起,再不分隔,对引用的任何操纵都反应在它引用的变量上;而指针,只是会见它指向变量的另一种方法,两者虽有接洽,可是并不像引用那样密不行分。:)
#include <iostream>
using namespace std;
void main()
{
int a = 10;
int & a_ref = a;
int b = 20;
// 界说引用时就要初始化,说明引用跟它指向的元素密不行分
//int & b_ref ; // error C2530: ''b_ref'' : references must be initialized
int & b_ref = b;
int * p;
int * q;
//下面的功效证明白:引用一经界说,就不能再指向其他方针;
//把一个引用b_ref赋值给另一个引用a_ref,其实就是把b赋值给了a.
cout << a_ref << " " << b_ref << endl;
a_ref = b_ref;
cout << a_ref << " " << b_ref << endl;
cout << a << " " << b << endl;
cout << endl;
//纵然对一个引用a_ref取地点,取得也是a的地点。已经“恶鬼附体”了:)
p = &a;
q = &a_ref;
cout << p << " " << q << endl;
cout << endl;
//下面这段代码展示了指针与引用的差异
p = &a;
q = &b;
cout << p << " "<< q << endl;
p = q;
cout << p << " "<< q << endl;
cout << endl;
system("pause");
}
下面是运行的功效,以供参考:
10 20
四、声明和表达式的干系
20 20
20 20
0012FED4 0012FED4
0012FED4 0012FEBC
0012FEBC 0012FEBC
#p#分页标题#e#
这里想说明的是,阐明一个声明可以把它看作一个表达式,凭据表达式中的运算符优先级顺序来声明。好比int (&arr)[100],你首先要找到声明器arr,那么&arr说明arr是一个引用。什么引用呢?在看括号外面,[]说明白这一个数组,100说明这个数组有100个元素,前面的int说明白这个数组的每个元素都是int型的。所以,这个声明的意思就是:arr就是指向具有100个int型元素的数组的引用。假如你以为这种领略很艰涩,那你就不妨用typedef来简化声明中的巨大的运算符优先级干系,好比下面的形式就很好领略,其结果是和最初的谁人例子是一样的:
#include <iostream>
using namespace std;
typedef int INTARR[100]; //这个,这个...也可以用表达式来领略,有点“GNU is not UNIX“的味道是吧?
void Foo(INTARR &arr) //noh,这样看就很大白了,就是传了个引用进去
{
cout << "pass by reference: " << sizeof(arr) << endl;
}
void main()
{
INTARR a; //用范例别名来界说a
INTARR &a_ref=a; //用范例别名来界说引用a_ref
cout << "In main function : " << sizeof(a) << endl;
Foo(a);
system("pause");
}
大了局
吐沫星乱飞了半天,各人感受还好吧,快竣事了,各人再忍耐一下。看看下面这段措施:
#include <iostream>
怎么样,是不是对输出功效感想很自然呢?假如是,那就好办了。我总结一下就下课哈!^_^ 数组名在表达式中,往往被看成是指向首元素a[0]地点的指针,可是在sizeof(a)中,返回的功效是数组a占用内存的巨细;pa是指向a的指针,他也指向a[0],可是sizeof(pa)中,返回功效是pa这个指针所占内存空间的巨细,之所以这样,因为pa这个指针和数组a的团结不足细密,属于会见数组a的第二被选方案;a_ref这个引用,就是对数组a的引用,就像“恶鬼附体”一样,一旦附体附上了,你怎么也甩不掉它,对它的任何操纵,全部都反应在a上。在看本文最初的谁人例子,比这个例子所增加的操纵就是函数实参到形参的通报,我们在上面说过了,从实参到形参的通报可以看作是把实参赋值给形参。所以本文最初的谁人例子,其实际的操纵进程就和本文最后的这个例子是一样的。所以,并非函数把数组给“降阶”了,而是它原原本本就该这样,千万不必奇怪。 :p
using namespace std;
void main()
{
int a[100];
int * pa = a;
int (&a_ref)[100] = a;
cout << sizeof(a) << endl;
cout << sizeof(pa) << endl;
cout << sizeof(a_ref) << endl;
system("pause");
}
意犹未尽,在PS一段:在C语言中,没有引用,是怎么办理这种问题呢。下面是常用的几种作法:
通报数组的时候,在增加一个参数,用来记录数组的元素个数可能长度。main(int argc, char ** args)就是这种做法;这种要领还可以防备溢出,安详性较量高。
在数组的最后一个有效元素后头作一个符号,指明数组已经竣事了。C语言顶用char数组暗示字符串,传给相关的字符串函数,用的就是这种做法。这种要领担保了C的所谓字符串是无限长度的,因为用一个变量暗示数组的长度的话,终归会受到这个变量范例的限制,例如说这个变量是unsigned byte型的,那么字符串长度就不能高出256,不然这个变量就溢出了。
#p#分页标题#e#
对付多维数组,凡是的要领是在最后一个有效维后头做一行符号,好比a[3][3]={{1,0,2},{2,2,5},{-1,-1,-1}}。假如我的措施用不到-1,我可以拿-1来填充最后一行,作为符号。这样在函数内部检测到某一维的元素都是-1,就说明到底了。
要领是机动多变的,要害看人怎么用了。C老爹Dennis Ritchie曾经说过:C诡异怪僻,缺陷重重,却得到了庞大的乐成。
注1:本文将不再引用“降阶”这个术语,原因是我认为这个“降阶”的观念有种把雷同2维数组压扁到1维的意思,其实本文接头的并不是这个问题,本文接头的是数组形参通报进程中数组长度损失的问题(这么说也禁绝确,照旧看文中的接头吧)。
注2:C语言的编译器碰着数组元素arr[i],就会替换成*(arr+i)的形式。