• 彻底了解指针数组,数组指针,以及函数指针,以及堆中的分配规则


    摘自:http://luluww.bokee.com/3010083.html


    2004年7月31日星期六 第二次更新,增加了对象的堆内存分配,细化了指针数组和数组指针内存的说明 !

    昨天给0405班辅导,当他们问我指针数组的问题的时候,由于好久没用,感觉有些陌生了,所以今天归纳总结了一下,希望以后的朋友可以少走些弯路:)
    一 :关于指针和堆的内存分配
    先来介绍一下指针 : 指针一种类型,理论上来说它包含其他变量的地址,因此有的书上也叫它:地址变量。既然指针是一个类型,是类型就有大小,在达内的服务器上或者普通的PC机上,都是4个字节大小,里边只是存储了一个变量的地址而已。不管什么类型的指针,char * ,int * ,int (*) ,string * ,float * ,都是说明了本指针所指向的地址空间是什么类型而已,了解了这个基本上所有的问题都好象都变的合理了。

    在C++中,申请和释放堆中分配的存贮空间,分别使用new和delete的两个运算符来完成:
    指针类型 指针变量名=new 指针类型 (初始化);
            delete 指针名;
    例如:1、 int *p=new int(0);
         它与下列代码序列大体等价:
    2、int tmp=0, *p=&tmp;
    区别:p所指向的变量是由库操作符new()分配的,位于内存的堆区中,并且该对象未命名。
      
    下面是关于new 操作的说明 : 部分引自<<C++面向对象开发>>
    1、new运算符返回的是一个指向所分配类型变量(对象)的指针。对所创建的变量或对象,都是通过该指针来间接操作的,而动态创建的对象本身没有名字。
    2、一般定义变量和对象时要用标识符命名,称命名对象,而动态的称无名对象(请注意与栈区中的临时对象的区别,两者完全不同:生命期不同,操作方法不同,临时变量对程序员是透明的)。
    3、堆区是不会在分配时做自动初始化的(包括清零),所以必须用初始化式(initializer)来显式初始化。new表达式的操作序列如下:从堆区分配对象,然后用括号中的值初始化该对象。

    下面是从堆中申请数组
    1、申请数组空间:
    指针变量名=new 类型名[下标表达式];
    注意:“下标表达式”不是常量表达式,即它的值不必在编译时确定,可以在运行时确定。这就是堆的一个非常显著的特点,有的时候程序员本身都不知道要申请能够多少内存的时候,堆就变的格外有用。
    2、释放数组空间:
    delete [ ]指向该数组的指针变量名;
    注意:方括号非常重要的,如果delete语句中少了方括号,因编译器认为该指针是指向数组第一个元素的,会产生回收不彻底的问题(只回收了第一个元素所占空间),我们通常叫它“内存泄露”,加了方括号后就转化为指向数组的指针,回收整个数组。delete [ ]的方括号中不需要填数组元素数,系统自知。即使写了,编译器也忽略。<<Think in c++>>上说过以前的delete []方括号中是必须添加个数的,后来由于很容易出错,所以后来的版本就改进了这个缺陷。
    下面是个例子,VC上编译通过
    #include<iostream>
    using namespace std;
    //#include <iostream.h>  //for VC
    #include <string.h>
    void main(){
    int n;
    char *p;
    cout<<"请输入动态数组的元素个数"<<endl;
    cin>>n; //n在运行时确定,可输入17
    p=new char[n]; //申请17个字符(可装8个汉字和一个结束符)的内存空间strcpy(pc,“堆内存的动态分配”);//
    cout<<p<<endl;
    delete []p;//释放pc所指向的n个字符的内存空间return ; }

    通过指针使堆空间,编程中的几个可能问题

    1.动态分配失败。返回一个空指针(NULL),表示发生了异常,堆资源不足,分配失败。
       data = new double [m]; //申请空间
    if ((data ) == 0)…… //或者==NULL
    2.指针删除与堆空间释放。删除一个指针p(delete p;)实际意思是删除了p所指的目标(变量或对象等),释放了它所占的堆空间,而不是删除p本身,释放堆空间后,p成了空悬指针,不能再通过p使用该空间,在重新给p赋值前,也不能再直接使用p。
    3.内存泄漏(memory leak)和重复释放。new与delete 是配对使用的, delete只能释放堆空间。如果new返回的指针值丢失,则所分配的堆空间无法回收,称内存泄漏,同一空间重复释放也是危险的,因为该空间可能已另分配,而这个时候又去释放的话,会导致一个很难查出来的运行时错误。所以必须妥善保存new返回的指针,以保证不发生内存泄漏,也必须保证不会重复释放堆内存空间。
    4.动态分配的变量或对象的生命期。无名变量的生命期并不依赖于建立它的作用域,比如在函数中建立的动态对象在函数返回后仍可使用。我们也称堆空间为自由空间(free store)就是这个原因。但必须记住释放该对象所占堆空间,并只能释放一次,在函数内建立,而在函数外释放是一件很容易失控的事,往往会出错,所以永远不要在函数体内申请空间,让调用者释放,这是一个很差的做法。你再怎么小心翼翼也可能会带来错误。
    类在堆中申请内存 :
    通过new建立的对象要调用构造函数,通过deletee删除对象要调用析构函数。
    CGoods *pc;
    pc=new CGoods;  //分配堆空间,并构造一个无名对象
                                  //的CGoods对象;
    …….
    delete pc;  //先析构,然后将内存空间返回给堆;        堆对象的生命期并不依赖于建立它的作用域,所以除非程序结束,堆对象(无名对象)的生命期不会到期,并且需要显式地用delete语句析构堆对象,上面的堆对象在执行delete语句时,C++自动调用其析构函数。
    正因为构造函数可以有参数,所以new后面类(class)类型也可以有参数。这些参数即构造函数的参数。
    但对创建数组,则无参数,并只调用缺省的构造函数。见下例类说明:

    class CGoods{
              char Name[21];
              int  Amount;
              float Price;
              float Total_value;
    public:
     CGoods(){}; //缺省构造函数。因已有其他构造函数,系统不会再自动生成缺省构造,必须显式声明。   CGoods(char* name,int amount ,float price){
               strcpy(Name,name);
               Amount=amount;
               Price=price;
               Total_value=price*amount;  }
               ……};//类声明结束
    下面是调用机制 :

    void main(){
     int n;
     CGoods *pc,*pc1,*pc2;
     pc=new CGoods(“hello”,10,118000);
     //调用三参数构造函数   pc1=new CGoods();  //调用缺省构造函数  cout<<”输入商品类数组元素数”<<endl;
     cin>>n;
     pc2=new CGoods[n];
    //动态建立数组,不能初始化,调用n次缺省构造函数  
     ……
     delete pc;
     delete pc1;
     delete []pc2;  }

    申请堆空间之后构造函数运行;
    释放堆空间之前析构函数运行;
    再次强调:由堆区创建对象数组,只能调用缺省的构造函数,不能调用其他任何构造函数。如果没有缺省的构造函数,则不能创建对象数组。

    ---------------------下面我们再来看一下指针数组和数组指针―――――――――――――
    如果你想了解指针最好理解以下的公式 :
    (1)int*ptr;//指针所指向的类型是int

      (2)char*ptr;//指针所指向的的类型是char

      (3)int**ptr;//指针所指向的的类型是int* (也就是一个int * 型指针)

      (4)int(*ptr)[3];//指针所指向的的类型是int()[3] //二维指针的声明

    (1)指针数组:一个数组里存放的都是同一个类型的指针,通常我们把他叫做指针数组。
    比如 int * a[10];它里边放了10个int * 型变量,由于它是一个数组,已经在栈区分配了10个(int * )的空间,也就是32位机上是40个byte,每个空间都可以存放一个int型变量的地址,这个时候你可以为这个数组的每一个元素初始化,在,或者单独做个循环去初始化它。
    例子:
    int * a[2]={ new int(3),new int(4) };     //在栈区里声明一个int * 数组,它的每一个元素都在堆区里申请了一个无名变量,并初始化他们为3和4,注意此种声明方式具有缺陷,VC下会报错
    例如 :
    int * a[2]={new int[3],new int[3]};
    delete a[0];
    delet a[10];
    但是我不建议达内的学生这么写,可能会造成歧义,不是好的风格,并且在VC中会报错,应该写成如下 :
    int * a[2];
    a[0]= new int[3];
    a[1]=new int[3];
    delete a[0];
    delet a[10];
    这样申请内存的风格感觉比较符合大家的习惯;由于是数组,所以就不可以delete a;编译会出警告.delete  a[1];
    注意这里 是一个数组,不能delete [] ;
    ( 2 ) 数组指针 : 一个指向一维或者多维数组的指针;
    int * b=new int[10]; 指向一维数组的指针b ;
    注意,这个时候释放空间一定要delete [] ,否则会造成内存泄露, b 就成为了空悬指针.

    int (*b2)[10]=new int[10][10]; 注意,这里的b2指向了一个二维int型数组的首地址.
    注意:在这里,b2等效于二维数组名,但没有指出其边界,即最高维的元素数量,但是它的最低维数的元素数量必须要指定!就像指向字符的指针,即等效一个字符串,不要把指向字符的指针说成指向字符串的指针。这与数组的嵌套定义相一致。
    int(*b3) [30] [20];  //三级指针――>指向三维数组的指针;
    int (*b2) [20];     //二级指针;
    b3=new int [1] [20] [30];
    b2=new int [30] [20];
          两个数组都是由600个整数组成,前者是只有一个元素的三维数组,每个元素为30行20列的二维数组,而另一个是有30个元素的二维数组,每个元素为20个元素的一维数组。
          删除这两个动态数组可用下式:
    delete [] b3;  //删除(释放)三维数组;
    delete [] b2;  //删除(释放)二维数组;
    再次重申:这里的b2的类型是int (*) ,这样表示一个指向二维数组的指针。
    b3表示一个指向(指向二维数组的指针)的指针,也就是三级指针.

    ( 3 ) 二级指针的指针
    看下例 :
    int (**p)[2]=new (int(*)[3])[2];
           p[0]=new int[2][2];
           p[1]=new int[2][2];
           p[2]=new int[2][2];
           delete [] p[0];
           delete [] p[1];
           delete [] p[2];
           delete [] p;
    注意此地方的指针类型为int (*),碰到这种问题就把外边的[2]先去掉,然后回头先把int ** p=new int(*)[n]申请出来,然后再把外边的[2]附加上去;
    p代表了一个指向二级指针的指针,在它申请空间的时候要注意指针的类型,那就是int (*)代表二级指针,而int (**)顾名思义就是代表指向二级指针的指针了。既然是指针要在堆里申请空间,那首先要定义它的范围:(int(*)[n])[2],n 个这样的二级指针,其中的每一个二级指针的最低维是2个元素.(因为要确定一个二级指针的话,它的最低维数是必须指定的,上边已经提到)。然后我们又分别为p[0],p[1],p[2]…在堆里分配了空间,尤其要注意的是:在释放内存的时候一定要为p[0],p[1],p[2],单独delete[] ,否则又会造成内存泄露,在delete[]p 的时候一定先delete p[0]; delete p[1],然后再把给p申请的空间释放掉 delete [] p ……这样会防止内存泄露。

    (3)指针的指针;
    int ** cc=new (int*)[10]; 声明一个10个元素的数组,数组每个元素都是一个int *指针,每个元素还可以单独申请空间,因为cc的类型是int*型的指针,所以你要在堆里申请的话就要用int *来申请;
    看下边的例子  (vc & GNU编译器都已经通过);
           int ** a= new int * [2];     //申请两个int * 型的空间
           a[1]=new int[3];        //为a的第二个元素又申请了3个int 型空间,a[1]指向了此空间首地址处
           a[0]=new int[4];        ////为a的第一个元素又申请了4个int 型空间,a[0] 指向了此空间的首地址处
           int * b;
           a[0][0]=0;
           a[0][1]=1;
           b=a[0];
      delete [] a[0]       //一定要先释放a[0],a[1]的空间,否则会造成内存泄露.;
           delete [] a[1];
      delete [] a;
           b++;
           cout<<*b<<endl;       //随机数
    注意 :因为a 是在堆里申请的无名变量数组,所以在delete 的时候要用delete [] 来释放内存,但是a的每一个元素又单独申请了空间,所以在delete [] a之前要先delete [] 掉 a[0],a[1],否则又会造成内存泄露.
    (4) 指针数组 :
       
    我们再来看看第二种 :二维指针数组
    int *(*c)[3]=new int *[3][2];
    如果你对上边的介绍的个种指针类型很熟悉的话,你一眼就能看出来c是个二级指针,只不过指向了一个二维int * 型的数组而已,也就是二维指针数组。
    例子 :
     int *(*b)[10]=new int*[2][10];//
    b[0][0]=new int[100];
    b[0][1]=new int[100];
    *b[0][0]=1;
    cout <<*b[0][0]<<endl;    //打印结果为1
    delete [] b[0][0];
    delete [] b[0][1];
    delete [] b;
    cout<<*b[0][0]<<endl;    //打印随机数
     这里只为大家还是要注意内存泄露的问题,在这里就不再多说了。
    如果看了上边的文章,大家估计就会很熟悉,这个b是一个二维指针,它指向了一个指针数组

    第二种 :
    int **d[2];表示一个拥有两个元素数组,每一个元素都是int ** 型,这个指向指针的指针:)
       d不管怎样变终究也是个数组,呵呵,
       如果你读懂了上边的,那下边的声明就很简单了:
       d[0]=new int *[10];
       d[1]=new int * [10];
    delete [] d[0];
    delete [] d[1];
    具体的就不再多说了 :)
    二 : 函数指针 

    关于函数指针,我想在我们可能需要写个函数,这个函数体内要调用另一个函数,可是由于项目的进度有限,我们不知道要调用什么样的函数,这个时候可能就需要一个函数指针;

    int a();这个一个函数的声明;
    ing (*b)();这是一个函数指针的声明;
    让我们来分析一下,左边圆括弧中的星号是函数指针声明的关键。另外两个元素是函数的返回类型(void)和由边圆括弧中的入口参数(本例中参数是空)。注意本例中还没有创建指针变量-只是声明了变量类型。目前可以用这个变量类型来创建类型定义名及用sizeof表达式获得函数指针的大小:
    unsigned psize = sizeof (int (*) ()); 获得函数指针的大小
    // 为函数指针声明类型定义
    typedef int (*PFUNC) ();

    PFUNC是一个函数指针,它指向的函数没有输入参数,返回int。使用这个类型定义名可以隐藏复杂的函数指针语法,就我本人强烈建议我们大内弟子使用这种方式来定义;

    下面是一个例子,一个简单函数指针的回调(在GNU编译器上通过,在VC上需要改变一个头文件就OK了)

    #include<iostream>              //GNU 编译器 g++ 实现
    using namespace std;
    /*                              //vc 的实现
    #include "stdafx.h"
    #include <iostream.h>
    */

    #define DF(F) int F(){  cout<<"this is in function "<<#F<<endl;\
          return 0;       \
    }
    //声明定义DF(F)替代 int F();函数;
    DF(a); DF(b); DF(c); DF(d); DF(e); DF(f); DF(g); DF(h); DF(i);     //声明定义函数 a b c d e f g h i

    // int (*pfunc)();              //一个简单函数指针的声明
    typedef int(*FUNC)();   //一个函数指针类型的声明

    FUNC ff[] = {a,b,c,d,e,f,g,h,i};   //声明一个函数指针数组,并初始化为以上声明的a,b,c,d,e,f,g,h,i函数

    FUNC func3(FUNC vv){    //定义函数func3,传入一个函数指针,并且返回一个同样类型的函数指针
          vv();
          return vv;
    }

    /*FUNC func4(int (*vv)()){      //func3的另一种实现
          vv();
          return vv;
    }*/

    int main(){
          for(int i=0;i<sizeof(ff)/sizeof (FUNC);i++){  //循环调用函数指针
                  FUNC r=func3(ff[ i ]);
                  cout<<r()<<endl;                //输出返回值,只是返回了0
          }
          return 0;
    }
    到目前为止,我们只讨论了函数指针及回调而没有去注意ANSI C/C++的编译器规范。许多编译器有几种调用规范。如在Visual C++中,可以在函数类型前加_cdecl,_stdcall或者_pascal来表示其调用规范(默认为_cdecl)。C++ Builder也支持_fastcall调用规范。调用规范影响编译器产生的给定函数名,参数传递的顺序(从右到左或从左到右),堆栈清理责任(调用者或者被调用者)以及参数传递机制(堆栈,CPU寄存器等)。
    好了,先到此为止吧,写这篇文章耗费了基本上快半天的时间了,很多事情还没有做,等改天有时间再回来整理,所有的源程序都放在openlab3服务器上我的目录下lib/cpp下,大家可以去拿。不知道的登陆openlab3 然后cd ~chengx/lib/cpp就可以看到了。

    还有很复杂的声明可能也是一种挑战 比如<<Think in c++>>里的
    int (*(*f4())[10]();的声明,f4是一个返回指针的函数,该指针指向了含有10个函数指针的数组,这些函数返回整形值;不是这个函数有特别之处,而是Bruce Eckel 说的“从右到左的辨认规则”是一种很好的方法,值得我们去学习,感谢他:)

    最后我想应该跟大家说一下,写程序应该就象JERRY所说的:简单就是美;我们应该遵循一个原则 : KISS (Keep It Simple,Stupid ,尽量保持程序简单 出自 :《Practical C programming》),把自己的程序尽量的简单明了,这是个非常非常好的习惯。

    由于写的匆忙,可能其中有遗漏的地方,大家发现希望能指正:)
    GOOD LUCK !

  • 相关阅读:
    构建之法第九章
    九周总结学习笔记
    第一阶段对各组评价
    冲刺二阶段第八天
    冲刺二阶段第七
    冲刺二阶段第六天
    冲刺二阶段第五天
    构建之法第八章
    冲刺二阶段第四天
    冲刺二阶段第三天
  • 原文地址:https://www.cnblogs.com/CodeWorkerLiMing/p/12007742.html
Copyright © 2020-2023  润新知