• 二维数组作为函数参数传递剖析(转载)


    前言

      很多文章不外乎告诉你下面这几种标准的形式,你如果按照它们来用,准没错:

    复制代码
    //对于一个2行13列int元素的二维数组
    //函数f的形参形式
    f(int daytab[2][13]) {...}
    
    //以下两种可以忽略行数
    f(int daytab[][13]) {...}
    
    f(int (*daytab)[13]) {...}
    复制代码

      甚至会有人告诉你多维数组作为参数传递可以省略第一维,其他维不能省略。然而你对这种形式并不满意:如果事先限定了二维数组的大小,函数的泛用性就要大打折扣了。因为你真正需要的,是可以处理事先未知行数和列数的二维数组的函数。当然也有文章提到类似下面的动态分配的方式,但作为函数参数传递有时不能成功,令人疑惑。

    int **array;//array[M][N]
    array = (int **)malloc(M *sizeof(int *));
    for(i=0;i<M;i++)
        array[i] = (int *)malloc(N *sizeof(int));

      本文目的是深入剖析各个形式的二维数组,以及为了进行参数传递,如何写函数的形参表。更高维的数组可以做类似的推广。

      下面先进行分析,文中讨论的地址空间是虚拟地址空间,是程序员看到的地址空间,不是实际的物理地址空间。


    1.基本形式:二维数组在栈上分配,各行地址空间连续,函数参数使用文首提到的3种形式

      最初接触二维数组时,可能只是在main()或某个函数里进行声明,然后直接使用:

    复制代码
        ...
        int array[M][N];
      //array[][N] ={{...},...,{...}}; is ok
      //array[][] = {{...},...,{...}}; is wrong
    
    
    
    
       ...
    //使用array[m][n]

    复制代码

      这种分配是在栈上进行的,能够保证所有元素的地址空间连续。这样,array[i][j] 和 *(*(array +i) +j)是一样的,程序是知道array+i的i实际上偏移了i*N个单位,这也导致了在二维数组array[3][3]中,使用下标array[2][1]和array[1][4]是访问的同一个元素,尽管后者的下标对于一个3*3矩阵来说是非法的,但这并不影响访问。

      这种形式,无论是数组定义还是函数都不够泛用,两个维度在编译前就定好了,唯一可以做的就是把维度M、N声明为宏或者枚举类型,但这仍不能避免每次修改后都要重新编译。


    2.数组传参形式:二维数组在栈上分配,各行地址空间连续,函数参数使用指针形式

      当把这种二维数组的指针直接作为参数传递时,数组名退化为指针,函数并不知道数组的列数,N对它来说是不可见的,即使使用*(*(array +i) +j),第一层解引用失败。这时,编译器会报warning,运行生成的文件会发生segment fault。那么,为了指导这个函数如何解引用,也就是人为地解引用,需要把这个二维数组的首元素地址传给函数,于是就变成了下面的形式:

    复制代码
    #include <stdio.h>
    #include <stdlib.h>
    #include <assert.h>
    int func(int *array, int m, int n) {
        int i,j;
        for(i=0;i<m;i++) {
            for(j=0;j<n;j++)
                printf("	%d", *(array +i*n +j));
            printf("
    ");
        }
        return 0;
    }
    
    int main(int argc,char** argv) {
        int m=3,n=3,i;
        int array[][3] = {{1,2,3},{4,5,6},{7,8,9}};
        func(*array,m,n);
        return 0;
    }
    复制代码

      也可以写成

    复制代码
    int fun(int *array,int m,int n) {
        int i,j;
        for(i=0;i<m;i++)
            for(j=0;j<n;j++)
                printf("%d ", *((int*)array + n*i + j));
        return 0;
    }
    int main() {
        int array[3][3] = {
            {1,2,3},
            {4,5,6},
            {7,8,9}
        };
        fun((int *)array,3,3);
        return 0;
    }
    复制代码

      但是意图没有上一种清晰,并不推荐。

      你可能会问,为什么下面的不行?原因其实和上面提到的一样,第一次解引用时,函数并不知道数组的列数,从而导致失败。准确的说,是因为数组实际类型是int [3][3],在作为右值时可以被转化为int (*)[3],它们都和int **不同,自然不可用。(感谢garbageMan在回复中指出)

    复制代码
    int func(int **array, int m, int n) {
        ...
        printf("	%d", *(*array +i*n +j));
        ...
    }
    
    int main() {
      int array[3][3] = {
            {1,2,3},
            {4,5,6},
            {7,8,9}
        };
        ... 
        func(array,3,3);
      ... 
    }
    复制代码

    3.动态数组形式:二维数组在堆上分配,各行地址空间不一定连续,函数参数使用指针形式

      第2种虽然函数参数的限定降低了,但仍需要在栈上预先分配一定大小的二维数组,程序整体并不是完全的泛用。为了进一步提高泛用性,把二维数组空间的分配也动态化,使用malloc()在堆上分配空间,重复一下前言中的方式如下:

    int **array;
    array = (int **)malloc(m *sizeof(int *));
    for(i=0;i<M;i++)
        array[i] = (int *)malloc(n *sizeof(int));

      这时,在分配空间的作用域里,对0<=i<M,0<=j<N,array[i][j]的访问完全没有问题。那么,对应地,函数写作

    int func(int **array,int m,int n) {
        ...
        printf("%d ", *(*(array+i)+j));
        ...
    }

      值得注意的是,虽然malloc()每次分配的空间在地址上是连续的,但是多次malloc()分配的空间之间并不一定是连续的,这与在栈上分配的二维矩阵有着根本的不同,对于二维数组array[3][3],不能再用array[1][4]来访问array[2][1]了,前者地址越界。


    4.折中形式:用堆上分配的一维数组表示二维数组,函数参数使用指针形式

      用一维数组来实现二维数组,是一种折中方案,但是很好理解,也不易出错。这样分配的数组空间是连续的。使用时需要把两维下标转化为一维下标。

    复制代码
    #include <stdio.h>
    #include <stdlib.h>
    #include <assert.h>
    int func(int *array, int m, int n) {
        int i,j;
        for(i=0;i<m;i++) {
            for(j=0;j<n;j++)
                printf("	%d",*(array+i*n+j));
            printf("
    ");
        }
        return 0;
    }
    
    int main(int argc,char** argv) {
        int m,n,i;
        int *array;
        assert(argc == 3);
        m = atoi(argv[1]);
        n = atoi(argv[2]);
        array = (int*)malloc(m*n*sizeof(int));
        for(i=0;i<m*n;i++)
            array[i] = i;
        func(array,m,n);
        return 0;
    }
    复制代码

     5.较新的编译器:用栈上分配的直到执行时才确定大小的二维数组

      C90不支持这种形式,C99支持,因此一些较新的编译器可以对下面的代码进行执行。注意print()的参数顺序不能改变。

    复制代码
    void print(int x, int y, int a[x][y]){
        printf("
    ");
        int i, j;
        for(i = 0; i < x; i++){
            for(j = 0; j < y; j++)
                printf("%d     ", a[i][j]);
            printf("
    ");
        }
    }
    
    // Function to initialize the two-dimensional array
    void init_2d(int *a, int x, int y){
        int i, j;
        for(i = 0; i < x; i++){
            for(j = 0; j < y; j++){
                a[i*y + j] = i + j;
            }
            printf("
    ");
        }
    }
    
    int main(){
        int m , n ;
        scanf("%d %d",&m,&n);
        int a[m][n];  // a two dimensional whose size has been defined using variables
        init_2d(a, m, n);
        print(m, n, a);
    }
    复制代码

      这段代码出自http://stackoverflow.com/questions/17181577/two-dimensional-arrays-in-c

      (2013.7.28更新)

       另外,这种分配方式仍然是在栈上,相关讨论可见于http://bbs.csdn.net/topics/90350681

      

    小结

    • 其实所谓的二维数组,在K&R上只是指预先分配好大小的形如int a[M][M]这样的数组,它存在于栈上;而实际使用的在堆空间利用malloc动态分配空间的并不是这种,只是用的人多了,把后者叫成二维数组了(我不认为把后者也称为二维数组是标准的说法)。再加上我们经常用它来处理矩阵,“标准的”二维数组、“动态的”“二维数组”、矩阵这三个概念就混在了一起。矩阵是可以用这两种二维数组表示的,而对于这两种不同的二维数组,函数传参的方式也不完全相同,不能随意混用。
    • C99对于多维数组的描述:

      If E is an n -dimensional array ( n ≥ 2) with dimensions i × j × ... × k , then E (used as other than an lvalue) is converted to a pointer to an ( n − 1)-dimensional array with dimensions j × ... × k . If the unary * operator is applied to this pointer explicitly, or implicitly as a result of subscripting, the result is the pointed-to ( n − 1)-dimensional array which itself is converted into a pointer if used as other than an lvalue. It follows from this
      that arrays are stored in row-major order (last subscript varies fastest).

    • 栈上分配的二维数组数组名int array[3][3]的真实类型是int [ ][ ],在作为右值时才被转化为(int *array)[N] (感谢 garbageMan指出),和int **是不同的。把前者进行强制转换为后者,在函数中对元素操作也会导致段错误,下面用图来说明二者区别:

      


    作者:五岳 
    出处:http://www.cnblogs.com/wuyuegb2312 
    对于标题未标注为“转载”的文章均为原创,其版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

  • 相关阅读:
    CSS 控制table 滑动及调整列宽等问题总结
    Java读取properties文件
    水晶报表打印
    C# 运行时序列化
    C#attribute-----------初级
    c# 单元测试工程如何取得当前项目路径
    C# 字段、属性、成员变量
    水晶报表主子报表分页问题
    从0打卡leetcode之day 3 -- 最大子序列和
    从零打卡leetcode之day 2---两数相加
  • 原文地址:https://www.cnblogs.com/bixiaopengblog/p/8437148.html
Copyright © 2020-2023  润新知