一、关于可变参数的函数定义方法
注:本节原文摘自互联网,笔者对它进行了必要的编辑和扩展。原作者尚未查知,在此表示歉意和感谢。
某些情况下希望函数的参数个数可以根据需要确定。典型的例子有大家熟悉的函数printf()、scanf()和系统调用execl()等。那么它们是怎样实现的呢?C编译器通常提供了一系列处理这种情况的宏,以屏蔽不同的硬件平台造成的差异,增加程序的可移植性。这些宏包括va_start、 va_arg和va_end等。
1. 采用ANSI标准形式时,参数个数可变的函数的原型声明是:
- type funcname(type para1, type para2, ...)
这种形式至少需要一个普通的形式参数,后面的省略号不表示省略,而是函数原型的一部分。type是函数返回值和形式参数的类型。
2. 采用与UNIX System V兼容的声明方式时,参数个数可变的函数原型是:
- type funcname(va_alist)
- va_dcl
这种形式不需要提供任何普通的形式参数。type是函数返回值的类型。va_dcl是对函数原型声明中参数va_alist的详细声明,实际是一个宏定义,对不同的硬件平台采用不同的类型来定义,但在最后都包括了一个分号。因此va_dcl后不再需要加上分号了。va_dcl在代码中必须原样给出。 va_alist在VC中可以原样给出,也可以略去。
此外,采用头文件stdarg.h编写的程序是符合ANSI标准的,可以在各种操作系统和硬件上运行;而采用头文件varargs.h的方式仅仅是为了与以前的程序兼容。所以建议大家使用前者。以下主要就前一种方式对参数的处理做出说明。两种方式的基本原理是一致的,只是在语法形式上有一些细微的区别。
- /* 取第一个可变参数的指针给arg_ptr
- last_firm_arg是函数声明中最后一个固定参数,该
- 宏参方便编译器定位第一个可变参数的地址,因为在函数
- 调用的栈结构中,可变参数总是在因定参数的后面 */
- void va_start( va_list arg_ptr, last_firm_arg );
- /* 返回arg_ptr指定的当前可变参数的值,然后arg_ptr指向下一参数
- cur_arg_type是当前参数的类型,如int,该
- 宏参方便编译器定位下一可变参数的地址
- 注意支持的类型为int和double,这是一个陷井,下文将详述
- 可循环调用此宏得到N个参数值 */
- cur_arg_type va_arg( va_list arg_ptr, cur_arg_type );
- /* arg_ptr置为NULL */
- void va_end( va_list arg_ptr );
va_start使argp指向第一个可选参数。va_arg返回参数列表中的当前参数并使argp指向参数列表中的下一个参数。va_end把argp指针清为NULL。函数体内可以多次遍历这些参数,但是都必须以va_start开始,并以va_end结尾。
调用者在实际调用参数个数可变的函数时,要通过一定的方法指明实际参数的个数(编注:实际上,每个参数的数据类型(占用字节数)也需要以一定的方法指明,如采用默认类型或以固参指明类型,printf()的首参——格式化字串中的类型格式符%d、%f、%s等就是显式指明的),例如把最后一个参数置为空字符串(系统调用execl()就是这样的)、-1或其他的方式(函数printf()就是通过第一个参数,即输出格式的定义来确定实际参数的个数的)。
下面给出一个具体的例子。是采用了符合ANSI标准的形式的代码。代码中加了一些注释,这里就不再解释了。该例子已经在VC/Windows XP、CC/AIX4.3.2.0、GCC/SUSE7.3环境下编译并正常运行。
演示如何使用参数个数可变的函数,采用ANSI标准形式
- #include < stdio.h >;
- #include < string.h >;
- #include < stdarg.h >;
- /* 函数原型声明,至少需要一个确定的参数, 注意括号内的省略号 */
- int demo( char *, ... );
- void main( void )
- {
- demo("DEMO", "This", "is", "a", "demo!", "\0");
- }
- /* ANSI标准形式的声明方式,括号内的省略号表示可选参数 */
- int demo( char *msg, ... )
- {
- va_list argp; /* 定义保存函数参数的结构 */
- int argno = 0; /* 纪录参数个数 */
- char *para; /* 存放取出的字符串参数 */
- /* argp指向传入的第一个可选参数,
- msg是最后一个确定的参数 */
- va_start( argp, msg );
- while (1)
- {
- /* 取出当前的参数,类型为char *. */
- para = va_arg( argp, char *);
- /* 采用空串指示参数输入结束 */
- if ( strcmp( para, "\0") == 0 )
- break;
- printf("Parameter #%d is: %s\n", argno, para);
- argno++;
- }
- va_end( argp ); /* 将argp置为NULL */
- return 0;
- }
二、可变参类型陷井
下面的代码是错误的,运行时得不到预期的结果:
- va_start(pArg, plotNo);
- fValue = va_arg(pArg, float); // 类型应改为double,不支持float
- va_end(pArg);
下面列出va_arg(argp, type)宏中不支持的type:
—— char、signed char、unsigned char
—— short、unsigned short
—— signed short、short int、signed short int、unsigned short int
—— float
在 C语言中,调用一个不带原型声明的函数时,调用者会对每个参数执行“默认实际参数提升(default argument promotions)”。该规则同样适用于可变参数函数——对可变长参数列表超出最后一个有类型声明的形式参数之后的每一个实际参数,也将执行上述提升工作。
提升工作如下:
——float类型的实际参数将提升到double
——char、short和相应的signed、unsigned类型的实际参数提升到int
——如果int不能存储原值,则提升到unsigned int
然后,调用者将提升后的参数传递给被调用者。
所以,可变参函数内是绝对无法接收到上述类型的实际参数的。
关于该陷井,C/C++著作中有以下描述:
在《C语言程序设计》对可变长参数列表的相关章节中,并没有提到这个陷阱。但是有提到默认实际参数提升的规则:
在没有函数原型的情况下,char与short类型都将被转换为int类型,float类型将被转换为double类型。
——《C语言程序设计》第2版 2.7 类型转换 p36
在其他一些书籍中,也有提到这个规则:
事情很清楚,如果一个参数没有声明,编译器就没有信息去对它执行标准的类型检查和转换。
在这种情况下,一个char或short将作为int传递,float将作为double传递。
这些做未必是程序员所期望的。
脚注:这些都是由C语言继承来的标准提升。
对于由省略号表示的参数,其实际参数在传递之前总执行这些提升(如果它们属于需要提升的类型),将提升后的值传递给有关的函数。——译者注
——《C++程序设计语言》第3版-特别版 7.6 p138
…… float类型的参数会自动转换为double类型,short或char类型的参数会自动转换为int类型 ……
——《C陷阱与缺陷》 4.4 形参、实参与返回值 p73
这里有一个陷阱需要避免:
va_arg宏的第2个参数不能被指定为char、short或者float类型。
因为char和short类型的参数会被转换为int类型,而float类型的参数会被转换为double类型 ……
例如,这样写肯定是不对的:
c = va_arg(ap,char);
因为我们无法传递一个char类型参数,如果传递了,它将会被自动转化为int类型。上面的式子应该写成:
c = va_arg(ap,int);
——《C陷阱与缺陷》p164