Linux 系统上可用的C编译器是GNU C编译器,它建立在自由软件基金会的编程许可证的基础上,因此可以自由发布。GNU C对标准C 进行一系列扩展,以增强标准C的功能。
1、零长度数组
GNU C 允许使用零长度数组,多用在定义变长对象的头结构。
例如:
struct var_data { int len; char data[0]; };
char data[0] 仅仅意味着程序中通过 var_data 结构体实例的 data[index] 成员可以访问 len 之后的第 index 个地址,它并没有为 data[] 数组分配内存,因此 sizeof(struct var_data)=sizeof(int)。
假设 struct var_data 的数据域保存在 struct var_data 紧接着的内存区域,通过如下代码可以遍历这些数据:
struct var_data s; ... for (i=0;i<s.len;i++) { printf("%02x", s.data[i]); }
2、case范围
GNU C 支持 case x...y 这样的语法,区间[x,y]的数都会满足这个 case 的条件。
例如:
switch (ch) { case '0'...'9': c -= '0'; break; case 'a'...'f': c -= 'a' - 10; break; case 'A'...'F': c -= 'A' - 10; break; }
3、语句表达式
GNU C 把包含在括号中的复合语句看做是一个表达式,称为语句表达式,它可以出现在任何允许表达式的地方。我们可以在语句表达式中使用原本只能在复合语句中使用的循环变量、局部变量等。
例如:
#define min_t(type, x, y) ({type __x = (x); type __x = (x); __x < __y ? __x : __y;}) int ia, ib, mini; float fa, fb, minf; mini = min_t(int, ia, ib); minf = min_t(float, fa, fb);
因为重新定义了 __x 和 __y 这两个局部变量,所以以上述的方式定义的宏将不会有副作用。
在标准C中,对应的如下宏则会产生副作用:
#define min(x, y) ((x) < (y) ? (x) : (y))
代码 min(++ia, ++ib) 会被展开为 ((++ia) < (++ib) ? (++ia) : (++ib)),传入宏的参数被增加两次。
4、typeof 关键字
typeof(x) 语句可以获得 x 的类型,因此,我们可以借助 typeof 重新定义 min 这个宏:
#define min(x, y) ({ const typeof(x) _x = (x); const typeof(y) _y = (y); (void) (&_x == &_y); _x < _y ? _x : _y; })
我们不需要像 min_t(type, x, y) 这个宏那样把 type 传入,因为通过 typeof(x)、typeof(y)可以获得 type。代码行 (void) (&_x == &_y) 的作用是检查 _x 和 _y 的类型是否一致。
5、可变参数的宏
标准C只支持可变参数的函数,意味着函数的参数是不固定的,例如 printf() 函数原型为:
int printf( const char* format , [argument] ... );
而在 GNU C 中,宏也可以接受可变数目的参数,例如:
#define pr_debug(fmt, arg...) printk(fmt, ##arg)
这里arg表示其余的参数可以是零个或者多个,这些参数以及参数之间的逗号构成 arg 的值,在宏扩展时替换 arg。
例如:
pr_debug("%s:%d", filename, line)
会被扩展为:
printk("%s:%d", filename, line)
使用“##”的原因是处理 arg 不代表任何参数的情况,这时候,前面的逗号就变得多余了。使用“##”之后,GNU C 预处理器会丢弃前面的逗号。
pr_debug("success! ")
会被正确的展开为:
printk("success! ")
6、标号元素
标准 C 要求数组或结构体的初始化值必须以固定的顺序出现,在 GNU C 中,通过指定索引或结构体成员名,允许初始化值以任意顺序出现。
指定数组索引的方法是在初始化值前添加 “[INDEX] = ”,当然也可以用 “[FIRST...LAST] = "的形式指定一个范围。例如下面的代码定义一个数组,并把其中的所有元素赋值为0:
unsigned char data[MAX] = {[0...MAX-1] = 0};
下面的代码借助结构体成员名初始化结构体:
struct file_operations ext2_file_operations = { read: generic_file_read, write: generic_file_write, ioctl: ext2_ioctl, open: generic_file_open, release: ext2_release_file, };
但是,Linux2.6推荐类似的代码应该尽量采用标准C的方式,如下:
struct file_operations ext2_file_operations = { .read = generic_file_read, .write = generic_file_write, .ioctl = ext2_ioctl, .open = generic_file_open, .release = ext2_release_file, };
7、当前函数名
GNU C 预定义了两个标识符保存当前函数的名字,__FUNCTION__保存函数在源码中的名字,__PRETTY_FUNCTION__保存带语言特色的名字。在C函数中,这两个名字是相同的。
void test(void) { printf("This is function:%s ", __FUNCTION__); }
8、特殊属性声明
GNU C 允许声明函数、变量和类型的特殊属性,以便进行手工的代码优化和定制代码检查的方法。指定一个声明的属性,只需要在声明后面添加 __attribute__ ((ATTRIBUE))。其中 ATTRIBUE 为属性说明,如果存在多个属性,则以逗号分隔。
GNU C 支持 noreturn、format、section、aligned、packed 等十多个属性。
noreturn 属性作用于函数,表示该函数从不返回。这会让编译器优化代码,并消除不必要的警告信息。
例如:
#define ATTRIB_NORET __attribute__((noreturn)) .... asmlinkage NORET_TYPE void do_exit(long error_code) ATTRIB_NORET;
format 属性也用于函数,表示该函数使用 printf、scanf、strftime 风格的参数,指定 format 属性可以让编译器根据格式串检查参数类型。
例如:
asmlinkage int printk(const char *fmt, ...) __attribute__ ((format(printf, 1, 2)));
上述代码中的第一个参数时格式串,从第二个参数开始都会根据 printf() 函数的格式串规则检查参数。
unused 属性作用于函数和变量,表示该函数或变量可能不会被用到,这个属性可以避免编译器产生警告信息。
aligned 属性用于变量、结构体或联合体,指定变量、结构体或联合体的对齐方式,以字节为单位。
例如:
struct example_struct { char a; int b; long c; } __attribute__((aligned(4)));
表示该结构体类型的变量以4字节对齐。
packed 属性作用于变量和类型,用于变量或结构体成员时表示使用最小可能的对齐方式,用于枚举、结构体或联合体类型时表示该类型使用最小的内存。
struct example_struct { char a; int b; long c __attribute__((packed)); };
9、内建函数
GNU C 提供大量的内建函数,其中大部分是标准C库函数的 GNU C 编译器内建版本,例如 memcpy() 等,它们与对应的标准C库函数功能相同。
不属于内建函数的其他内建函数的命名通常以 __builtin 开始。
内建函数__builtin_return_address (LEVEL)返回当前函数或其调用者的返回地址,参数LEVEL 指定调用栈的级数,如0 表示当前函数的返回地址,1表示当前函数的调用者的返回地址。
内建函数__builtin_constant_p(EXP)用于判断一个值是否为编译时常数,如果参数EXP 的值是常数,函数返回 1,否则返回 0。
内建函数__builtin_expect(EXP, C)用于为编译器提供分支预测信息,其返回值是整数表达式 EXP 的值,C 的值必须是编译时常数。
例如:下面的代码检测第 1 个参数是否为编译时常数以确定采用参数版本还是非参数版本的代码:
#define test_bit(nr,addr) (__builtin_constant_p(nr) ? constant_test_bit((nr),(addr)) : variable_test_bit((nr),(addr)))