4.7.1概念解析
4.7.1.1、存储类
- (1)存储类就是存储类型,也就是描述C语言变量在何种地方存储
- (2)内存有好多中管理方法:栈、堆、.data段、.bss段、.text段..........一个变量的存储类属性就是描述这个变量存储在哪个内存段中。
- (3)譬如:局部变量分配在栈上,所以它的存储类是栈;显示初始化为非0的全局变量分配在数据段。显示初始化位0和没有显式初始化(默认是0)的全局变量分配在.bss段。
4.7.1.2、作用域
(1)作用域是描述这个变量起作用的代码范围
(2)基本来说,C语言的作用域规则是代码块作用域。意思是这个变量其作用的范围是当前的代码块。代码块就是一堆大括号{ }范围内,所以这个变量的作用域是:这个变量定义所在的 { } 内从这个变量定义开始往后的部分(这就解释了为什么变量定义总是在函数的最前面)
#include <stdio.h> int var = 10; int main(void) { int var = 5; if(1) { int var = 2; printf("var = %d. ",var); } printf("var = %d. ",var); return 0; } 运行结果: var = 2. var = 5.
4.7.1.3、生命周期
- (1)生命周期是描述这个变量什么时候诞生(运行时分配内存空间给这个变量)以及什么时候死亡(运行时收回这个内存空间,伺候再不能访问这个内存地址,或者这个内存地址已经和这个变量无关了)
- (2)变量和内存的关系,就和人(变量)去图书馆(DRAM)借(申请)书(内存)一样。变量的生命周期就好像人借书的这段周期一样。
- (3)研究变量的生命周期可以帮助我们理解程序运行的一些现象,理解C语言的一些规则。
4.7.1.4、链接属性
- (1)大家知道程序从源代码到最终可执行程序,经历的过程:编译、链接
- (2)编译阶段就是把源代码编译成.o目标文件,目标文件里有很多符号和代码段、数据段、bss段等分段。符号就是编程中的变量名函数名等。运行时,变量名和函数名能够和相应的内存对应起来,靠符号来做连接的。
- (3).o的目标文件链接生成最终可执行程序的时候,其实就是把符号和相对应的段连接起来。C语言中的符号有三总链接属性:外链接属性、内连接属性、无链接属性
总结:以上4个概念,其实就是从4个不同角度分析C语言的一些规则。综合这4个分析角度,能够让程序员完全掌握C语言程序的运行规则和方法。
4.7.2linux下C程序的内存映像
4.7.2.1、代码段、只读数据段
- (1)对应着程序中的代码(函数),代码段在linux中又叫文本段(.text)。
- (2)只读数据段就是在程序运行期间只能读不能写,const修饰的常量就有可能是存放在只读数据段的(但是不一定的,const关键字在不同的平台实现方法是不一样的)
4.7.2.2数据(.data)段、bss段
- 数据段:显示初始化为非0的全局变量、显示初始化为非0的static局部变量。
- bss段:显示初始化为0或者未显示初始化的全局变量,显示初始化为0或者维显式初始化为0的static局部变量。
4.7.2.3、堆
- (1)C语言中什么变量存在堆内存中?C语言不会自动向堆内存中存放东西,堆的操作是程序员自己手工操作的。程序员根据需求自己判断要不要使用堆内存,用的时候自己申请,自己使用,使用完自己释放。
4.7.2.4、文件映射区
- (1)文件映射区就是进程打开文件后,将这个文件的内容从硬盘的内容读到进程的文件映射区,以后就直接在你的内存中操作这个文件,读写完了以后在保存时再将内存中的文件写到硬盘中。
4.7.2.5、栈
- (1)栈内存区:局部变量分配在栈上;函数调用传参过程也会用到栈。
4.7.2.6内核映射区
- (1)内核映射区就是将操作系统内核程序映射到这个区域了
- (2)对于linux中的每一个进程来说,它都以为整个系统中只有它自己和内核而已,它认为内存地址0xC0000000以下都是它自己的活动空间,0xC0000000以上是操作系统(OS)内核的活动空间
- (3)每一个进程都活在自己独立的进程空间中,0~3G的空间每一个进程是不同的(因为用了虚拟地址技术),但是内核是唯一的。
4.7.2.7、OS下和裸机C程序加载执行的差异
- (1)C语言运行时环境有一定要求,意思是单独个人写的C语言程序没法直接在内存中运行,需要外部一定的协助,这段协助代码叫做加载运行代码(或者说构建C语言运行时环境代码,这一段代码是操作系统下被人写好的,会自动添加到我们写的程序上,这段代码的主要作用是:给全局变量赋值,清bss段)
- (2)ARM裸机十六部分,写shell时 有一次定义了全局变量初始化为0了,但是实际上不为0,后来在裸机的start.S中加了清bss段就变0 了。这就说明了在裸机程序中没人帮我们做这一段程序运行时代码,要程序员自己做(start.S中的重定位和清bss段就是做这个事),在操作系统中,运行程序时,程序员自己不用操心,会自动完成重定位和清bss段,所以我们看到的现象是:C语言中初始化的全局变量默认为0.........。
- (3)数据段的全局变量或静态局部变量都是有非0的初值,在main函数运行之前就已经被初始化了。是重定位期间完成的初始化。
4.7.3、存储类相关的关键字1
4.7.3.1、auto
- (1)auto关键字在C语言中只有一个作用。修饰局部变量
- (2)auto修饰局部变量,表示这个局部变量是自动局部变量,自动局部变量分配在栈上。(既然分配在栈上,说明它不初始化那么值就是随机的)
- (3)平时定义局部变量时就是定义auto的,知识省略了auto关键字。可见,auto的局部变量其实就是默认定义的普通的局部变量
4.7.3.2、static
- (1)static关键字在C语言中有两种用法,而且在C语言中没有关联。完全独立的。其实当年本应该多发明一个关键字的,但是作者觉得关键字太多不好记所以给static多了一种用法,导致static一个关键字有两种含义
- (2)static的第一种用法:修饰局部变量,形成静态局部变量。要搞清楚静态局部变量和非静态局部变量的区别。本质区别是存储类不同(存储类不同就衍生出很多不同)非静态局部变量分配在栈上,而静态局部变量分配在数据段或者是bss段上。
- (3)static 的第二种用法:修饰全局变量,形成静态全局变量。要搞清楚静态全局变量和非静态全局变量的区别,区别主要在链接属性上不同,在链接属性处详细讲。
分析:
- 1、静态局部变量在存储类方面和全局变量一样
- 2、静态局部变量在生命周期方面和全局变量一样
- 3、静态局部变量个全局变量的区别是:作用域、链接属性。静态局部变量作用域是代码块作用域,和普通局部变量是一样的。无连接属性。而全局变量的作用域是文件作用域和函数是一样的、链接属性是外链接。
4.7.3.3、registe
- (1)register关键字不常用,也只有一个作用,那就是:register修饰的变量编译器会尽量将他分配在寄存器中。(平时分配的局部变量都是分配在栈即内存中的)。分配在寄存器中一样的用,但是读写效率会高很多。所以register修饰的变量用在哪些变量被反复使用,通过改善这个变量的访问效率可以极大的提高程序运行的效率时。所以register是一种极致的提升程序运行效率的手段。
- (2)uboot中用到了一个registe类型的变量,gd这个变量是用来存uboot中的全局变量(gd就是global data)因为这个全局变量在uboot中导出都被访问,所以定义成register的
- (3)平时写代码用到register的情况很少,一般慎用。
- (4)register编译器只是承诺尽量将register修饰的变量放在寄存器中,但是不保证一定放在寄存器中,主要原因是寄存器是有限的,不一定有空的给你用。
4.7.4存储类相关的关键字2
4.7.4.1、extern
- (1)extern主要是用来声明全局变量,声明的目的主要是在a.c中定义变量,而在b.c中使用变量。
- (2)C语言中程序的编译是以单个.c的源文件为单位的,因此编译a.c时只考虑a.c的内容(不会考虑b.c的内容)这就导致了a.c中使用了b.c中的变量时在编译时报错。解决方案就是声明
- (3)应该在a.c中使用g_b之前声明g_b,声明就是告诉a.c我在别的文件中定义了g_b,并且它的原型和声明的一样,让编译器不要管了,在链接的时候会在其他的.o文件中找到同名的变量。声明一个变量的方法就是要用到extern关键字。
4.7.4.2、volatile
- (1)volatile的字面意思:可变的、易变的。C语言中用来修饰一个变量表示这个变量可以被编译器之外的东西改变。编译器之类的意思是变量的值的改变是代码的作用,而编译器之外的改变是指这个改变不是代码造成的,或者说不是当前代码造成的,编译器在编译当前代码时无法预知。
- 譬如说在中断处理程序isr中,更改的这个变量的值,
- 譬如多线程中更改的这个变量的值
- 譬如说硬件自动更改的这个变量的值(一般是寄存器)。
- (2)以上说的三种情况:中断isr中引用的变量、多线程中共用的变量,硬件会改的变量
- 编译器在编译是无法预知的更改,此时应该使用volatile告诉编译器这个变量属于这种(可变的、易变的)情况。编译器在遇到volatile修饰的变量时就不会对这个变量的访问进行优化,就不会出现错误。而且这种错误发生了不容易找到。
- (3)编译器的优化在一般情况下非常好,可以帮助提升程序效率,但是在特殊情况下,变量会背编译器想象之外的力量所改变,此时如果编译器没有意识到,而进行了优化则就会造成错误。优化错误就会造成执行错误。
- (4)volatile是程序员意识到需要volatile然后再定义时加上volatile,如果你遇到了需要加volatile的情况却没有加,程序可能会出现错误。如果在不需要加volatile的情况加了volatile程序不会出错,只是会降低程序的效率。所以对于volatile的正确态度是该加就加,不该加就不加,如果不能确定就加。
4.7.4.3、restrict
- (1)C99中才支持的,所以很多延续C89的编译器是不支持register关键字,gcc支持的。
- (2)restrict也是和编译器行为特征有关的。
- (3)resrtict只用来修饰指针,不能修饰普通变量。
- (4)http://blog.chinaunix.net/uid-22197900-id-359209.html
- (5)memcpy和memmove的区别
4.7.4.4、typedef
- (1)之前讲过了。
- (2)typedef在C语言关键字归类上属于存储类关键字,但是实际上和存储类没关系。
4.7.5作用域详解
4.7.5.1、局部变量的代码块作用域
- (1)代码块基本可以理解成一对大括号{ }栝起来的部分
- (2)代码块不等于函数,因为if while for 都有{ },所以代码块<=函数
- (3)局部变量的作用于是代码块作用域,也就是一个局部变量可以被访问和使用的范围仅限于定义这个局部变量的代码块中定义了变量之后的部分。
4.7.5.2、函数名和全局变量的文件作用域
- (1)文件作用域的意思是全局的访问权限,也就是在整个的.c文件中都可以访问这些东西。这就是平时所说的局部和全局,全局就是文件作用域。
- (2)详细准确地来说就是:函数和全局变量的作用域就是定义所在的整个.c文件之内定义式之后的部分。
总结:
- (1)不管是局部变量、全局变量、函数,都要先定义才能使用。
- (2)严格来说我们上面的总结是错的,准确的说全局变量的作用域都是自己所在的代码块/文件,但是定义式之前的部分因为我们缺少声明,所以没法在定义之前用。解决方案:一:把他定义到前面去 二:定义到后面但是在前面加声明。局部变量由于没法声明,所以只能定义到前面去。
- (3)在c89标准的编译器中(现在很多的编译器还在沿用c89),所有的局部变量必须定义在最前面,在变量定义前,不能有一句执行代码。在c99标准的编译器中(gcc兼容c99标准 )可以允许在代码块任意地方定义变量,但是允许定义的变量还是只能使用在定义之后,定义之前还是不能用的。
4.7.5.3、同名变量的掩蔽规则
- (1)问题:编程时,不可避免会出现同名变量,变量同名后不一定会出错
- (2)如果两个同名变量的作用域不同且没有交叠,这种情况下没有任何影响。
- (3)如果两个同名变量作用域有交叠,C语言在作用域的交叠范围内,作用域小的一个变量会掩蔽掉大的那个(县官不如现管)
4.7.6、变量的生命周期
4.7.6.1、研究变量生命周期的意义
(1)研究变量的生命周期,有助于理解变量的行为特征。
4.7.6.2、栈变量的生命周期
- (1)局部变量(栈变量)存储在栈上,生命周期是临时的,临时的意思是说:代码执行过程中按照需要去创建、使用、消亡的。
- (2)譬如一个函数内定义的局部变量,在这个函数每一次被调用时都会被创建一次,然后使用,最后在函数返回时消亡。
- (3)思考:一个函数内的局部变量为什么在函数外不能使用?
- (4)思考:局部变量为什么分配在栈上?局部变量为什么是临时生命周期?
4.7.6.3、堆变量的生命周期
- (1)首先要明白:对内存空间是客观存在的,由操作系统维护的,我们程序只是去申请然后使用然后释放。
- (2)我们只关心我们程序使用堆内存的这段时间,因此堆内存也有自己的生命周期,就是:从malloc申请时开始,然后使用,知道free时消亡。
- (3)所以堆内存在malloc之前和free之后都不可以访问,因此堆内存在实践编程时都是反复malloc和free的
4.7.6.4数据段、bss段变量的生命周期
- (1)全局变量的生命周期是永久的。永久的含义是在程序执行时诞生,在程序终止时消亡
- (2)全局变量所占用的内存是不能被程序自己释放的,所以程序如果申请了过多的全局变量,会导致这个程序一直占用大量的内存。
- (3)如果说堆内存是图书馆借书,那么全局变量就是自己买书。
4.7.6.5代码段、只读段的生命周期
- (1)其实就是程序执行的代码,其实就是函数,他的生命周期是用永久的。不过一般代码的生命周期我们并不关注
- (2)优势后放在代码段的不只是代码还有const类型的常量,还有字符串常量有时候放在rodata段,有时候放在代码段,取决于平台。
4.7.7链接属性
4.7.7.1C语言程序的组织架构:多个C文件+多个h文件
- (1)庞大、完整的一个C语言程序(譬如linux内核、uboot)由多个c文件和h文件组成的
- (2)程序的生成过程就是:编译+链接。编译是为了把函数/变量编译成.o二进制的机器码格式。链接时为了将各个独立分开的二进制的函数连接起来形成一个整体的二进制可执行程序。
4.7.7.2、编译以文件为单位、链接以工程为单位
- (1)编译器工作时是将所有源文件一次读进来,单个为单位进行编译的。
- (2)链接时实际上是把第一步编译生成的单个的.o文件整体的输入,然后处理链接成一个可执行程序。
4.7.7.3、三种链接属性:外链接、内链接、无链接
- (1)外链接的意思是外部链接属性,也就是这家伙可以在整个程序范围内(言下之意就是可以跨文件)进行连接,譬如函数和全局变量属于外链接
- (2)内链接的意思就是(C文件内部)内部链接属性,这家伙可以在当前的C文件内部范围内进行链接。(言下之意就是不能在该在当前c文件外部的C文件进行访问和链接)static修饰的函数和全局变量都是内链接。
- (3)无链接的意思就是这个符号本身不参与链接,链接的时候根本不用考虑他。他跟链接没有关系,所有的局部变量(auto的、static的)都是无链接。
4.7.7.5、函数和全局变量的同名冲突
- (1)因为函数和全局变量是外部链接属性,就是说每一个函数和全局变量,将来在整个程序中所有的C文件都能被访问。因此,在一个程序中的所有的C文件中不能出现同名函数/同名的全局变量
- (2)最简单的解决方案就是起名字不要重复,但是很难做到,主要原因是一个很大的工程中函数和全局变量的名字太多了,而且一个大工程不是一个人完成的,是很多人协助完成的,所以很难保证不重名,解决方案?
- (3)线代高级语言汇总完美解决了这个问题的方法是命名空间(其实就是给一个变量带上各个级别的前缀)但是C语言不是这么解决的
- (4)C语言比较早碰到这个问题,当时还没发明namespace概念,当时C语言发明了一种不是很完美的但是凑合能用的解决方案,就是三种链接属性的方法。
- (5)C语言的链接属性解决重名问题的思路是这样的,将明显不会再其他的C文件中引用的(只有在当前C文件中引用)的函数/全局变量,使用static修饰使其成为内链接属性,这样即使2个C文件中有重名的函数/全局变量,只要其中一个或者两个为内链接属性就没事。
- (6)这种方法在一定程度上解决了问题,但是没有从根本上解决问题,留下了很多麻烦。所以这个就导致了C语言写很大型的项目难度很大。
4.7.7.5、static的第二种方法:修饰全局变量和函数
- (1)普通的(非静态的)函数/全局变量,默认的链接属性是外链接
- (2)static(静态的)函数/全局变量,链接属性是内部链接
4.7.7.6、一般用法总结:
思考:为什么static一个管家你这可以有两种不同的意思?
因为这两种用法是互斥的。就是说static一个是修饰全局变量,一个是修饰局部变量,所以不会引起歧义。
4.7.8、最后的总结
- (1)普通(自动)局部变量分配在栈上,作用域位代码块,生命周期是临时的,链接属性无链接。定义时如果未显示初始化则其值是随机的。变量地址由运行时在栈上分配得到,多次执行时地址不一定相同,函数不能返回该类变量的地址(指针)作为返回值。
- (2)静态局部变量分配在数据段/bss段(显式初始化非0则在数据段,否则在bss段),作用域为代码块作用域,生命周期为永久,链接属性:无链接。定义时如果未显示初始化其值为0,变量地址由运行时环境在加载程序是确定,整个程序运行过程中唯一不变;静态局部变量其实就是作用域为代码块作用域(同时链接属性为无链接)的全局变量。静态局部变量可以改为用全局变量实现(程序中尽量避免使用全局变量,因为会破坏结构性)
- (3)静态全局 变量/静态函数和普通全局变量/普通函数的区别在于:static使全局变量/函数的链接属性由外部链接(整个程序所有文件范围内)改为内部链接(当前c文件)。这是为了解决重名问题(C语言没有命名空间name space的概念,因此在程序中文件变多之后全局变量/函数的重名问题非常严重,将不必要被其他文件引用的全局变量/函数声明为static可以很大程序上改善重名问题,但是仍未彻底解决)
- (4)写程序尽量避免使用全局变量,尤其是非static类型的全局变量。能确定不会被其他文件引用的全局变量一定要static修饰
- (5)注意区分全局变量的定义和声明。一般规律如下:如果定义的同时又初始化则一定会被认为定义;如果只是定义而没有初始化则有可能被认为是定义,也可能被认为是声明,要具体分析。如果使用extern则肯定会被认为声明(实际上使用extern也可以有定义,实际上加extern就是声明这个变量为外部链接属性)
- (6)全局变量应该定义在c文件中并且在头文件中声明,而不要定义在头文件中(因为如果定义在头文件中,则该头文件被多个c文件包含时,该全局变量会重复定义)
- (7)在b.c中引用a.c中定义的全局变量/函数有2种方法:一是在a.h中声明该函数/全局变量,然后再b.c中#include<a.h>,二是在b.c中使用extern显式声明要引用的函数/全局变量。其中第一种方式比较正式
- (8)存储类决定生命周期,作用域决定链接属性
- (9)宏和inline函数的链接属性为无链接