• C++中引用和指针详解



    先来分析指针这个东东:

    从概念上讲,指针本质上就是存放变量地址的一个变量,在逻辑上是独立的,它可以被改变,包括其所指向的地址的改变和其指向的地址中所存放的数据的改变。

    clip_image002 clip_image004

    上面的图表示了程序运行时变量的值和地址,这时的内存长什么样子呢?

    clip_image006

    注意指针是一个变量,它当然有内存空间,里面存的就是一个地址,通过这个地址我们就能找到它所指向的对象。

    说明:上图中两个字母p和n在最左边,代表什么?后面在介绍程序的编译过程中用到,先卖个官司。如果下面的写的东西你看不懂,没关系,往下看,我不相信你看完最后的编译原理的一点点知识,你仍然不懂!


    再来分析引用这个东东:

    引用是一个别名,它在逻辑上不是独立的,它的存在具有依附性,所以引用必须在一开始就被初始化,而且其引用的对象在其整个生命周期中是不能被改变的(自始至终只能依附于同一个变量)。

    引用在本质上其实和指针是一样的,如果去反编译他们的源码,就能看到其实编译成的汇编语言是一样的,都是进行一次间址操作进行内存的访问。但是不同的是只要你用到了引用,就会自动的进行间址转换,并且这种间址转换时对程序员透明的。并且这种转换是在编译阶段就完成了的,后面是无法改变的。看下面的程序:

    int n = 10;
    int *p = &n;
    int &r = n;

    看一下内存中的样子:

    image

    再看一下符号表中的内容:

    image

    似乎从这些东西来看,指针真的和引用没有任何的区别,那么区别在哪里呢?

    指针和引用的访问机制是不一样的。对于指针变量,可以修改它的内存空间中存储的值(也就是它所指向的对象的地址),但是引用是不可以修改的。也就是说上面图中p对应的内存空间是可以修改的,但是r对应的内存空间是不能修改的。

    在使用指针的时候,会首先根据p的地址0xFF00找到n的地址,然后根据这个地址在访问n的值。当然你可以修改p的内存的值,这样p就指向了另一个东西。

    在使用引用的时候,只要你使用到了引用,编译器会自动的做间址操作,就好像对你的操作做一个预处理,并且这个预处理是对程序员透明的,这种预处理是在编译阶段就完成的。

    因为这个操作是对高级语言透明的,所以对于高级语言来说,符号表其实可以看成这个样子的:

    image

    既然高级语言看到的是这样的符号表,那么在编译阶段,引用一旦确定,就不允许在修改。

    当然对于汇编语言来说,指针和引用是没有区别的,这只是C++语言为了更好的使用指针的一种trick。但是对于高级语言来说,就完全可以按照这样的符号表来理解所有的有关引用的使用(因为间址操作是对高级语言透明的)。


    对于函数参数的传递,引用传递和指针传递是不同的,虽然它们都是在被调函数栈空间上的一个局部变量,但是任何对于引用参数的处理都会透明的通过一个间接寻址的方式操作到主调函数中实参的内存值。而对于指针传递的参数,如果改变被调函数中的指针地址,它将影响不到主调函数实参的内存值。如果想通过指针参数传递来改变主调函数中实参的内存值,那就得使用指向指针的指针(int **p),或者指针引用(int * &p)。

    看下面两张图,左边是指针传递参数,右边是指针引用传递参数

    clip_image012clip_image014

    说明:

    (1)指针传递参数的时候,情况是上面的那张图片,指针p把自己的内存的内容copy一份到q的内存空间中去。所以p和q都是指向堆空间中的某个实例对象的,也就是说他们都存放了堆空间中这个实例对象的地址。但是我如果在被调函数中修改了q的内存中的地址,也就是说不让q指向这个实例对象了,那么这些都是合法的。并且我们无法修改主调函数中p对应的内存中的内容,也就是说无法修改p指向的堆内存实例对象。

    (2)但是利用指针引用传递参数就不一样了,其实引用的本质仍然是指针,只不过引用对应的内存空间中存放的不是p对应的内存空间内容的备份。引用内存空间中存放的是p的地址,但是在使用引用的时候,自动的做一次透明的间址操作,所以从高级语言的角度来看,引用对应的内存地址就是指针p对应的内存地址,他们两个好像是同一块存储单元的门牌号,当然指向的东西也就一样了。就好像引用在符号表中的地址项和指针在符号表中的地址项是一样的。

    并且这个引用在被调函数中的任何使用的时候都是采用透明的间接地址访问的方式,也就是说你只要对ref修改(修改的意思就是修改ref对应的内存中的东西),编译器都会做一次透明(之所以说透明,是因为这个过程是编译器私自做的,高级语言是看不到的,也无法控制)的间接寻址,把你得任何的修改都作用到指针p对应的内存空间中去。

    并且这用关联是初始化以后不能修改的。到底怎么就不能修改了,看下面:

    那么,编译器是怎么做到透明的间接寻址的呢?下面看一下编译过程(从高级语言编译器的角度看):

    为了进一步加深大家对指针和引用的区别,下面我从编译的角度来阐述它们之间的区别:

    程序在编译时分别将指针和引用添加到符号表上,符号表上记录的是变量名及变量所对应地址。指针变量在符号表上对应的地址值为指针变量的地址值,而引用在符号表上对应的地址值为引用对象的地址值。符号表生成后就不会再改,因此指针可以改变其指向的对象(指针变量中的值可以改),而引用对象则不能修改。


    为了说明这些,下面先说一下编译原理的相关知识:

    编译原理的一些简单知识:

    编译器在编译我们的程序的时候,一般的编译器要对我们的源程序扫描两遍才能完成编译(当然如果用拉链-回填也可以一遍扫描,这不是我们的重点)。第一遍中很重要的一个工作就是建立符号表,第二遍就是使用这些符号进行对内存空间操作。编译器会扫描源程序中所有的变量,然后给他们建立一个表格,表格的内容就是下图所示,包括你得变量的名称(符号),对已的内存空间中的地址,变量的类型。

    注意:符号表中不会有这个变量的内存空间中存储的内容。就好像我们的酒店的管理,前台可能也有一张表,里面对应着房间编号、房间地址、房间大小。

    如:

    1号房—>B区A栋三楼302房间—>45平

    2号房—>B区C栋三楼432房间—>80平

    “1号房”、“2号房”就是为了好记忆,前台就是觉得“B区A栋三楼302房间”这样的字眼太麻烦。

    计算机的内存就类似,唯一不同的是我们不关心计算机给我存在哪了,也就说我只要知道我的是“几号房“,并且我记住,计算机也记住。我不管你给我放在哪个区哪栋楼几号房间。我每次想用的时候,我就说“几号房”,然后计算机通过上面的那张表给我对应找到房间的具体的位置。

    编译器就是前台,维护一张表。程序员就是住户,我只知道我是“几号房”。

    clip_image002[1]clip_image004[1]clip_image016clip_image006[1]

    看到了吧,其实p和n等变量符号,就是一个地址。如上面的图n就是0x0012ff40开始的四个内存存储单元(因为n是int类型的变量,占用四个存储单元,这个跟计算机有关),之所以用n就是为了简单,不然老说0x0012ff40,一会就懵了。

    还有一个东西就是p对应的内存空间中存储的东西,这个是在符号表中没有的,必须等到程序跑起来,访问内存的时候才能看到。在程序运行时,我们对变量符号(也就是对应的内存单元的地址)的任何操作,都会转化为对对应的内存单元的操作。

    比如:

    n=2;这个操作。

    计算机会首先去符号表中查找这个变量符号,找到它对应的内存地址,如上面个的图中所示,拿着n找到了0x0012ff44,然后就根据这个地址,找到了内存的真实的存储单元(n只是为了便于我们记忆弄的一个符号,物理内存中没有这个东西的,但是我们有符号表啊,能转换到实际的内存地址)。然后就对这个内存空间按照程序的需要读写。

    如果你敢没有定义这个变量n直接用,那么第一遍扫描的时候就没有登记你的n对应的内存地址是多少,你这里直接访问,那么编译器就提示变量未定义的错误。

    是不是很好玩?下面回归今天的正题:

    编译器就是利用符号表实对引用变量实现透明的间接地址访问的,之所以说这么多就是为了说明引用在符号表中是怎么弄的。

    clip_image018

    如果内存空间是这样的,这时的符号表长什么样子呢?

    clip_image020

    看见了吧,ref这个货竟然在符号表中不对应自己的地址(0x0012ff40),直接对应别人的地址。你如果对ref操作,计算机就拿着ref查它的内存地址,然后在对这个内存空间读写。但是一查表,就是p对应的内存空间的地址,自然而然的就操作p对应的内存空间了。

    符号表在编译器第一遍读源程序后生成,然后就不会再改,因此指针可以改变其指向的对象(改变的是指针变量p的内存空间中的存储的数据),而引用对象则不能修改,也就是说ref一旦是p的引用,它就得一辈子是p的引用,因为变量符号表改不了,你只要操作ref直接就对应到了p的内存空间(ref真正的内存空间已经不重要了,谁也看不见,谁也用不到)。也许有人说,那我输出ref的地址看看,不好意思,地址就是上面的符号表中的内容。(如果真的想看,就得给编译器解刨,看看它里面是什么)

    说明:由于引用本身就是目标的一个别名,引用本身的地址是一个没有意义的值,所以在c++中是无法取得引用的真实内存地址的。取引用的地址就是取目标的地址,c++本身就根本不提供获取引用内存地址的方法。

  • 相关阅读:
    疯狂Java学习笔记(008)
    CSS-链接
    css学习:css样式的引入
    两个文本根据索引key关联合并,将无关联信息单独输出
    三 数据挖掘算法
    二、数据挖掘
    vsftp虚拟账户设置
    python3在linux下的编码错误
    python 一个根据正则判断输入的函数
    python excel读写与dict转换
  • 原文地址:https://www.cnblogs.com/stemon/p/4164896.html
Copyright © 2020-2023  润新知