• Python 对象的引用计数和拷贝


    Python 对象的引用计数和拷贝

    Python是一种面向对象的语言,包括变量、函数、类、模块等等一切皆对象。

    在python中,每个对象有以下三个属性:

    1、id,每个对象都有一个唯一的身份标识自己,可通过内建函数id(obj)查看。

    2、type,对象的类型决定了该对象可以保存什么类型的值,可用内建函数type(obj)查看;

    3、value,即对象的值。

    下面是一个例子:

    >>> str = "hello world"
    >>> type(str)
    <type 'str'>
    >>> id(str)
    139840619053776
    >>> str2="hello world"
    >>> id(str2)
    139840619053888
    >>> str == str2
    True
    >>> str is str2
    False
    >>> 

    注意:id()函数返回一个数字,不同的对象的id值不一样,即使他们值一样。

    同时也可以看出,关系运算符 "==" 比较的是两个对象的值是否相等,而 is 比较的是两个变量是否为同一个对象(或者说指向同一块内存)。

    还有一个内建函数cmp,也可用于比较两个对象的值,它返回的是一个int值,例如:

    >>> cmp("abc", "bcd")
    -1
    >>> cmp(7,7)         
    0
    >>> cmp(7,9)
    -1
    >>> cmp(19,9)
    1

    再来看下面这个有趣的现象:

    >>> a = [4]
    >>> b = [4] 
    >>> a is b
    False
    >>> a = 1
    >>> b = 1
    >>> a is b
    True

    可见,对两个变量赋予相同的值,它们有可能是同一个对象(对不可变对象而言,可以节省内存),也可能是两个不同的对象,这可能取决于对象的类型(type)。


    Python中使用了智能指针的技术(与Java中的垃圾回收GC机制类似),每个变量都和指向对象(object)的指针相关联,每一个object都有一个reference counter(引用计数器)记住有多少个变量和这个object绑定(bind)。每次bind,reference count都加1,每次删除bind关系,都减少1,只有reference counter变成0的时候才真正删除对象。

    以下情况时,对象的引用计数增加:

    • 对象被创建;
    • 另外的别名被创建;
    • 作为参数传递给函数;
    • 成为容器对象的一个元素;

    以下情况时,对象的引用计数减少:

    • 一个本地引用离开其作用范围,比如函数结束时,所有局部变量都被自动销毁;
    • 用del语句显式删除一个变量(同时该变量从name space中删除);
    • 对象的一个别名被赋值给其他对象;
    • 对象被移出一个容器对象时;
    • 容器对象本身的引用计数变成0;

    例如:

    x = 3.14                 # 创建的3.14 这个对象的引用计数为1
    y = x                  # 创建对象别名,对象”3.14”的引用计数为2
    myList = [123, x, ‘xyz’]      # 成为容器的一个元素,对象”3.14”的引用计数为3
    y = 123                 # 对象别名bind到其它对象,对象”3.14”的引用计数为2
    del myList                # 容器被删除,对象”3.14”的引用计数为1

    注意:解释器跟踪对象的引用计数,而垃圾收集器负责释放内存。当一个对象的引用计数变为0,解释器会暂停,释放掉这个对象和仅有这个对象可访问的其他对象。这里,还要特别注意循环引用的情况。


    Python中,常用对象的一些访问模型:

    数据类型

    存储模型

    更新模型

    访问模型

    数字

    标量

    不可更改

    直接访问

    字符串

    标量

    不可更改

    顺序访问

    列表

    容器

    可更改

    顺序访问

    元组

    容器

    不可更改

    顺序访问

    字典

    容器

    可更改

    映射访问

    一个很重要的区别:数字、字符串、元组是不可变对象,列表和字典是可变对象。

    对于不可改变类型来说,无法通过变量更新对象的值,例如:

    >>> x = 12
    >>> id(x)
    8483376
    >>> x = 45
    >>> id(x)
    8484576

    这里,表面上看变量x的值被更新了,其实是12这个数字对象被销毁了,然后创建了一个新的数字对象45,变量x被bind到这个新对象上。

    字符串对象也是不可变类型,不可变对象作为左值时,必须是一个完整的对象。例如:

    >>> s = 'hello world
    '
    >>> s[3] = 'x'                 
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    TypeError: 'str' object does not support item assignment
    >>> s = '%sL%s' %(s[:3],s[4:]) 
    >>> s
    'helLo world
    '
    >>> 

    另外一个有趣的区别是,不可变对象的方法通常有返回值,而可变对象的方法通常返回None,比如

    >>> s = 'abc'
    >>> ret = s.upper()
    >>> ret
    'ABC'
    >>> l = [1, 2]
    >>> ret = l.append(3)
    >>> ret
    >>> l
    [1, 2, 3]

    这是因为不可变对象因为对象自身无法修改,因此其方法只能返回一个新对象;而可变对象直接原地修改原对象。


    Python中,序列类型对象(比如list)的赋值操作只是一种简单的浅拷贝,例如:

    >>> a = [1,2,3]   
    >>> b = a
    >>> id(a)      
    139972192906488
    >>> id(b)
    139972192906488
    >>> b[2] = "hello"
    >>> a
    [1, 2, 'hello']

    可见,列表a和列表b指向对一个对象,修改列表b之后,列表a也相应的受到影响了。

    浅拷贝的其它实现方式:

    import copy
    
    a = [1,['joy', 1000],3,4]
    b = copy.copy(a)            # 浅拷贝
    c = a[:]                    # 完全切片操作
    d = list(a)                 # 工厂函数
    
    print id(a),id(b),id(c),id(d)
    b[1][0] = 'name'          
    
    print [id(item) for item in a]
    print [id(item) for item in b]
    print [id(item) for item in c]
    print [id(item) for item in d]
    
    print a
    print b
    print c
    print d

    运行结果:

    139954864753840 139954864851208 139954864849552 139954864849624
    [30569272, 139954864710504, 30569224, 30569200]
    [30569272, 139954864710504, 30569224, 30569200]
    [30569272, 139954864710504, 30569224, 30569200]
    [30569272, 139954864710504, 30569224, 30569200]
    [1, ['name', 1000], 3, 4]
    [1, ['name', 1000], 3, 4]
    [1, ['name', 1000], 3, 4]
    [1, ['name', 1000], 3, 4]

    可见,虽然a、b、c、d 这4个对象的id各不相同,但它们的元素id完全一样,也就是这4个对象指向的其实都是同一块内存,通过其中任何一个对象对列表所作的修改,对其他3个对象都是可见的。

    如果我们需要复制一份序列类型的对象,并且对副本进行操作而不影响原来的序列,通常就需要进行深拷贝了。

    import copy
    
    a = [1,['joy', 1000],3,4]
    b = copy.deepcopy(a)        # 深拷贝
    c = a[:]                    # 完全切片操作
    d = list(a)                 # 工厂函数
    
    print id(a),id(b),id(c),id(d)
    b[1][0] = 'name'          
    
    print [id(item) for item in a]
    print [id(item) for item in b]
    print [id(item) for item in c]
    print [id(item) for item in d]
    
    print a
    print b
    print c
    print d

    运行结果:

    139880002817200 139880002912984 139880002914136 139880002914928
    [37511992, 139880002773864, 37511944, 37511920]
    [37511992, 139880002914640, 37511944, 37511920]
    [37511992, 139880002773864, 37511944, 37511920]
    [37511992, 139880002773864, 37511944, 37511920]
    [1, ['joy', 1000], 3, 4]
    [1, ['name', 1000], 3, 4]
    [1, ['joy', 1000], 3, 4]
    [1, ['joy', 1000], 3, 4]

    可见,对象b的可变元素与原对象中的元素具有不同的id,因此对b的可变元素的修改,不影响原始的对象。

    对字典也是类似的,浅拷贝如下:

    >>> dict = {"name":"chen", "age":100}
    >>> dict2 = dict
    >>> dict2["name"] = "Lau"
    >>> dict
    {'age': 100, 'name': 'Lau'}

    利用字典的copy方法,可以实现深拷贝,例如:

    >>> dict = {"name":"chen", "age":100}
    >>> dict2 = dict.copy()
    >>> dict2
    {'age': 100, 'name': 'chen'}
    >>> dict2["name"] = "Lau"
    >>> dict
    {'age': 100, 'name': 'chen'}
    >>> dict2
    {'age': 100, 'name': 'Lau'}
  • 相关阅读:
    不要对春运抱有幻想
    初识HTTP消息头(一)
    java中ArrayList 、LinkList区别以及速度对比
    jar包和war包的区别
    LUA 日期处理
    NGINXLUA——变量浅谈
    JDK和JRE的区别
    理解HTTP消息头 (五)——使用multipart/formdata上传文件
    安装Jetty
    TOMCATJARWAR事例讲解
  • 原文地址:https://www.cnblogs.com/chenny7/p/4192269.html
Copyright © 2020-2023  润新知