对象在内存的存储,我们可以求助于Python的内置函数id()。它用于返回对象的身份(identity)。其实,这里所谓的身份,就是该对象的内存地址。
a = 1
print(id(a)) #11246696内存地址的十进制
print(hex(id(a))) #'0xab9c68'十六进制
在Python中,整数和短小的字符,Python都会缓存这些对象,也就是有个对象缓存池,以便重复使用和减少频繁申请和回收内存的开销。
当我们创建多个等于1的引用时,实际上是让所有这些引用指向同一个对象。
a = 1
b = 1
print(id(a)) #11246696
print(id(b)) #11246696
可见a和b实际上是指向同一个对象的两个引用。
检验两个引用指向同一个对象,我们可以用is关键字。is用于判断两个引用所指的对象是否相同。
复制代码
# True
a = 1
b = 1
print(a is b)
# False
a = 257
b = 257
print(a is b) #因为int缓存的范围是[-5,256)
# True
a = "good"
b = "good"
print(a is b)
# False
a = "very good morning"
b = "very good morning"
print(a is b)
# False
a = []
b = []
print(a is b)
可以看到,由于Python缓存了整数和短字符串,因此每个对象只存有一份。
比如,所有整数1的引用都指向同一对象。即使使用赋值语句,也只是创造了新的引用,而不是对象本身。长的字符串和其它对象可以有多个相同的对象,可以使用赋值语句创建出新的对象。
引用计数
在Python中,每个对象都有存有指向该对象的引用总数,即引用计数(reference count)。
我们可以使用sys包中的getrefcount(),来查看某个对象的引用计数。需要注意的是,当使用某个引用作为参数,传递给getrefcount()时,参数实际上创建了一个临时的引用。因此,getrefcount()所得到的结果,会比期望的多1。由于上述原因,两个getrefcount将返回2和3,而不是期望的1和2。
from sys import getrefcount
a = [1, 2, 3]
print(getrefcount(a))
b = a
print(getrefcount(b))
垃圾回收
垃圾回收时,Python不能进行其它的任务。频繁的垃圾回收将大大降低Python的工作效率。如果内存中的对象不多,就没有必要总启动垃圾回收。所以,Python只会在特定条件下,自动启动垃圾回收。当Python运行时,会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。当两者的差值高于某个阈值时,垃圾回收才会启动。
我们可以通过gc模块的get_threshold()方法,查看该阈值:
import gc
print(gc.get_threshold())
返回(700, 10, 10),后面的两个10是与分代回收相关的阈值,后面可以看到。700即是垃圾回收启动的阈值。可以通过gc中的set_threshold()方法重新设置。
我们也可以手动启动垃圾回收,即使用gc.collect()。
使用了
“引用计数”“复制清理”“分代复制”
和Java类似