Python GC Garbage Collection
三个任务:
1.为新生成的对象分配内存 2.识别垃圾对象 3.从垃圾对象那里回收内存
方法:
1,引用计数 reference counting 为主
2,标记-清除 mark and sweep
3,分代回收 generation collection
1,引用计数 reference counting
对象的核心是结构体:PyObject
typedef struct_object { int ob_refcnt; struct_typeobject *ob_type; } PyObject;
ob_refcnt 就是引用计数
- 导致引用计数+1的情况
- 对象被创建,例如
a=23
- 对象被引用,例如
b=a
- 对象被作为参数,传入到一个函数中,例如
func(a)
- 对象作为一个元素,存储在容器中,例如
list1=[a,a]
- 对象被创建,例如
- 导致引用计数-1的情况
- 对象的别名被显式销毁,例如
del a
- 对象的别名被赋予新的对象,例如
a=24
- 一个对象离开它的作用域,例如f函数执行完毕时,func函数中的局部变量(全局变量不会)
- 对象所在的容器被销毁,或从容器中删除对象
- 对象的别名被显式销毁,例如
当 ob_fcnt 为0 ,改对象生命结束
优点:实时性,回收及时
缺点:维护引用计数消耗资源
循环引用:
list1 = [] list2 = [] list1.append(list2) list2.append(list1)
list1 与 list2 相互引用,内存无法回收。例如 map list dict class instance
2,标记-清除
第一阶段是标记阶段,GC会把所有的『活动对象』打上标记,第二阶段是把那些没有标记的对象『非活动对象』进行回收。
标记清除算法作为Python的辅助垃圾收集技术主要处理的是一些容器对象,比如list、dict、tuple,instance等,因为对于字符串、数值对象是不可能造成循环引用问题。
原理:“标记-清除”采用了更好的做法,我们并不改动真实的引用计数,而是将集合中对象的引用计数复制一份副本,改动该对象引用的副本。对于副本做任何的改动,都不会影响到对象生命走起的维护。
3,分代回收
检测垃内存块的存活时间,以对象的存活时间『分代』
存活时间长的对象,越不可能是垃圾
以空间换时间
如何来衡量这个存活时间:通常是利用几次垃圾收集动作来衡量,如果一个对象经过的垃圾收集次数越多,可以得出:该对象存活时间就越长。