Python 的内存管理是自动的。Python 使用引用计数和垃圾回收来管理内存。
引用计数:每个对象有一个引用它的对象的数目。引用计数为 0 的对象被视作垃圾。当一个引用它的对象创建时,引用计数加一,当一个引用它的对象销毁时,引用计数减一。
引用计数有一些缺点,其中一个是它不能处理循环引用。
def make_cycle():
1 = [ ]
1.append(l)
make_cycle()
因为 make_cycle()
中创建了一个循环引用对象,所以当函数返回后,它并不会被引用计数回收。
自动回收引用对象
因为循环引用需要消耗计算资源来发现,所以垃圾回收是一个预先安排好的任务。Python 基于分配对象与回收对象的差值来安排垃圾回收。当分配数目减去回收数目大于临界值时,触发垃圾回收。可以通过 gc 模块来查看垃圾回收的临界值:
import gc
gc.get_threshold()
(700, 10, 10)
我们可以看到,默认的临界值时 700。
当你的 Python 程序耗尽了内存后,自动垃圾回收不会运行。你的程序会抛出异常,这个异常必须被处理,否则你的程序会崩溃。这是由于自动垃圾回收是基于对象的数目而不是基于对象的大小。因此可以考虑在占据大量内存的代码后手动运行垃圾回收。
手动垃圾回收
对于一些程序,尤其是长时间运行的服务端程序或者嵌入式程序,自动垃圾回收可能不足。
手动执行垃圾回收:
import gc
# 返回它回收的对象数目
gc.collect()
如果我们创建一些循环引用,我们可以看到手动回收生效了:
# -*- coding: utf-8 -*-
import gc
def _make_cycle():
l = {}
l[0] = l
def make_cycle(num=1):
for i in range(num):
_make_cycle()
# 先清理干净
gc.collect()
assert gc.collect() == 0
make_cycle(10)
assert gc.collect() == 10
通常,有两种手动回收的策略:
- 基于时间。定时调用垃圾回收
- 基于事件。在一个事件中调用垃圾回收。比如当一个用户与服务器断开连接或者知道应用要进入停顿状态后
推荐行为
尽可能在需要的时候调用垃圾回收来避免对重要程序造成性能影响。垃圾回收应该是设计 Python 应用的一部分。
- 不要随意运行垃圾回收,因为它需要消耗很多计算资源来计算每个内存对象
- 在你的应用完全启动并进入平稳运行状态后再运行垃圾回收。这可能可以释放大量用于打开、解析文件、编辑、修改对象或者不会再用到的模块的内存
- 在运行不常用代码后运行垃圾回收。比如,在一个一天一次的解析、导出数据的任务后运行垃圾回收
- 在对时间要求高的任务前后运行垃圾回收来阻止可能的垃圾回收分走运行时间