Python内存由解释器自动管理,核心机制包括引用计数(即时释放)、垃圾回收(处理循环引用)和对象池(缓存小整数-5~256及短字符串),不可变对象可复用,可变对象每次新建,应避免频繁创建大对象并优先使用原地操作。

Python的内存分配不是由程序员直接控制的,而是由解释器自动管理,核心机制包括引用计数、垃圾回收(GC)和对象池等。理解这些策略,有助于写出更高效、低内存占用的代码。
小整数与短字符串走对象池
Python对常用小整数(-5 到 256)和部分短字符串做了缓存优化。相同值的对象会复用同一内存地址,节省空间也加快比较速度。
- 整数示例:a = 100;b = 100;a is b 返回 True(因为都在小整数池中)
- 字符串注意:s1 = "hello";s2 = "hello";s1 is s2 通常为 True,但若含空格、换行或运行时拼接(如 "he" + "llo"),可能不复用
- 不要依赖
is比较字符串或数字的逻辑相等性,应统一用==
引用计数是核心计数机制
每个对象内部维护一个引用计数器,记录当前有多少变量或结构指向它。当计数降为 0,对象立即被释放(无需等待 GC)。
- 赋值、作为参数传入函数、加入容器(如 list.append())都会使计数 +1
- 变量重新赋值、函数返回、
del显式删除、容器移除元素会使计数 -1 - 循环引用(如两个对象互相持有对方引用)无法靠引用计数清理,需依赖后续的循环垃圾回收器
循环垃圾回收器(gc模块)兜底处理
Python 的 gc 模块定期扫描堆中不可达对象,专门解决引用计数无法处理的循环引用问题。
立即学习“Python免费学习笔记(深入)”;
- 默认启用,但可手动调用
gc.collect()强制触发一次回收 - 可通过
gc.disable()关闭(极少需要,多见于性能敏感且确认无循环引用的场景) - 使用
gc.get_objects()可查看当前存活对象,辅助排查内存泄漏
可变对象与不可变对象影响内存行为
不可变对象(如 int、str、tuple)一旦创建就不能修改,因此常被复用;可变对象(list、dict、set)每次创建都是新实例,即使内容相同也不会共享内存。
- 避免频繁创建大列表或字典:考虑复用已有对象,或用生成器替代全量加载
- 修改 list/dict 时用原地操作(
.append()、.update())比重建更省内存 - 深拷贝(
copy.deepcopy())会递归分配新内存,浅拷贝(copy.copy())只复制顶层,按需选择
不复杂但容易忽略。写 Python 时少想“怎么分配”,多想“谁还在用它”。










