Python模块加载核心是__import__函数,它实现import语句的查找、加载(执行代码并缓存于sys.modules)、绑定三步机制,并决定相对导入行为依赖__name__和__package__。

Python模块加载的核心是__import__函数(注意双下划线),它不是你日常写的import语句,而是解释器在背后真正调用的内置机制。理解它,才能搞懂为什么有时导入失败、为什么循环导入会出问题、为什么from . import xxx能工作而直接写模块名不行。
import语句如何触发__import__
当你写import requests,Python实际执行的是:requests = __import__('requests')
如果是from urllib.parse import urlparse,则等价于:urllib = __import__('urllib.parse', fromlist=['urlparse'])
关键点在于fromlist参数:它决定了__import__返回哪个层级的模块对象。不带fromlist时,返回的是顶层包(如urllib);设为['urlparse'],才返回urllib.parse模块本身。
模块搜索与加载三步走
__import__执行时,按顺序完成以下动作:
-
查找:遍历
sys.path,匹配.py、.pyc、内置模块、C扩展等;遇到__path__(包特有)就递归进子目录 -
加载:若未加载过,新建模块对象,执行模块代码(即运行
.py文件顶层语句);已存在则直接返回缓存(sys.modules中) -
绑定:把返回的模块对象赋值给当前命名空间的对应名称(如
import os→ 绑定os变量)
sys.modules是模块缓存中枢
所有成功加载的模块都会被存进sys.modules字典,键是模块全名(如'json.encoder'),值是模块对象。你可以手动干预这个字典来“欺骗”导入系统:
立即学习“Python免费学习笔记(深入)”;
这本书给出了一份关于python这门优美语言的精要的参考。作者通过一个完整而清晰的入门指引将你带入python的乐园,随后在语法、类型和对象、运算符与表达式、控制流函数与函数编程、类及面向对象编程、模块和包、输入输出、执行环境等多方面给出了详尽的讲解。如果你想加入 python的世界,David M beazley的这本书可不要错过哦。 (封面是最新英文版的,中文版貌似只译到第二版)
import sys
sys.modules['requests'] = MockRequests()
下次
import requests就会拿到你的Mock对象。但要注意:如果模块已被导入,修改sys.modules不会影响已存在的引用,只影响后续导入。
相对导入背后的__name__和__package__
像from .utils import helper这类相对导入,依赖两个隐式属性:
-
__name__:当前模块的完整名,如'mypkg.submod' -
__package__:当前模块所属包名,包内模块为'mypkg',顶层脚本为''(空字符串)
解释器用__package__推导相对路径起点。所以直接运行一个包内的.py文件(如python mypkg/submod.py),它的__package__是'',相对导入就会报SystemError: Parent module '' not loaded——必须用-m方式启动:python -m mypkg.submod,此时__package__才正确设为'mypkg'。









