multiprocessing是python中实现并行计算的有效方式,它通过创建独立进程绕过gil限制,适合cpu密集型任务。相比多线程,其能真正利用多核优势。使用时可通过1.process类创建单独进程执行任务;2.pool类批量管理进程处理大量任务。注意事项包括:3.避免频繁创建进程;4.进程间通信较慢需用queue或共享内存;5.windows下需将入口代码置于if name == "__main__":中;6.输出可能混乱建议加锁或记录日志。适用场景为图像处理、视频编码、批量文件操作等需要提高cpu利用率的任务。

在Python中实现并行计算,
multiprocessing模块是一个非常直接且有效的方式。它利用多核CPU来同时执行多个任务,从而加快程序运行速度。相比多线程,它能真正绕过GIL(全局解释器锁)的限制,适合CPU密集型任务。

什么是multiprocessing
?为什么用它?
multiprocessing是Python标准库中的一个模块,专门用来创建进程,实现真正的并行计算。因为每个进程都有自己独立的内存空间和Python解释器实例,所以可以完全绕过GIL的影响。
你可能会问:为什么不直接用多线程?这是因为CPython中有GIL的存在,导致多线程在同一时间只能有一个线程执行Python字节码,对CPU密集型任务帮助不大。而
multiprocessing通过启动多个进程,让每个进程独立运行,就能充分利用多核优势。
立即学习“Python免费学习笔记(深入)”;

如何使用multiprocessing
进行并行计算?
最常见也是最简单的方式就是使用
Process类来创建进程。下面是一个简单的例子:
在现实生活中的购物过程,购物者需要先到商场,找到指定的产品柜台下,查看产品实体以及标价信息,如果产品合适,就将该产品放到购物车中,到收款处付款结算。电子商务网站通过虚拟网页的形式在计算机上摸拟了整个过程,首先电子商务设计人员将产品信息分类显示在网页上,用户查看网页上的产品信息,当用户看到了中意的产品后,可以将该产品添加到购物车,最后使用网上支付工具进行结算,而货物将由公司通过快递等方式发送给购物者
from multiprocessing import Process
import time
def worker(name):
print(f"开始 {name}")
time.sleep(2)
print(f"结束 {name}")
if __name__ == "__main__":
p1 = Process(target=worker, args=("任务A",))
p2 = Process(target=worker, args=("任务B",))
p1.start()
p2.start()
p1.join()
p2.join()这里我们创建了两个子进程分别执行
worker函数。
start()方法启动进程,
join()确保主进程等待子进程全部完成后再继续执行。

如果你要处理的任务数量较多,比如处理大量数据、图像、文件等,可以用
Pool类批量管理进程:
from multiprocessing import Pool
def square(x):
return x * x
if __name__ == "__main__":
with Pool(4) as pool: # 创建最多4个进程的进程池
results = pool.map(square, [1, 2, 3, 4, 5])
print(results)这样你可以一次提交多个任务,由进程池自动分配资源去处理。
使用multiprocessing
时需要注意的问题
避免频繁创建进程
进程的创建和销毁是有开销的,建议尽量复用已有的进程,例如使用Pool
而不是反复创建Process
对象。进程间通信(IPC)比较慢
因为每个进程有独立的内存空间,共享数据需要额外手段(如Queue
、Pipe
或共享内存),这会带来一定性能损耗。注意Windows平台下的兼容性问题
在Windows上运行时,一定要把入口代码写在if __name__ == "__main__":
下,否则可能报错或者无限递归启动新进程。调试时要注意输出混乱
多个进程同时打印内容到控制台,可能导致输出混杂在一起。如果调试困难,可以考虑加锁或记录日志代替print。
哪些场景适合用multiprocessing
?
- 图像处理、视频编码等计算密集型任务
- 批量下载、文件转换等IO+计算混合任务
- 需要长时间运行的后台任务
- 想绕过GIL限制,提高CPU利用率的情况
但如果你的任务主要是网络请求、磁盘读写等IO密集型操作,其实更推荐用
concurrent.futures里的
ThreadPoolExecutor,或者用异步编程模型,那样效率更高也更轻量。
基本上就这些。
multiprocessing虽然功能强大,但在实际使用中还是有几个细节容易忽略,比如入口保护、进程池大小设置、通信方式选择等等。只要理解清楚它的机制,用起来也不复杂。









