gevent通过greenlet实现轻量级协程,利用monkey patch将标准库函数替换为非阻塞版本,结合事件循环自动调度I/O操作,在单线程中以协作式多任务模拟并发,使开发者能用同步写法编写异步程序,适用于I/O密集型场景。

gevent 是一个基于协程的 Python 网络库,它使用 greenlet 和 libev(或 libuv)事件循环来实现高并发的异步编程。它的核心原理是:在单线程中通过协作式多任务(cooperative multitasking)模拟出“并发”效果,让开发者可以用同步写法写出异步程序。
1. Greenlet:轻量级协程
gevent 的基础是 greenlet,它是 C 实现的轻量级协程,可以看作是用户态的微线程。
- 每个 greenlet 都有自己的栈和执行上下文,可以在运行时主动切换到另一个 greenlet。
- 切换由程序控制,不是操作系统调度,开销极小。
- greenlet 本身不提供 I/O 调度能力,gevent 在其基础上封装了自动切换机制。
例如:
// 创建两个 greenlet 并手动切换 from greenlet import greenletdef test1(): print(1) gr2.switch() print(2)
def test2(): print(3) gr1.switch() print(4)
gr1 = greenlet(test1) gr2 = greenlet(test2) gr1.switch() // 输出: 1 3 2
2. Monkey Patch:拦截阻塞调用
Python 标准库中的 socket、time.sleep 等函数是同步阻塞的。gevent 提供了 monkey patch 机制,动态替换这些标准函数为非阻塞版本。
立即学习“Python免费学习笔记(深入)”;
- 调用 gevent.monkey.patch_all() 后,socket.send、socket.recv、time.sleep 等都会被替换成 gevent 内部的协程友好版本。
- 当发生 I/O 操作时,当前 greenlet 会主动让出控制权,事件循环转去执行其他 greenlet。
- I/O 完成后,事件循环再恢复该 greenlet 继续执行。
这样,代码看起来是同步的,实际执行是异步的。
3. 事件循环:驱动协程调度
gevent 使用 libev 或 libuv 作为底层事件循环,监听文件描述符(如 socket)的状态变化。
- 当某个 greenlet 发起网络请求时,gevent 将其挂起,并向事件循环注册回调。
- 事件循环持续监听 I/O 事件,一旦数据可读或可写,就唤醒对应的 greenlet。
- 调度过程完全由 gevent 自动完成,开发者无需手动 yield 或 await。
这使得你可以这样写代码:
import gevent import requestsdef fetch(url): print(f"GET {url}") resp = requests.get(url) // 看似同步,实际是非阻塞 print(f"{url} -> {len(resp.content)}")
并发抓取
gevent.joinall([ gevent.spawn(fetch, 'https://www.php.cn/link/7f272b86ea4f734837b281ad960be2f7'), gevent.spawn(fetch, 'https://www.php.cn/link/148c2ad42607c372038edd48cad30120') ])
虽然没有 async/await,但两个请求是并发执行的。
4. 协作式调度:避免长时间占用 CPU
gevent 是协作式的,意味着只有当 greenlet 主动让出时,其他协程才有机会运行。
- 常见让出时机:sleep、I/O 操作、显式调用 gevent.sleep(0)。
- 如果某段代码纯计算且不触发任何 patch 过的调用,就会阻塞整个事件循环。
- 解决办法:定期插入 gevent.sleep(0) 来主动交出控制权。
例如:
for i in range(1000000): do_something() if i % 1000 == 0: gevent.sleep(0) // 让出执行权基本上就这些。gevent 的魔力在于把复杂的异步逻辑隐藏在底层,让你用最自然的方式写高并发网络程序,特别适合 I/O 密集型场景,比如爬虫、长连接服务等。不过要注意它不适用于 CPU 密集任务,而且由于 monkey patch 是全局替换,可能与其他库产生兼容问题。











