
探讨RabbitMQ 4.0升级后频繁断连的问题
在使用RabbitMQ时,升级到4.0版本后,许多用户可能会遇到AMQP连接每3分钟重连一次的问题。之前使用RabbitMQ 3.x时,连接是稳定的,但在升级到4.x后,使用nameko eventlet kombu amqp的组合时,会频繁出现断连情况,尽管有自动重连机制,但依然令人烦恼。
问题描述
断连日志显示了两种情况:
第一种情况:
尝试连接到代理时出错,地址为amqp://ponponon:********@192.168.38.223:5672// ([Errno 104] ECONNRESET)。 将在2.0秒后重试。 尝试连接到代理时出错,地址为amqp://ponponon:********@192.168.38.223:5672// ([Errno 104] ECONNRESET)。 将在2.0秒后重试。 尝试连接到代理时出错,地址为amqp://ponponon:********@192.168.38.223:5672// ([Errno 104] ECONNRESET)。 将在2.0秒后重试。 尝试连接到代理时出错,地址为amqp://ponponon:********@192.168.38.223:5672// ([Errno 104] ECONNRESET)。
第二种情况:
与代理的连接丢失,正在尝试重新建立连接...
Traceback (最近的调用堆栈):
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/kombu/mixins.py", line 174, in run
for _ in self.consume(limit=None, **kwargs):
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/kombu/mixins.py", line 196, in consume
conn.drain_events(timeout=safety_interval)
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/kombu/connection.py", line 341, in drain_events
return self.transport.drain_events(self.connection, **kwargs)
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/kombu/transport/pyamqp.py", line 171, in drain_events
return connection.drain_events(**kwargs)
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/amqp/connection.py", line 526, in drain_events
while not self.blocking_read(timeout):
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/amqp/connection.py", line 531, in blocking_read
frame = self.transport.read_frame()
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/amqp/transport.py", line 294, in read_frame
frame_header = read(7, True)
File "/home/pon/.local/share/virtualenvs/parser-szge04QH/lib/python3.10/site-packages/amqp/transport.py", line 637, in _read
raise OSError('服务器意外关闭连接')
OSError: 服务器意外关闭连接RabbitMQ是通过Docker Compose启动的,相关的配置如下:
services:
rabbitmq3-management:
restart: always
container_name: rabbitmq3-management
image: rabbitmq:4.0.5-management
hostname: rabbitmq3-management-standalone
logging:
driver: json-file
options:
max-size: "100m"
max-file: "1"
environment:
- RABBITMQ_DEFAULT_USER=ponponon
- RABBITMQ_DEFAULT_PASS=ponponon
volumes:
- "./volumes:/var/lib/rabbitmq"
- "./rabbitmq.conf:/etc/rabbitmq/rabbitmq.conf"
ports:
- "5672:5672"
- "15672:15672"
- "15692:15692"问题分析
从日志和配置来看,这种频繁断连的问题可能与RabbitMQ 4.0版本的某些新特性或变更有关。心跳机制已经设置好,但依然出现这种情况,可能是以下原因导致的:
- 心跳超时设置:RabbitMQ 4.0可能对心跳超时的处理有所改变,导致连接每隔一段时间就被关闭。可以尝试调整心跳超时时间,看是否能解决问题。
- 网络问题:虽然没有明确的网络问题,但ECONNRESET错误可能与网络连接不稳定有关。检查网络环境是否稳定,以及是否有防火墙或网络设备导致连接中断。
- 客户端库问题:使用nameko eventlet kombu amqp的组合,可能存在与RabbitMQ 4.0不兼容的问题。检查这些库的最新版本是否有针对RabbitMQ 4.0的更新。
- RabbitMQ配置问题:检查RabbitMQ的配置文件,看是否有与连接相关的设置需要调整。例如,检查是否有关于连接超时或心跳的配置项。
解决方案
-
调整心跳超时:在RabbitMQ的配置文件中,尝试增加心跳超时时间。例如,可以在rabbitmq.conf中添加:
heartbeat = 60
这将心跳间隔设置为60秒,尝试是否能改善连接稳定性。
升级客户端库:确保使用的最新版本的nameko、eventlet、kombu和amqp库。这些库可能已经修复了与RabbitMQ 4.0相关的问题。
网络环境检查:排查网络环境,确保没有防火墙或其他网络设备导致连接中断的问题。
RabbitMQ日志分析:查看RabbitMQ的日志,了解是否有其他与连接相关的信息,这些信息可能有助于进一步诊断问题。
通过以上步骤,应该能够找到导致RabbitMQ 4.0版本升级后频繁断连的原因,并采取相应的措施解决问题。










