RPC负载均衡核心是调用前动态选节点,需解耦地址发现、健康检查与路由策略;gRPC推荐round_robin或自定义Resolver+LoadBalancer,net/rpc宜用线程安全NodeSelector实现加权/就近等策略,并分层设超时、带退避重试。

理解RPC负载均衡的核心逻辑
RPC客户端做负载均衡,本质是在多个可用服务节点中,根据策略动态选择一个发起调用。Golang本身不内置负载均衡器,但可通过gRPC(推荐)或自定义net/rpc客户端结合服务发现与选点策略实现。关键不在“连接多少个”,而在“每次调用前如何决策”——这需要解耦服务地址获取、健康检查和路由策略。
基于gRPC的轻量级负载均衡实现
gRPC Go默认支持DNS和passthrough解析器,但生产环境更推荐用round_robin或自定义Resolver + LoadBalancer。实际步骤如下:
- 启用内置轮询:连接时指定
lb_policy=round_robin,例如:grpc.Dial("dns:///service.example.com", grpc.WithDefaultServiceConfig(`{"loadBalancingConfig": [{"round_robin": {}}]}`)) - 集成服务发现:把etcd/Consul/Nacos返回的节点列表注入自定义
resolver.Builder,让gRPC定期刷新地址列表 - 添加健康探测:在Picker中跳过连续失败超过阈值的后端(如5秒内3次超时),避免把请求打到已卡住但TCP连接未断的实例上
手动控制选点:适用于net/rpc或需精细策略的场景
若使用标准net/rpc或需实现最小连接数、加权随机、区域就近等策略,可构建独立的NodeSelector组件:
- 维护一个线程安全的节点池(如
sync.Map),每个节点记录当前活跃请求数、响应延迟均值、最近失败次数 - 每次调用前调用
Select()方法:比如“取延迟最低且失败率<5%的3个节点,再按权重随机选1个” - 配合异步心跳检测(如每10秒发一个空RPC探活),自动剔除无响应节点,并在恢复后平滑加回
避免常见陷阱
很多团队初期会忽略这些细节,导致负载不均或雪崩:
立即学习“go语言免费学习笔记(深入)”;
- 别复用单个连接打所有节点:gRPC连接是多路复用的,但net/rpc建议每个后端建独立连接,否则一个节点卡死可能阻塞整个client
- 超时必须分层设置:Dial超时(连接建立)、Read超时(单次调用)、整体Context超时(含重试),三者不可混用
-
重试要带退避且限制次数:对幂等操作可重试,但需用
backoff.LinearWithJitter防止重试风暴,最多1~2次










