Go中HTTP重试需区分可重试错误(5xx、408、429、网络超时/拒绝)与不可重试错误(400/401/403/404等),结合嵌套context控制单次与总超时,采用指数退避+抖动,并封装RetryableClient避免资源泄漏。

在Go中实现HTTP请求重试,核心是用http.Client配合自定义RoundTripper或手动控制重试逻辑,关键在于区分可重试错误(如网络超时、连接拒绝)和不可重试错误(如400、401),并避免无节制重试。
选择重试触发条件:只重试临时性失败
不是所有错误都该重试。HTTP状态码中,5xx(服务端错误)通常可重试;4xx中除408(Request Timeout)、429(Too Many Requests)外多数代表客户端问题,不应重试。网络层错误如net.OpError、url.Error(含i/o timeout、connection refused)属于典型可重试场景。
- 检查错误是否为网络底层错误:
errors.Is(err, context.DeadlineExceeded)或用strings.Contains(err.Error(), "timeout") - 对HTTP响应,先判断
resp.StatusCode >= 500 && resp.StatusCode ,或显式允许的4xx(如429) - 跳过重试:400、401、403、404、405等语义明确的客户端错误
用context控制单次请求与整体重试超时
每次重试应有独立超时,同时整个重试过程也需总时限约束,防止无限等待。推荐用嵌套context.WithTimeout:外层控总耗时,内层控单次请求。
- 初始化总上下文:
ctx, cancel := context.WithTimeout(context.Background(), 30*time.Second) - 每次重试前创建子上下文:
req = req.WithContext(context.WithTimeout(ctx, 5*time.Second)) - 务必调用
cancel()避免goroutine泄漏
实现带退避策略的循环重试
连续重试会加剧服务压力,应加入指数退避(exponential backoff)。简单做法是每次失败后等待baseDelay * 2^attempt,再加随机抖动防“重试风暴”。
立即学习“go语言免费学习笔记(深入)”;
- 基础延迟设为100ms,最大重试3次,则等待时间约为100ms → 200ms → 400ms
- 加入抖动:
time.Sleep(time.Duration(rand.Int63n(int64(jitter))) + base) - 重试前检查上下文是否已取消:
if ctx.Err() != nil { return nil, ctx.Err() }
封装成可复用的Client辅助方法
不建议修改全局http.DefaultClient,而是封装一个带重试能力的工具函数或结构体:
- 定义
RetryableClient结构,含MaxRetries、BaseDelay、Client *http.Client - 提供
Do(req *http.Request) (*http.Response, error)方法,内部执行带退避的循环 - 支持自定义重试判定函数:
ShouldRetry func(*http.Response, error) bool,提升灵活性
不复杂但容易忽略细节,比如忘记关闭响应Body、未重置请求Body(POST时需req.Body = io.NopCloser(bytes.NewReader(data))),这些都会导致重试失败或资源泄漏。










