Go微服务监控核心是轻量采集、标准暴露、统一拉取;用prometheus/client_golang暴露/metrics端点,自动收集运行时指标并支持自定义业务指标,同时提供/health和/ready健康检查端点,并可集成OpenTelemetry实现链路追踪与指标统一采集。

用 Go 实现微服务监控,核心是轻量采集、标准暴露、统一拉取。Golang 本身适合编写高并发、低开销的监控端点,配合 Prometheus 生态最自然。
暴露标准指标端点(/metrics)
使用 prometheus/client_golang 库,在服务中嵌入 HTTP handler,自动收集 Go 运行时指标(goroutines、GC、内存),并支持自定义业务指标。
- 初始化注册器和 handler:
import (
"github.com/prometheus/client_golang/prometheus"
"github.com/prometheus/client_golang/prometheus/promhttp"
)
func init() {
prometheus.MustRegister(prometheus.NewGoCollector()) // 默认运行时指标
// 自定义指标,例如请求计数器
httpRequestsTotal := prometheus.NewCounterVec(
prometheus.CounterOpts{
Name: "http_requests_total",
Help: "Total number of HTTP requests",
},
[]string{"method", "path", "status"},
)
prometheus.MustRegister(httpRequestsTotal)
// 在 HTTP handler 中打点:httpRequestsTotal.WithLabelValues(r.Method, r.URL.Path, strconv.Itoa(w.WriteHeader)).Inc()
}
// 暴露 /metrics
http.Handle("/metrics", promhttp.Handler())
上报健康状态(/health 或 /ready)
健康检查不是指标,但属于监控关键信号。建议提供两个端点:
- /health:返回服务自身是否存活(如能否连通 DB、Redis)
- /ready:返回服务是否就绪接收流量(如依赖已就绪、配置已加载)
返回 JSON,HTTP 状态码 200 表示健康,5xx 表示异常。可搭配 Kubernetes liveness/readiness probe 使用。
立即学习“go语言免费学习笔记(深入)”;
http.HandleFunc("/health", func(w http.ResponseWriter, r *http.Request) {
w.Header().Set("Content-Type", "application/json")
if err := db.Ping(); err != nil {
http.Error(w, `{"status":"down","reason":"db unreachable"}`, http.StatusInternalServerError)
return
}
json.NewEncoder(w).Encode(map[string]string{"status": "up"})
})
集成 OpenTelemetry 收集链路与指标
若需分布式追踪 + 指标 + 日志三合一,推荐用 OpenTelemetry Go SDK。它支持将指标导出为 Prometheus 格式,也可推送到 OTLP Collector。
- 初始化全局指标 provider
- 创建 instrument(Counter、Histogram)并记录
- 配置 exporter:PrometheusExporter(用于 scrape)或 OTLPExporter(对接 Jaeger/Tempo/Grafana)
示例片段:
provider := metric.NewMeterProvider(
metric.WithReader(prometheus.NewPrometheusReader()),
meter := provider.Meter("my-service")
reqCounter, _ := meter.Int64Counter("http.requests.total")
reqCounter.Add(ctx, 1, metric.WithAttributes(attribute.String("method", "GET")))
避免常见陷阱
- 不要在指标 collector 中做耗时操作(如查 DB、远程调用),否则会拖慢 /metrics 响应
- 自定义指标命名遵循 Prometheus 规范:小写字母+下划线,单位写在名称末尾(如 http_request_duration_seconds)
- 避免高频打点(如每请求都记录完整 trace ID),用 Histogram 或 Summary 聚合延迟,用 Counter 统计频次
- 多个微服务共用同一 Prometheus 实例时,务必通过 job 和 instance 标签区分来源
不复杂但容易忽略。关键是把指标当作一等公民设计——启动即注册、请求即打点、异常即上报。










