Benchmark函数名须以Benchmark开头、参数为*testing.B;需预热构造数据、避免循环内重复分配;用-bench=. -benchmem关注ns/op和B/op,多函数对比时每次只改一个变量。

用 go test -bench 测量循环性能,关键不是跑一次,而是让 Go 的基准测试框架自动执行足够多次、取稳定均值,并排除编译器优化干扰。
写一个合法的 Benchmark 函数
函数名必须以 Benchmark 开头,参数类型固定为 *testing.B。别在函数里直接写 for i := 0; i —— 那样测的是你写的数字,不是 Go 调度的真实开销。
正确做法是利用 b.N,它由测试框架动态设定,确保总耗时在合理范围内(通常 1 秒左右):
func BenchmarkForLoop(b *testing.B) {
for i := 0; i < b.N; i++ {
// 这里放你要测的循环体,比如:
sum := 0
for j := 0; j < 100; j++ {
sum += j
}
}
}避免编译器“偷懒”:防止死代码消除
如果循环结果没被使用,Go 编译器可能直接删掉整段逻辑,导致测出“0 ns/op”。必须让结果逃逸或显式使用:
立即学习“go语言免费学习笔记(深入)”;
- 把计算结果赋给全局变量(简单但有效)
- 用
blackhole方式:调用runtime.KeepAlive或将结果传给空函数 - 更常用的是:把结果赋给
b.ReportMetric不支持的变量,再在循环外用blackhole(sum)
示例(防优化):
var result int
func BenchmarkSafeLoop(b *testing.B) {
for i := 0; i < b.N; i++ {
sum := 0
for j := 0; j < 100; j++ {
sum += j
}
result = sum // 强制保留计算
}
// 最后加一行确保 result 不被优化掉(可选)
_ = result
}对比不同循环写法的真实开销
比如想比 for i := 0; i 和 for i := n-1; i >= 0; i--,或 range vs 索引遍历切片,可以写多个 Benchmark 函数:
- 函数名要有区分,如
BenchmarkRangeSlice、BenchmarkIndexSlice - 每次只改一个变量(比如只换遍历方式,数据构造逻辑保持一致)
- 用
go test -bench=. -benchmem同时看时间与内存分配
输出中重点关注 ns/op(每次操作纳秒数)和 B/op(每次分配字节数),小几十 ns 的差异在高频循环中会放大成明显延迟。
控制变量:预热 + 复用数据结构
如果循环依赖某个大 slice 或 map,别在每次 b.N 迭代里重新 make —— 那会把内存分配时间混进结果里。
推荐结构:
func BenchmarkMapLoop(b *testing.B) {
// 预先构造好数据(不在循环内)
m := make(map[int]int, 1000)
for i := 0; i < 1000; i++ {
m[i] = i * 2
}
b.ResetTimer() // 重置计时器,跳过准备阶段
for i := 0; i < b.N; i++ {
sum := 0
for _, v := range m {
sum += v
}
_ = sum
}}
b.ResetTimer() 很重要:它把初始化开销剔除,只测核心循环。










