Go中实现迭代器模式应优先用for range,仅在需延迟计算、流式处理、链式操作或状态封装时才自定义func() (T, bool)风格迭代器,避免过度设计。

Go 语言没有内置的迭代器接口(如 Java 的 Iterator 或 Python 的 __iter__),也不支持泛型约束下的统一迭代协议(直到 Go 1.18 才有泛型,但标准库仍无 Iterable 抽象)。所以「在 Go 中实现迭代器模式」不是套用经典 OOP 模板,而是根据实际需求选择合适的数据遍历抽象方式——多数时候,直接用 for range 就够了;真需要封装状态、延迟计算或组合操作时,才考虑函数式风格的迭代器。
什么时候该自己写迭代器类型而不是用 for range
当你要做这些事时,for range 不够用:
- 遍历逻辑复杂,比如树的深度优先/广度优先、图的拓扑序、文件系统递归扫描,且需中途暂停/恢复
- 数据源是流式或不可重复读的(如网络响应 Body、数据库游标),不能一次性加载进内存
- 需要链式调用多个集合操作(
Filter→Map→Take),且希望延迟执行、避免中间切片分配 - 封装状态(如分页 token、游标偏移、解密上下文)并隐藏底层细节
func() (T, bool) 是最轻量的 Go 迭代器签名
Go 社区广泛接受的迭代器约定是返回一个无参函数,每次调用返回下一个元素和是否还有更多:func() (T, bool)。它比结构体+方法更简单,也比 channel 更可控(无 goroutine 开销、无缓冲风险)。
例如,对一个整数切片实现可重用的迭代器:
func IntSliceIter(slice []int) func() (int, bool) {
i := 0
return func() (int, bool) {
if i >= len(slice) {
return 0, false
}
v := slice[i]
i++
return v, true
}
}
使用时:
iter := IntSliceIter([]int{1, 2, 3})
for v, ok := iter(); ok; v, ok = iter() {
fmt.Println(v)
}
注意:这个签名无法直接用于 for range,必须显式调用。如果硬要适配 range,得包装成 chan(不推荐,易死锁或泄露 goroutine)。
用泛型封装常见操作(Filter / Map)时,保持迭代器签名一致
Go 1.18+ 泛型让这类组合变得可行,但关键原则是:所有操作都接收 func() (T, bool) 并返回同类型(只是内部逻辑不同),才能链式拼接。
示例:一个泛型 Filter 迭代器包装器
func Filter[T any](iter func() (T, bool), pred func(T) bool) func() (T, bool) {
return func() (T, bool) {
for {
v, ok := iter()
if !ok {
return *new(T), false
}
if pred(v) {
return v, true
}
}
}
}
使用:
data := []int{1, 2, 3, 4, 5}
iter := Filter(IntSliceIter(data), func(x int) bool { return x%2 == 0 })
for v, ok := iter(); ok; v, ok = iter() {
fmt.Println(v) // 输出 2, 4
}
容易踩的坑:
-
pred函数里不要做阻塞或 panic 操作,否则迭代器卡死或崩溃 - 返回的
*new(T)是零值占位,调用方不能假设它有意义;真正安全的做法是让调用方只依赖bool判断有效性 - 这种闭包迭代器不是线程安全的,多 goroutine 并发调用会出错
标准库中已有的“类迭代器”行为:别重复造轮子
很多标准库类型其实已经提供了类似迭代器的能力,只是没叫这个名字:
-
bufio.Scanner的Scan()方法返回bool,Text()/Bytes()获取当前项 —— 这就是典型的迭代器模式 -
database/sql.Rows的Next()+Scan()组合,本质也是游标式迭代器 -
os.File.Readdir返回[]fs.DirEntry是批量的,但fs.WalkDir的回调函数参数fs.DirEntry+error可看作流式遍历入口
除非你有明确的组合、延迟、状态封装需求,否则优先用这些已有接口,而不是自己定义 Iterator 结构体加 Next() 方法 —— Go 风格更倾向组合函数而非继承接口。
真正的难点不在语法,而在于决定「哪部分逻辑该延迟、哪部分该提前求值、状态该存在闭包里还是结构体字段里」。这些权衡没法靠模板解决,得看具体数据源特性和性能要求。










