答案:bufio.Scanner适用于按行读取文件,需注意缓冲区限制和错误处理。首先用os.Open打开文件并创建Scanner实例,通过Scan()逐行读取,Text()获取内容,循环后须检查scanner.Err()是否有I/O错误;处理大文件时可调用Buffer()扩大缓冲区以避免ErrTooLong;还可读取strings.NewReader的字符串,适用于测试或配置解析;注意Text()返回值不可重复引用,且需defer关闭文件。

在Go语言中,bufio.Scanner 是读取文件行的常用方式,尤其适合处理按行分割的文本文件。它简洁、高效,适用于日志解析、配置读取等场景。下面介绍如何使用 bufio.Scanner 正确读取文件中的每一行,并提供实用示例和注意事项。
打开文件并创建Scanner
要读取文件,先用 os.Open 打开文件,再通过 bufio.NewScanner 创建一个扫描器实例。
file, err := os.Open("example.txt")
if err != nil {
log.Fatal(err)
}
defer file.Close()
scanner := bufio.NewScanner(file)
for scanner.Scan() {
line := scanner.Text()
fmt.Println(line)
}
if err := scanner.Err(); err != nil {
log.Fatal(err)
}
这段代码会逐行读取文件内容并打印。注意:必须检查 scanner.Err(),以确保读取过程中没有发生错误。
处理大文件时的性能考虑
Scanner 默认使用的缓冲区大小为 4096 字节,对于超长行或大文件可能需要调整。如果某一行超过缓冲区限制,scanner.Scan() 会返回 false 并设置 error。
立即学习“go语言免费学习笔记(深入)”;
可以通过自定义 Scanner.Buffer 来扩展缓冲区:
file, _ := os.Open("large_file.txt")
defer file.Close()
scanner := bufio.NewScanner(file)
const maxCapacity = 1024 * 1024 // 1MB
buf := make([]byte, maxCapacity)
scanner.Buffer(buf, maxCapacity)
for scanner.Scan() {
fmt.Println(scanner.Text())
}
if err := scanner.Err(); err != nil {
if err == bufio.ErrTooLong {
log.Println("一行内容过长,超出缓冲区限制")
} else {
log.Fatal(err)
}
}
读取字符串而非文件
除了文件,Scanner 也能读取内存中的字符串。只需将 strings.NewReader 作为输入源:
input := "第一行\n第二行\n第三行" reader := strings.NewReader(input) scanner := bufio.NewScanner(reader)for scanner.Scan() { fmt.Println(scanner.Text()) }
这在单元测试或配置解析中非常有用。
常见问题与注意事项
-
不要重复使用 Text() 返回的字符串引用:每次调用
Scan()后,之前Text()返回的内容可能被覆盖。 -
及时关闭文件:使用
defer file.Close()防止资源泄露。 -
错误处理不能省略:即使循环结束,也要检查
scanner.Err()是否有底层I/O错误。 - Scanner 不自动处理换行符差异:无论 Unix(\n) 还是 Windows(\r\n),都能正确识别行尾,无需额外处理。
基本上就这些。只要掌握基本用法和边界情况,bufio.Scanner 就能稳定高效地完成大多数按行读取任务。










