不能只写 io.Copy(dst, src) 就完事,因为它仅复制字节流,不处理文件元信息、完整性校验、原子性及错误检查,易导致数据损坏或不一致。

Go 语言里用 io.Copy 做文件备份是可行的,但直接调用它不处理错误、不校验、不支持大文件断点或并发时,很容易出问题——比如备份中途失败导致目标文件损坏,或者源文件被修改造成数据不一致。
为什么不能只写 io.Copy(dst, src) 就完事
io.Copy 只负责字节流复制,不关心文件元信息(如修改时间、权限)、不校验完整性、也不保证原子性。实际备份中常见问题包括:
- 目标文件已存在,
os.Create会清空它,若复制中断,原备份就丢了 - 源文件在复制过程中被写入(如日志文件),导致目标文件内容错乱
- 没有检查
io.Copy返回的n, err,错误被忽略,误以为备份成功 - 大文件(>2GB)在 32 位系统或某些 I/O 层可能触发
int溢出(虽然 Go 1.21+ 的io.Copy内部用int64,但仍需注意调用方逻辑)
安全备份:先写临时文件,再原子替换
避免覆盖正在使用的备份文件,标准做法是写到临时路径,校验后再 os.Rename 替换。这能保证目标文件始终是完整可用的。
src, err := os.Open("data.log")
if err != nil {
log.Fatal(err)
}
defer src.Close()
tmpFile, err := os.Create("data.log.bak.tmp")
if err != nil {
log.Fatal(err)
}
defer tmpFile.Close()
n, err := io.Copy(tmpFile, src)
if err != nil {
log.Fatal("copy failed:", err)
}
if err := tmpFile.Close(); err != nil {
log.Fatal(err)
}
// 校验长度(可选,简单防截断)
srcStat, _ := src.Stat()
if n != srcStat.Size() {
log.Fatal("incomplete copy:", n, "vs", srcStat.Size())
}
// 原子替换
if err := os.Rename("data.log.bak.tmp", "data.log.bak"); err != nil {
log.Fatal(err)
}
保留文件属性:用 os.Chtimes 和 os.Chmod
io.Copy 不复制修改时间、权限等。如果需要严格镜像,得手动设置:
立即学习“go语言免费学习笔记(深入)”;
- 用
src.Stat()获取os.FileInfo - 用
os.Chtimes(dstPath, fi.ModTime(), fi.ModTime())同步时间戳 - 用
os.Chmod(dstPath, fi.Mode())复制权限(注意:Windows 上部分 mode 位无效) - 注意:符号链接、用户/组 ID 等需额外处理(
os.Readlink/os.Lchown),普通备份通常不需要
大文件或高可靠性场景:加校验和 + 进度回调
生产环境建议在 io.Copy 时注入校验逻辑。例如用 hash.Hash 包实时计算 SHA256:
src, _ := os.Open("huge.bin")
defer src.Close()
dst, _ := os.Create("huge.bin.bak.tmp")
defer dst.Close()
hash := sha256.New()
writer := io.MultiWriter(dst, hash)
n, err := io.Copy(writer, src)
if err != nil {
log.Fatal(err)
}
expectedSum := srcHashSum // 需提前算好或从 manifest 读取
if !bytes.Equal(hash.Sum(nil), expectedSum) {
os.Remove("huge.bin.bak.tmp")
log.Fatal("checksum mismatch")
}
进度反馈可用 io.TeeReader + 自定义 WriteTo 实现,但要注意避免影响性能;对秒级敏感场景,建议改用带缓冲的 bufio.Reader 并分块读取。
真正麻烦的不是复制本身,而是“什么时候才算一次成功的备份”——时间戳是否一致、校验和是否匹配、目标文件是否可读、旧备份是否该清理。这些逻辑 io.Copy 一个都不管,得自己补全。










