0

0

Go语言如何读取CSV文件_CSV文件处理方式讲解

P粉602998670

P粉602998670

发布时间:2026-01-12 14:53:21

|

424人浏览过

|

来源于php中文网

原创

用 encoding/csv 读取标准 CSV 文件最稳妥,但需确保 UTF-8 无 BOM;GBK 等编码须先转码;大文件应流式 Read 避免 OOM;写入时需防 Excel 公式注入。

go语言如何读取csv文件_csv文件处理方式讲解

encoding/csv 读取标准 CSV 文件最稳妥

Go 标准库的 encoding/csv 包是处理合规 CSV 的首选,它能正确解析带引号、换行、逗号转义的字段,不用自己写状态机。但前提是文件编码为 UTF-8,且无 BOM;遇到 GBK 或含 BOM 的文件会直接报错 invalid UTF-8

常见错误现象:record on line X: wrong number of fields —— 多半是某行字段被双引号包裹后内部含换行符,而你用了 Read() 而非 ReadAll(),导致按行切割失败。

  • 始终用 csv.NewReader(file) 包裹 *os.Fileio.Reader,别直接读字节
  • 如果首行为表头,调用一次 r.Read() 获取 header,再用 r.ReadAll() 读余下数据(ReadAll 内部已处理跨行字段)
  • 字段含双引号时,Go 默认要求成对出现且被引号包裹,如 "abc""def" 表示 abc"def;不支持单引号或反斜杠转义
file, _ := os.Open("data.csv")
r := csv.NewReader(file)
records, err := r.ReadAll()
if err != nil {
    log.Fatal(err)
}
for i, record := range records {
    fmt.Printf("row %d: %v\n", i, record)
}

处理带 BOM 或非 UTF-8 编码的 CSV 文件

Windows 记事本保存的 CSV 常带 UTF-8 BOM(\xEF\xBB\xBF),csv.NewReader 会把它当非法字符报错。GBK/GB2312 文件更常见于老系统导出数据,标准包完全不识别。

  • 检测并跳过 UTF-8 BOM:读取前 3 字节,若为 \xEF\xBB\xBF,则用 io.MultiReader(bytes.NewReader([]byte{}), file) 跳过
  • GBK 文件必须先转码:用 golang.org/x/text/encoding/charmap 中的 GB18030(兼容 GBK)解码,再传给 csv.NewReader
  • 不要用 strings.ReplaceAll 或正则“删 BOM”——BOM 可能出现在任意位置,且 UTF-8 多字节序列不能简单字节替换
file, _ := os.Open("gbk.csv")
defer file.Close()
decoder := charmap.GB18030.NewDecoder()
reader := transform.NewReader(file, decoder)
r := csv.NewReader(reader)
records, _ := r.ReadAll()

大文件场景下避免 ReadAll 导致 OOM

ReadAll 会把整个文件加载进内存,100MB CSV 可能吃掉 500MB+ 内存(字符串重复分配、slice 扩容)。真实业务中应流式处理,尤其做 ETL 或导入数据库时。

GPTAgent
GPTAgent

一个无代码创建AI应用程序的工具

下载

立即学习go语言免费学习笔记(深入)”;

  • for record, err := r.Read(); err == nil; record, err = r.Read() 循环逐行读,每行处理完立即释放引用
  • 注意 record 是切片,底层共用同一块缓冲区,若需长期保存某行,必须 append([]string{}, record...) 拷贝
  • 设置 r.Comma = '\t' 可读 TSV;r.TrimLeadingSpace = true 自动去字段前导空格(但不去引号内空格)

写入 CSV 时防止 SQL 注入或 XSS 的关键点

CSV 本身不是执行环境,但若导出数据被 Excel 打开,字段以 =+-@ 开头,Excel 会误判为公式执行——这属于客户端风险,但服务端可主动规避。

  • 对每个字段做前置检查:若字符串以 =+-@ 开头,统一在前面加单引号 '(Excel 会显示该引号,但不执行)
  • 不要依赖 csv.Write 自动加引号:它只在含逗号、换行或引号时才包裹,对公式前缀无效
  • 若字段含 HTML 标签(如从富文本提取),不建议在 CSV 中保留——CSV 不是展示格式,应导出纯文本或另附 HTML 版本

真正难处理的是嵌套结构(如 JSON 字段)、超长字段截断、以及缺失值统一标记(NULL 还是空字符串)。这些得结合业务定规则,标准库只管语法,不管语义。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

178

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

226

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

337

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

208

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

388

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

194

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

189

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

192

2025.06.17

Java 项目构建与依赖管理(Maven / Gradle)
Java 项目构建与依赖管理(Maven / Gradle)

本专题系统讲解 Java 项目构建与依赖管理的完整体系,重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例,帮助学习者掌握 从零搭建、维护到发布 Java 工程的标准化流程,提升在实际团队开发中的工程能力与协作效率。

7

2026.01.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 11.5万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号