0

0

Go 读取并输出标准输入的高性能实践

霞舞

霞舞

发布时间:2026-01-09 16:22:44

|

993人浏览过

|

来源于php中文网

原创

Go 读取并输出标准输入的高性能实践

本文详解 go 程序在行级 i/o 场景下为何比 python 慢,揭示字符串编码、内存分配与底层字节操作对性能的关键影响,并提供经实测验证的优化方案。

在处理大规模文本流(如数千万行日志或词表)时,一个看似简单的“读一行、输出一行”任务,却可能暴露出语言运行时与标准库设计的深层差异。你观察到 Go 版本比 Python 慢——这并非 Go 本身性能低下,而是默认用法触发了不必要的开销。

核心问题在于:Go 的 scanner.Text() 方法会将原始字节切片([]byte)显式解码为 UTF-8 字符串。该过程包含:

  • 验证每个字节序列是否符合 UTF-8 编码规范;
  • 分配新字符串内存(即使内容完全 ASCII);
  • 复制字节数据到字符串底层数组;
  • 后续 fmt.Println 或 writer.WriteString 还需再将字符串重新编码为字节写入输出缓冲区。

而 Python 2 的 sys.stdin 迭代器(及 Python 3 中的 sys.stdin.buffer)默认以原始字节流方式工作,print ln, 实际上直接转发字节(无编码/解码),零额外转换。这也是为什么升级到 Python 3 并使用 str 行对象后,其性能也会显著下降——它开始做类似 Go 的 Unicode 正规化。

因此,真正的优化路径是:绕过字符串,全程操作 []byte。以下是经过实测(6500 万行词表)的高效 Go 实现:

TemPolor
TemPolor

AI音乐生成器,一键创作免版税音乐

下载
package main

import (
    "os"
    "bufio"
)

func main() {
    reader := bufio.NewReader(os.Stdin)
    scanner := bufio.NewScanner(reader)
    writer := bufio.NewWriter(os.Stdout)
    newline := []byte("\n") // 避免每次创建

    for scanner.Scan() {
        line := scanner.Bytes() // 直接获取字节切片,零拷贝、零解码
        writer.Write(line)
        writer.Write(newline)
    }
    writer.Flush() // 必须调用,确保所有缓冲数据写出
}

关键优化点说明:

  • ✅ 使用 scanner.Bytes() 替代 scanner.Text():保留原始字节视图,避免 UTF-8 解码与字符串分配;
  • ✅ 复用 []byte("\n"):防止循环内重复创建小切片;
  • ✅ bufio.Writer 批量写入:减少系统调用次数;
  • ✅ 显式 writer.Flush():避免因缓冲未满导致输出截断或延迟。
⚠️ 注意事项:此方案假设输入为纯字节流(如 ASCII、UTF-8 或任意二进制兼容编码),且不依赖 Go 字符串的 Unicode 安全特性(如 rune 计数、大小写转换)。若业务逻辑需文本语义处理(如正则匹配中文、规范化换行符),则必须权衡——此时应优先保证正确性,再通过 unsafe.String()(Go 1.20+)等零拷贝转换谨慎优化,而非盲目规避字符串。

最后需要强调:这种“纯管道式 I/O 性能对比”属于微基准测试(micro-benchmark),不代表真实应用性能。实际服务中,I/O 往往伴随解析、校验、转换、网络分发等计算密集型操作,Go 的并发模型、内存控制和编译型执行效率将显著反超解释型语言。性能优化永远始于明确瓶颈——用 pprof 分析 CPU/堆,而非基于直觉替换 API。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

741

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

634

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

756

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

705

2023.08.11

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

3

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号