0

0

C++如何处理大文件的高效读写

P粉602998670

P粉602998670

发布时间:2025-09-09 08:12:01

|

519人浏览过

|

来源于php中文网

原创

分块读取和mmap提升大文件处理效率。使用固定缓冲区循环读取避免内存溢出,通过gcount()处理末尾数据;mmap适用于随机访问,减少系统调用;写入时缓冲批量操作,避免频繁I/O;二进制文件需以binary模式打开,防止换行符转换。顺序处理用流式读取,随机访问用mmap,控制内存 usage 并优化性能。

c++如何处理大文件的高效读写

处理大文件时,C++需要避免一次性加载整个文件到内存,防止内存溢出,同时提升读写效率。核心思路是分块读取、使用合适的I/O方法和优化缓冲机制。

使用文件流分块读取

避免使用std::ifstream::seekgstd::ifstream::read一次性读取大文件。应采用固定大小的缓冲区循环读取。

示例代码:

std::ifstream file("large_file.bin", std::ios::binary);
if (!file) { /* 处理错误 */ }

const size_t buffer_size = 1024 * 1024; // 1MB 缓冲区 char buffer[buffer_size]; while (file.read(buffer, buffer_size) || file.gcount() > 0) { size_t bytes_read = file.gcount(); // 处理 buffer 中的 bytes_read 字节 } file.close();

关键点:gcount() 返回最后一次 read() 实际读取的字节数,确保处理末尾不足缓冲区大小的数据。

立即学习C++免费学习笔记(深入)”;

使用 mmap 提高读写效率(仅限支持系统)

在 Linux 或 macOS 上,mmap 可将文件映射到内存地址空间,避免频繁系统调用,适合随机访问或多次扫描大文件。

优点:减少内存拷贝,系统自动管理页面加载。

示例(Linux):

10Web
10Web

AI驱动的WordPress网站自动构建器,托管和页面速度助推器

下载

#include 
#include 
#include 

int fd = open("large_file.bin", O_RDONLY); off_t file_size = lseek(fd, 0, SEEK_END); char mapped = (char)mmap(nullptr, file_size, PROT_READ, MAP_PRIVATE, fd, 0);

// 直接访问 mapped[0] 到 mapped[file_size-1] // ...

munmap(mapped, file_size); close(fd);

注意:mmap 不适合小文件或顺序写入场景,且需注意跨平台兼容性。

优化输出:缓冲写入

写大文件时,避免频繁调用std::ofstream::write。使用缓冲累积数据再批量写入。

建议:

  • 设置文件流的缓冲区:file.rdbuf()->pubsetbuf(buffer, size)
  • 或手动分块写入,每块 1MB~8MB,平衡内存与性能
  • 写完后调用file.flush()确保数据落盘(非必需,析构时会自动 flush)

避免使用 string 或 getline 处理二进制大文件

对于文本大文件,std::getline 在行很长或换行符异常时可能性能差或崩溃。应使用缓冲读取并手动查找换行符。

二进制文件必须用std::ios::binary模式打开,防止换行符被自动转换。

基本上就这些。关键是控制内存用量、减少系统调用次数,并根据访问模式选择合适方法。mmap 适合随机访问,流式读取适合顺序处理。不复杂但容易忽略细节。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

312

2023.08.02

macOS怎么切换用户账户
macOS怎么切换用户账户

在 macOS 系统中,可通过多种方式切换用户账户。如点击苹果图标选择 “系统偏好设置”,打开 “用户与群组” 进行切换;或启用快速用户切换功能,通过菜单栏或控制中心的账户名称切换;还能使用快捷键 “Control+Command+Q” 锁定屏幕后切换。

324

2025.05.09

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1345

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

700

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

773

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

571

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

544

2023.07.20

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 5.8万人学习

C 教程
C 教程

共75课时 | 3.8万人学习

C++教程
C++教程

共115课时 | 10.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号