0

0

c++怎么实现大文件的分块读写_c++ 文件指针seekp与seekg偏移控制【方法】

尼克

尼克

发布时间:2026-01-01 17:39:09

|

210人浏览过

|

来源于php中文网

原创

大文件分块读写需用binary模式、64KB~1MB块大小、std::vector缓冲区,通过seekg/seekp按字节偏移定位,用gcount()校验实际读取量,避免内存溢出与文本模式陷阱。

c++怎么实现大文件的分块读写_c++ 文件指针seekp与seekg偏移控制【方法】

大文件分块读写的典型做法

直接用 std::ifstream::read() 一次性读整个 GB 级文件会触发内存溢出或系统拒绝分配,必须分块。核心是控制每次读取的字节数,并用 seekg() 定位起始位置。

关键点:块大小不是越大越好——通常设为 64KB~1MB(655361048576),兼顾 I/O 效率与内存安全;避免用 std::string 存原始二进制块,改用 std::vector 或裸 char* 缓冲区。

  • file.seekg(offset, std::ios::beg) 跳转到指定字节偏移(注意:offsetstd::streamoff 类型,别用 int
  • 读完一块后,offset += chunk_size,继续下一轮
  • 最后一次读可能不足整块,需检查 file.gcount() 获取实际读取字节数
  • 写入时同理,用 ofstream.seekp(offset, std::ios::beg) 定位,再 write()

seekg/seekp 的偏移单位和常见错误

seekg()seekp() 的偏移量单位始终是「字节」,不是字符数、行号或记录数。对文本文件用 std::ios::atestd::ios::end 获取文件大小时,结果也以字节为单位,但要注意:

  • Windows 下若文件以文本模式打开(默认),\r\n 会被当成一个字符处理,seekg() 行为不可靠——必须用 std::ios::binary 模式
  • seekg(0, std::ios::end) 后调 tellg() 才能得到总字节数,但此时文件指针在末尾,后续读需先 seekg(0) 回开头
  • std::streamoff 在 32 位平台可能只有 4 字节,无法表示 >2GB 文件的偏移——编译时确保定义了 _FILE_OFFSET_BITS=64(Linux)或使用支持大文件的 CRT(MSVC 需 /D "_CRT_SECURE_NO_WARNINGS" + 正确链接)

二进制大文件分块拷贝的最小可行示例

下面代码实现从 src.bin 分块拷贝到 dst.bin,每块 1MB,显式控制偏移:

立即学习C++免费学习笔记(深入)”;

MCP官网
MCP官网

Model Context Protocol(模型上下文协议)

下载
#include 
#include 

int main() { std::ifstream src("src.bin", std::ios::binary); std::ofstream dst("dst.bin", std::ios::binary);

const size_t chunk_size = 1048576;
std::vector buf(chunk_size);

src.seekg(0, std::ios::end);
std::streamoff total = src.tellg();
src.seekg(0);

std::streamoff offset = 0;
while (offset zuojiankuohaophpcn total) {
    size_t to_read = std::min(chunk_size, static_castzuojiankuohaophpcnsize_tyoujiankuohaophpcn(total - offset));
    src.read(buf.data(), to_read);
    size_t actual = static_castzuojiankuohaophpcnsize_tyoujiankuohaophpcn(src.gcount());
    dst.write(buf.data(), actual);
    offset += actual;
}
return 0;

}

注意:src.gcount() 必须在每次 read() 后立即获取,它反映上一次读操作真实字节数;不能依赖 to_read,因为文件可能被并发修改或到达 EOF 边界。

seekp 写入时覆盖 vs 追加的陷阱

seekp() 定位后调 write(),行为取决于文件打开方式:

  • std::ios::binary 打开但没加 std::ios::trunc:写入会覆盖对应位置,文件长度不变(除非写到末尾之后,会扩展)
  • std::ios::app 时,seekp() 无效——所有写入强制追加到末尾
  • 想“随机写入”某块数据(如更新 ZIP 中某个文件),必须确保目标文件已存在且足够长(可用 seekp(file_size-1); write("\0", 1) 预扩展)

大文件场景下,seekp() 后写入比反复打开/关闭快得多,但务必确认磁盘空间充足——写入失败时不会自动回滚,容易产生半截损坏文件。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

312

2023.08.02

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

312

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

522

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

49

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

190

2025.08.29

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

517

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1052

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

749

2023.08.01

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

65

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.4万人学习

Git 教程
Git 教程

共21课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号