0

0

如何用C++处理超大文件?内存映射文件技术

P粉602998670

P粉602998670

发布时间:2025-06-26 17:36:02

|

632人浏览过

|

来源于php中文网

原创

使用内存映射文件技术可高效处理超大文件。1. 它将文件直接映射到进程地址空间,避免频繁系统调用;2. 利用虚拟内存管理,按需加载文件页,节省内存;3. 不需一次性加载整个文件,适合gb级以上文件;4. c++++在windows下通过createfilemapping和mapviewoffile实现,在linux下使用mmap函数;5. 优势包括提升i/o效率、简化代码结构、良好的跨平台兼容性;6. 注意事项包括选择只读或可写映射、处理文件大小限制、确保线程安全及完善错误处理。该技术适用于部分读取或随机访问的场景,整体思路清晰且使用简便。

如何用C++处理超大文件?内存映射文件技术

处理超大文件时,传统的读写方式往往会导致性能下降,甚至内存不足的问题。使用C++结合内存映射文件技术(Memory-Mapped Files)是一个高效、稳定的解决方案。

如何用C++处理超大文件?内存映射文件技术

什么是内存映射文件?

内存映射文件是一种操作系统提供的机制,它将磁盘上的文件内容直接映射到进程的地址空间中。程序可以像访问普通内存一样读写文件内容,而不需要频繁调用read()write()函数。

如何用C++处理超大文件?内存映射文件技术

这种方式特别适合处理GB级别以上的大文件,因为它:

立即学习C++免费学习笔记(深入)”;

Pi智能演示文档
Pi智能演示文档

领先的AI PPT生成工具

下载
  • 避免了频繁的系统调用
  • 利用了操作系统的虚拟内存管理
  • 不需要一次性加载整个文件到内存

C++中如何实现内存映射文件?

在Windows和Linux下,实现方式略有不同,但逻辑类似。

如何用C++处理超大文件?内存映射文件技术

Windows平台:使用CreateFileMapping和MapViewOfFile

#include 
#include 

int main() {
    HANDLE hFile = CreateFile(L"largefile.bin", GENERIC_READ, 0, NULL, OPEN_EXISTING, FILE_ATTRIBUTE_NORMAL, NULL);
    HANDLE hMapping = CreateFileMapping(hFile, NULL, PAGE_READONLY, 0, 0, NULL);
    void* pData = MapViewOfFile(hMapping, FILE_MAP_READ, 0, 0, 0);

    // 使用pData访问文件内容
    const char* data = static_cast(pData);
    std::cout << data[0] << std::endl; // 读取第一个字节

    UnmapViewOfFile(pData);
    CloseHandle(hMapping);
    CloseHandle(hFile);
}

Linux平台:使用mmap函数

#include 
#include 
#include 
#include 
#include 

int main() {
    int fd = open("largefile.bin", O_RDONLY);
    struct stat sb;
    fstat(fd, &sb);

    char* data = static_cast(mmap(nullptr, sb.st_size, PROT_READ, MAP_PRIVATE, fd, 0));

    std::cout << data[0] << std::endl;

    munmap(data, sb.st_size);
    close(fd);
}

内存映射处理大文件的优势

  1. 节省内存开销
    文件不会被全部加载进内存,而是按需加载页。

  2. 提升I/O效率
    避免了传统IO的多次拷贝与系统调用开销。

  3. 简化代码结构
    可以直接通过指针访问数据,无需循环读取。

  4. 跨平台兼容性较好
    虽然API不同,但核心思想一致,移植方便。


注意事项和常见问题

  • 只读还是可写?
    根据需求选择映射为只读(MAP_PRIVATE)或可写(MAP_SHARED),避免不必要的页错误。

  • 文件大小限制?
    一般不受限于内存大小,但要注意系统虚拟地址空间限制。

  • 线程安全?
    多线程访问时要自行加锁保护共享内存区域。

  • 错误处理不能少
    每次调用都要检查返回值是否为NULL,比如mmap失败会返回MAP_FAILED


总结一下

内存映射文件技术是处理大文件的一种非常高效的手段,尤其适合那种只需要部分读取或随机访问的场景。虽然具体实现上Windows和Linux略有差异,但整体思路清晰,使用起来也不复杂。

基本上就这些。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

229

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

434

2024.03.01

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

471

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

107

2025.12.24

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

516

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

748

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

419

2023.08.02

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.3万人学习

Git 教程
Git 教程

共21课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号