如何用C++优化网络IO性能 epoll与io_uring使用指南

P粉602998670

发布时间：2025-07-15 10:29:02

1113人浏览过

来源于php中文网

原创

选择c++++网络io模型需根据场景权衡epoll与io\_uring。1.epoll成熟稳定、易用，适合高稳定性需求或开发资源有限的场景；2.io\_uring性能潜力大，适合高并发、低延迟场景，但实现复杂且需新内核支持；3.选择时应综合考虑并发量、延迟、cpu利用率、开发难度及平台支持；4.epoll使用中需注意et/lt模式选择、epolloneshot、惊群效应和错误处理；5.io\_uring优势在于减少系统调用、零拷贝、异步io，但适用高性能存储、数据库等场景，不适用于低内核版本或开发资源不足的情况。

如何用C++优化网络IO性能 epoll与io_uring使用指南

网络IO性能优化，C++里绕不开epoll和io_uring。前者成熟稳定，后者是后起之秀，性能潜力巨大。选哪个？得看你的具体场景。

解决方案

C++网络IO优化，本质上就是在有限的硬件资源下，尽可能提高数据传输效率。阻塞式IO、多线程、select/poll，这些都是老生常谈。但真要榨干CPU的每一滴性能，epoll和io_uring才是王道。

立即学习“C++免费学习笔记（深入）”；

epoll的优势在于成熟、稳定、易用。它基于事件驱动，只有在socket有数据可读、可写或者发生错误时，才会通知应用程序。这避免了不必要的轮询，大大提高了CPU利用率。

io_uring则更激进。它引入了用户态和内核态共享的队列，应用程序可以直接将IO请求提交到队列中，然后等待内核完成。这种方式避免了系统调用带来的上下文切换开销，性能提升非常明显。但io_uring的实现相对复杂，需要对内核有深入的了解。

选择哪个？如果你的应用对延迟非常敏感，并且需要处理大量的并发连接，那么io_uring可能是更好的选择。但如果你的应用对稳定性要求更高，或者对内核的了解不够深入，那么epoll仍然是一个不错的选择。

如何选择合适的IO模型？

选择IO模型，就像选车。你得考虑你的需求、预算、以及驾驶技术。

Adobe 官方Flash动画优化指南 pdf版

来自Adobe官方的Flash动画优化指南教程，包括以下的内容：　　• 如何节省内存　　• 如何最大程度减小 CPU 使用量　　• 如何提高 ActionScript 3.0 性能　　• 加快呈现速度　　• 优化网络交互　　• 使用音频和视频　　• 优化 SQL 数据库性能　　• 基准测试和部署应用程序　　…&hel

下载

并发量： 并发量越大，越需要异步IO模型。epoll和io_uring都是异步IO模型，在高并发场景下表现优异。
延迟： 如果你的应用对延迟非常敏感，那么io_uring可能是更好的选择。但需要注意的是，io_uring的延迟优势只有在内核支持的情况下才能体现出来。
CPU利用率： epoll和io_uring都能有效提高CPU利用率，避免不必要的轮询。
开发难度： epoll相对简单易用，io_uring则需要对内核有深入的了解。
平台支持： epoll在Linux平台上的支持非常完善，io_uring则需要较新的内核版本。

所以，没有绝对的“最佳”IO模型，只有最适合你的IO模型。

epoll的使用细节与常见坑点

epoll的使用看似简单，但细节决定成败。

ET模式 vs LT模式： ET（边缘触发）模式只在socket状态发生变化时通知应用程序，需要一次性读取所有数据。LT（水平触发）模式则只要socket中有数据可读，就会一直通知应用程序。ET模式效率更高，但更容易出现漏读的情况，需要小心处理。
EPOLLONESHOT： 这个选项可以防止同一个socket被多个线程同时处理，避免竞争条件。
惊群效应： 多个线程同时监听同一个socket，当有连接到来时，所有线程都会被唤醒。这会导致不必要的上下文切换，降低性能。可以通过SO_REUSEPORT选项来避免惊群效应。
错误处理： 网络编程中，错误处理至关重要。要仔细检查每一个系统调用的返回值，并妥善处理各种错误情况。比如，EAGAIN表示资源暂时不可用，需要稍后重试；ECONNRESET表示连接被对方重置，需要关闭socket。
代码示例：

#include 
#include 
#include 
#include 
#include 

int main() {
    int epoll_fd = epoll_create1(0);
    if (epoll_fd == -1) {
        perror("epoll_create1");
        return 1;
    }

    // 创建一个socket (假设已经创建并绑定)
    int socket_fd = socket(AF_INET, SOCK_STREAM, 0);
    // ... (绑定socket, 监听socket)

    // 设置socket为非阻塞模式
    int flags = fcntl(socket_fd, F_GETFL, 0);
    fcntl(socket_fd, F_SETFL, flags | O_NONBLOCK);

    epoll_event event;
    event.events = EPOLLIN | EPOLLET; // 边缘触发模式
    event.data.fd = socket_fd;

    if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, socket_fd, &event) == -1) {
        perror("epoll_ctl: add socket_fd");
        close(socket_fd);
        close(epoll_fd);
        return 1;
    }

    epoll_event events[10];
    while (true) {
        int nfds = epoll_wait(epoll_fd, events, 10, -1); // -1表示无限期等待
        if (nfds == -1) {
            perror("epoll_wait");
            break;
        }

        for (int i = 0; i < nfds; ++i) {
            if (events[i].data.fd == socket_fd) {
                // 新连接到来
                sockaddr_in client_addr;
                socklen_t client_len = sizeof(client_addr);
                int new_socket = accept(socket_fd, (sockaddr*)&client_addr, &client_len);
                if (new_socket == -1) {
                    perror("accept");
                    continue;
                }

                // 设置新连接为非阻塞模式
                flags = fcntl(new_socket, F_GETFL, 0);
                fcntl(new_socket, F_SETFL, flags | O_NONBLOCK);

                // 将新连接添加到epoll中
                event.events = EPOLLIN | EPOLLET;
                event.data.fd = new_socket;
                if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, new_socket, &event) == -1) {
                    perror("epoll_ctl: add new_socket");
                    close(new_socket);
                }
            } else if (events[i].events & EPOLLIN) {
                // socket可读
                int current_socket = events[i].data.fd;
                char buffer[1024];
                ssize_t count;

                while ((count = recv(current_socket, buffer, sizeof(buffer), 0)) > 0) {
                    // 处理数据
                    std::cout << "Received: " << std::string(buffer, count) << std::endl;
                }

                if (count == -1) {
                    if (errno != EAGAIN) {
                        perror("recv");
                        close(current_socket);
                        epoll_ctl(epoll_fd, EPOLL_CTL_DEL, current_socket, NULL);
                    }
                } else if (count == 0) {
                    // 连接关闭
                    std::cout << "Connection closed by peer." << std::endl;
                    close(current_socket);
                    epoll_ctl(epoll_fd, EPOLL_CTL_DEL, current_socket, NULL);
                }
            } else if (events[i].events & (EPOLLERR | EPOLLHUP)) {
                // 发生错误或连接关闭
                std::cerr << "Epoll error on socket: " << events[i].data.fd << std::endl;
                close(events[i].data.fd);
                epoll_ctl(epoll_fd, EPOLL_CTL_DEL, events[i].data.fd, NULL);
            }
        }
    }

    close(epoll_fd);
    close(socket_fd);

    return 0;
}

io_uring的优势、劣势与适用场景

io_uring就像F1赛车，性能极致，但需要高超的驾驶技巧。

优势： 零拷贝、异步IO、批量提交、批量完成。这些特性使得io_uring在处理大量小IO请求时，性能提升非常明显。
劣势： 实现复杂、学习曲线陡峭、需要较新的内核版本。
适用场景： 高性能存储、数据库、网络服务器。
不适用场景： 对稳定性要求极高的场景、内核版本过低的场景、开发资源不足的场景。

io_uring的性能优势主要体现在以下几个方面：

减少系统调用： io_uring允许应用程序将多个IO请求批量提交到内核，然后一次性等待所有请求完成。这大大减少了系统调用的次数，降低了上下文切换的开销。
零拷贝： io_uring支持零拷贝技术，允许数据直接在用户态和内核态之间传输，无需经过中间缓冲区。这避免了数据的复制开销，提高了传输效率。
异步IO： io_uring是真正的异步IO，应用程序可以提交IO请求后立即返回，无需等待IO完成。这使得应用程序可以并发处理多个IO请求，提高了吞吐量。

总而言之，io_uring是一把双刃剑。用好了，性能提升显著；用不好，可能适得其反。

如何在C++中使用io_uring？

使用io_uring需要引入liburing库。

初始化： 首先需要初始化io_uring，创建一个ring结构体。
提交IO请求： 使用io_uring_get_sqe函数获取一个submission queue entry（SQE），然后设置SQE的参数，例如文件描述符、操作类型、数据缓冲区等。
提交队列： 使用io_uring_submit函数将SQE提交到内核。
等待完成： 使用io_uring_wait_cqe函数等待completion queue entry（CQE）的到来。CQE包含了IO操作的结果。
处理结果： 从CQE中获取IO操作的结果，并进行相应的处理。
清理： 使用io_uring_queue_exit函数释放ring结构体。
代码示例：

#include 
#include 
#include 
#include 
#include 
#include 

#define BUF_SIZE 4096

int main() {
    io_uring ring;
    io_uring_queue_init(1024, &ring, 0); // 初始化io_uring

    int fd = open("test.txt", O_RDONLY);
    if (fd < 0) {
        perror("open");
        return 1;
    }

    char *buf = new char[BUF_SIZE];
    memset(buf, 0, BUF_SIZE);

    io_uring_sqe *sqe = io_uring_get_sqe(&ring); // 获取SQE
    if (!sqe) {
        std::cerr << "Could not get SQE" << std::endl;
        close(fd);
        delete[] buf;
        io_uring_queue_exit(&ring);
        return 1;
    }

    io_uring_prep_read(sqe, fd, buf, BUF_SIZE, 0); // 准备读取操作
    io_uring_sqe_set_data(sqe, buf); // 将buf指针与SQE关联

    io_uring_submit(&ring); // 提交请求

    io_uring_cqe *cqe;
    io_uring_wait_cqe(&ring, &cqe); // 等待完成

    if (cqe->res < 0) {
        std::cerr << "Read failed: " << strerror(-cqe->res) << std::endl;
    } else {
        std::cout << "Read " << cqe->res << " bytes: " << buf << std::endl;
    }

    io_uring_cqe_seen(&ring, cqe); // 标记CQE已处理

    close(fd);
    delete[] buf;
    io_uring_queue_exit(&ring); // 退出io_uring

    return 0;
}

如何监控和调优网络IO性能？

监控和调优网络IO性能，就像医生给病人看病，需要诊断、分析、开药方。

监控工具： tcpdump、wireshark、netstat、iostat、perf。
监控指标： 吞吐量、延迟、CPU利用率、内存占用、网络流量。
调优方法：
- 调整TCP参数： 增大TCP窗口大小、启用TCP快速打开、调整拥塞控制算法。
- 使用连接池： 避免频繁创建和销毁连接。
- 使用缓存： 缓存热点数据，减少IO请求。
- 优化数据格式： 使用高效的数据压缩算法，减少网络传输量。
- 代码层面的优化： 避免不必要的内存拷贝，减少系统调用。
案例分析： 某个服务器CPU利用率过高，通过perf分析发现，大部分CPU时间都花在了系统调用上。经过分析，发现是由于应用程序频繁创建和销毁连接导致的。通过使用连接池，大大降低了系统调用的次数，CPU利用率也降了下来。