epoll - aLinChe

现代网络编程基石：深入解析 I/O 多路复用及 select、poll、epoll#

在高性能网络编程领域，如何高效地处理成千上万的并发连接是一个核心挑战。传统的阻塞 I/O 模型（Blocking I/O）一个线程只能处理一个连接，当连接数增多时，为每个连接创建一个线程或进程会消耗大量的系统资源，导致上下文切换开销巨大，严重影响服务器性能。为了解决这个问题，I/O 多路复用（I/O Multiplexing）技术应运而生，它成为了构建高并发网络服务的基石。

本文将深入探讨 I/O 多路复用的核心思想，并详细解析三种主流的实现方式：select、poll 和 epoll，并结合代码示例，帮助你理解它们的工作原理、优缺点以及适用场景。

一、什么是 I/O 多路复用？#

I/O 多路复用的核心思想是：用一个或少数几个线程来监视多个文件描述符(File Descriptor, FD)，一旦某个或某些文件描述符就绪（例如，有数据可读或可写），就通知应用程序进行相应的 I/O 操作。

这种模型的优势在于，单个线程可以同时管理大量的连接，线程并不需要阻塞在某个具体的 I/O 操作上，而是在一个集中的点（如 select、poll、epoll_wait）上等待，直到有事件发生。这样极大地减少了系统开销，提高了服务器的并发处理能力。

二、经典模型：`select`#

select 是最早出现的 I/O 多路复用模型，也是最经典的一种。它的基本工作模式是，程序员需要维护一个文件描述符集合，然后调用 select 函数来监听这个集合中所有 FD 的状态。

工作流程解读: select 代码示例：

1
#include <cstdio>
2
#include <cstdlib>
3
#include <cstring>
4
#include <netinet/in.h>
5
#include <sys/select.h>
6
#include <sys/socket.h>
7
#include <unistd.h>
8

9
#define MAXBUF      1024
10
#define MAX_CLIENTS 5
11

12
int main() {
13
    int sockfd;
14
    struct sockaddr_in server_addr, client_addr;
15
    socklen_t addrlen;
16
    char buffer[MAXBUF];
17
    int fds[MAX_CLIENTS], max_fd;
18
    memset(&fds, -1, sizeof(fds)); // -1表示该位置未使用
19
    // 创建TCP套接字
20
    sockfd = socket(AF_INET, SOCK_STREAM, 0);
21
    if (sockfd < 0) {
22
        perror("socket创建失败");
23
        exit(1);
24
    }
25
    // 设置套接字选项，避免地址占用错误
26
    int opt = 1;
27
    if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) < 0) {
28
        perror("setsockopt失败");
29
        close(sockfd);
30
        exit(EXIT_FAILURE);
31
    }
32
    // 设置服务器地址
33
    memset(&server_addr, 0, sizeof(server_addr));
34
    server_addr.sin_family = AF_INET;
35
    server_addr.sin_port = htons(8000);
36
    server_addr.sin_addr.s_addr = INADDR_ANY;
37
    // 绑定套接字到地址并监听
38
    if (bind(sockfd, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0) {
39
        perror("绑定失败");
40
        close(sockfd);
41
        exit(1);
42
    }
43
    if (listen(sockfd, 5) < 0) {
44
        perror("监听失败");
45
        close(sockfd);
46
        exit(1);
47
    }
48
    printf("基于select的服务器启动，监听端口8000...\n");
49

50
    // 初始化客户端文件描述符数组
51
    max_fd = sockfd;
52
    int i;
53
    fd_set rset; // 关键数据 bitmap
54
    while (true) {
55
        FD_ZERO(&rset);        // 每次select都需要手动清空rset
56
        FD_SET(sockfd, &rset); // 监听服务器套接字
57
        // 将所有的客户端套接字加入监听集合rset
58
        for (i = 0; i < MAX_CLIENTS; ++i) {
59
            if (fds[i] > 0) {
60
                FD_SET(fds[i], &rset);
61
                if (fds[i] > max_fd) {
62
                    max_fd = fds[i];
63
                }
64
            }
65
        }
66
        printf("📡等待客户端连接或数据...\n");
67
        // 使用select监听多个文件描述符，我们只关心从 0 到 max_fd 这个范围内的所有文件描述符
68
        int ready = select(max_fd + 1, &rset, NULL, NULL, NULL);
69
        if (ready < 0) {
70
            perror("select错误");
71
            continue;
72
        }
73
        // 检查是否有新的客户端连接
74
        if (FD_ISSET(sockfd, &rset)) {
75
            memset(&client_addr, 0, sizeof(client_addr));
76
            addrlen = sizeof(client_addr);
77
            int new_client = accept(sockfd, (struct sockaddr*)&client_addr, &addrlen); // 返回套接字文件描述符
78
            if (new_client >= 0) {
79
                printf("✅新客户端连接, fd: %d\n", new_client);
80
                // 将新客户端加入到空闲位置
81
                bool added = false;
82
                for (i = 0; i < MAX_CLIENTS; ++i) {
83
                    if (fds[i] < 0) {
84
                        fds[i] = new_client;
85
                        added = true;
86
                        break;
87
                    }
88
                }
89
                if (!added) {
90
                    printf("❌客户端数量已达上限，拒绝连接\n");
91
                    close(new_client);
92
                }
93
            }
94
        }
95
        // 检查客户端是否有数据可读
96
        for (i = 0; i < MAX_CLIENTS; ++i) {
97
            if (fds[i] > 0 && FD_ISSET(fds[i], &rset)) {
98
                memset(buffer, 0, MAXBUF);
99
                ssize_t bytes_read = read(fds[i], buffer, MAXBUF - 1);
100
                if (bytes_read > 0) {
101
                    printf("📨从客户端%d接收: %s", fds[i], buffer);
102
                    // 回声功能：将数据发回客户端
103
                    write(fds[i], buffer, bytes_read);
104
                } else {
105
                    // 客户端断开连接
106
                    printf("🔌客户端%d断开连接\n", fds[i]);
107
                    close(fds[i]);
108
                    // 若关闭的是最大的fd，则重新计算max_fd，减少监听性能开销
109
                    if (fds[i] == max_fd) {
110
                        int new_max = sockfd;
111
                        for (int fd : fds)
112
                            if (fd > new_max)
113
                                new_max = fd;
114
                        max_fd = new_max;
115
                    }
116
                    fds[i] = -1; // 标记为可用
117
                }
118
            }
119
        }
120
    }
121
    close(sockfd);
122
    return 0;
123
}

1
> curl localhost:8000 # 当然你也可以直接浏览器访问
2

3
基于select的服务器启动，监听端口8000...
4
📡等待客户端连接或数据...
5
✅新客户端连接, fd: 4
6
📡等待客户端连接或数据...
7
📨从客户端4接收: GET / HTTP/1.1
8
Host: localhost:8000
9
User-Agent: curl/7.81.0
10
Accept: */*
11

12
📡等待客户端连接或数据...
13
🔌客户端4断开连接
14
📡等待客户端连接或数据...

创建和初始化：
- 首先，程序通过 socket、bind、listen 创建一个监听套接字 sockfd。
- 然后通过循环 accept 客户端连接，并将接受到的新连接的 FD 存储在一个 fds 数组中。
核心循环与监听：
- 在一个 while(true) 循环中，首先使用 FD_ZERO(&rset) 清空一个名为 rset 的文件描述符集合。
- 接着，通过 for 循环和 FD_SET(fds[i], &rset) 将所有需要监听的 FD 添加到 rset 集合中。
- 调用 select(max+1, &rset, NULL, NULL, NULL) 函数。这是 select 模型的核心，该函数会阻塞，直到 rset 集合中至少有一个 FD 变为可读。max+1 是所有被监听的 FD 的最大值+1。
处理就绪事件：
- 当 select 返回后（即有事件发生），程序再次通过一个 for 循环和 FD_ISSET(fds[i], &rset) 来遍历所有的 FD，检查哪一个 FD 是真正就绪的。
- 对于就绪的 FD，执行 read 操作读取数据。

select 的优缺点:

优点:
- 跨平台性好：几乎所有的主流操作系统都支持 select，兼容性极佳。
缺点:
- 最大连接数限制：select 使用一个位图（bitmap）来存储文件描述符，这个位图的大小通常由 FD_SETSIZE 宏定义，在大多数系统上是 1024。这意味着单个进程默认最多只能监听 1024 个 FD。
- 两次拷贝性能开销大：每次调用 select 之前，都需要将所有fd_set（本质是一个 bitmap）要监听的 FD 从用户空间拷贝到内核空间。当连接数很多时，这个拷贝开销非常大。
- 两次线性扫描：进入内核态后，内核需要遍历传入的所有 FD，逐一检查它们的状态，如果某个 FD 就绪，内核就会在它拷贝过来的那份 fd_set 的对应位上进行置位操作。select 返回后，只能知道有 FD 就绪了，但不知道是哪几个。因此，程序需要遍历整个 FD 集合来找到就绪的 FD，这个时间复杂度是 O(n)，当连接数巨大而活跃连接数很少时，效率很低。

三、 `select` 的改进版：`poll`#

poll 的出现主要是为了解决 select 的一些限制，特别是最大连接数的限制。

工作流程解读: poll 代码示例：

1
#include <arpa/inet.h>
2
#include <netinet/in.h>
3
#include <poll.h>
4
#include <stdio.h>
5
#include <stdlib.h>
6
#include <string.h>
7
#include <sys/socket.h>
8
#include <unistd.h>
9

10
#define MAXBUF      1024
11
#define MAX_CLIENTS 5
12

13
int main() {
14
    int sockfd;
15
    struct sockaddr_in server_addr, client_addr;
16
    socklen_t client_len;
17
    char buffer[MAXBUF];
18
    // 创建pollfd结构体数组
19
    struct pollfd fds[MAX_CLIENTS + 1]; // +1 给服务器套接字
20
    int nfds = 1;                       // 当前监控的文件描述符数量（初始只有服务器）
21
    for (int i = 0; i <= MAX_CLIENTS; ++i) {
22
        fds[i].fd = -1;         // -1表示该位置未使用
23
        fds[i].events = POLLIN; // 监控可读事件
24
        fds[i].revents = 0;     // 返回的事件
25
    }
26
    // 创建TCP套接字
27
    sockfd = socket(AF_INET, SOCK_STREAM, 0);
28
    if (sockfd < 0) {
29
        perror("socket创建失败");
30
        exit(EXIT_FAILURE);
31
    }
32
    // 设置套接字选项，避免地址占用错误
33
    int opt = 1;
34
    if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) < 0) {
35
        perror("setsockopt失败");
36
        close(sockfd);
37
        exit(EXIT_FAILURE);
38
    }
39
    // 设置服务器地址
40
    memset(&server_addr, 0, sizeof(server_addr));
41
    server_addr.sin_family = AF_INET;
42
    server_addr.sin_addr.s_addr = INADDR_ANY;
43
    server_addr.sin_port = htons(8000);
44
    // 绑定套接字到地址并监听
45
    if (bind(sockfd, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0) {
46
        perror("绑定失败");
47
        close(sockfd);
48
        exit(EXIT_FAILURE);
49
    }
50
    if (listen(sockfd, 5) < 0) {
51
        perror("监听失败");
52
        close(sockfd);
53
        exit(EXIT_FAILURE);
54
    }
55
    printf("基于poll的服务器启动，监听端口8000...\n");
56
    printf("📡等待客户端连接...\n");
57

58
    // 将服务器套接字添加到poll监控
59
    fds[0].fd = sockfd;
60
    fds[0].events = POLLIN;
61
    int i;
62
    while (true) {
63
        // 调用poll等待事件发生
64
        int ready = poll(fds, nfds, 10000); // 10s
65
        if (ready < 0) {
66
            perror("poll错误");
67
            break;
68
        } else if (ready == 0) {
69
            printf("poll等待超时，继续监听...\n");
70
            continue;
71
        }
72
        // 检查所有被监控的文件描述符
73
        int cur_nfds = nfds;
74
        for (i = 0; i < cur_nfds; ++i) {
75
            if (fds[i].fd == -1)
76
                continue;
77
            // 检查是否有事件发生
78
            if (fds[i].revents & POLLIN) {
79
                if (fds[i].fd == sockfd) {
80
                    client_len = sizeof(client_addr);
81
                    int new_client = accept(sockfd, (struct sockaddr*)&client_addr, &client_len);
82
                    if (new_client < 0) {
83
                        perror("接受连接失败");
84
                    } else if (nfds <= MAX_CLIENTS) {
85
                        // 将新客户端添加到poll监控
86
                        fds[nfds].fd = new_client;
87
                        fds[nfds].events = POLLIN;
88
                        fds[nfds].revents = 0;
89
                        char client_ip[INET_ADDRSTRLEN];
90
                        inet_ntop(AF_INET, &client_addr.sin_addr, client_ip, INET_ADDRSTRLEN);
91
                        printf("✅新客户端连接: fd=%d, IP=%s:%d\n", new_client, client_ip, ntohs(client_addr.sin_port));
92
                        printf("当前连接数: %d/%d\n", nfds, MAX_CLIENTS);
93
                        ++nfds;
94
                    } else {
95
                        printf("客户端数量已达上限，拒绝连接\n");
96
                        close(new_client);
97
                    }
98
                } else {
99
                    // 客户端套接字有数据可读
100
                    int client_fd = fds[i].fd;
101
                    memset(buffer, 0, MAXBUF);
102
                    ssize_t bytes_read = read(client_fd, buffer, MAXBUF - 1);
103
                    if (bytes_read > 0) {
104
                        buffer[strcspn(buffer, "\r\n")] = 0;
105
                        printf("📨从客户端%d接收: %s\n", client_fd, buffer);
106
                        // 回声功能
107
                        if (write(client_fd, buffer, bytes_read) < 0) {
108
                            perror("发送数据失败");
109
                        }
110
                    } else {
111
                        // 客户端断开连接或错误
112
                        if (bytes_read == 0) {
113
                            printf("🔌客户端%d断开连接\n", client_fd);
114
                        } else {
115
                            perror("读取数据错误");
116
                        }
117
                        close(client_fd);
118
                        fds[i].fd = -1;
119
                        // （将后面的元素前移）
120
                        for (int j = i; j < nfds - 1; ++j) {
121
                            fds[j] = fds[j + 1];
122
                        }
123
                        --nfds;
124
                        fds[nfds].fd = -1;
125
                        --i; // 重新检查当前位置
126
                    }
127
                }
128
            }
129
            // 检查其他事件（如错误）
130
            if (fds[i].fd != -1 && (fds[i].revents & (POLLERR | POLLHUP))) {
131
                printf("❌客户端%d发生错误或挂断\n", fds[i].fd);
132
                close(fds[i].fd);
133
                fds[i].fd = -1;
134
            }
135
        }
136
    }
137
    // 清理资源
138
    for (int i = 0; i < nfds; ++i) {
139
        if (fds[i].fd != -1)
140
            close(fds[i].fd);
141
    }
142
    close(sockfd);
143
    return 0;
144
}

数据结构变化：
- poll 不再使用位图，而是定义了一个 struct pollfd 数组。这个结构体包含了 fd（文件描述符）、events（要监听的事件，如 POLLIN 表示可读）和 revents（实际发生的事件）。
- 由于使用了数组而非位图，poll 没有了 1024 的连接数限制，其最大连接数受限于系统的内存大小。
核心循环与监听：
- 在 accept 连接后，将新的 FD 和关心的事件 POLLIN 填入 pollfds 数组。
- 调用 poll(pollfds, 5, 50000) 函数进行阻塞监听。
处理就绪事件：
- 当 poll 返回后，同样需要遍历整个 pollfds 数组。
- 通过检查 pollfds[i].revents & POLLIN 来判断对应的 FD 是否就绪。

poll 的优缺点:

优点:
- 解决了最大连接数限制：它突破了 select 的 1024 限制。
缺点:
- 性能开销问题依然存在：和 select 一样，每次调用 poll 仍然需要将整个 pollfds 数组从用户空间拷贝到内核空间。
- 线性扫描问题依然存在：poll 返回后，依然需要遍历整个数组来找到就绪的 FD，时间复杂度仍为 O(n)。

总的来说，poll 只是对 select 的一个简单改进，并没有从根本上解决性能开销和线性扫描的问题。

四、高性能的终极选择：`epoll`#

epoll 是 Linux 内核为了解决 select 和 poll 的性能瓶颈而提出的一套全新的 I/O 多路复用机制，是目前公认的 Linux 平台下性能最好的方案。Redis、Nginx 等著名的高性能中间件都广泛采用了 epoll。

epoll 的核心改进: epoll 的设计哲学与 select/poll 完全不同。它将监听的 FD 集合的管理和事件的等待分离开来。

epoll_create(): 创建一个 epoll 实例。在内核中，这会创建一个 eventpoll 对象，该对象内部包含两个关键数据结构：
- 红黑树(Red-Black Tree): 用于高效地存储和管理所有被监听的文件描述符。
- 就绪列表(Ready List): 用于存放已经就绪（有事件发生）的文件描述符。
epoll_ctl(): 对 epoll 实例进行管理，可以添加（EPOLL_CTL_ADD）、修改（EPOLL_CTL_MOD）或删除（EPOLL_CTL_DEL）被监听的 FD。当添加一个新的 FD 时，内核会创建一个 epitem 结构体来代表这个监控项，并将需要这个epitem插入到红黑树rbr中进行管理。这个FD信息只需要在此时从用户态拷贝到内核一次，之后除非被删除，否则会一直存在于内核的红黑树中，无需反复拷贝。同时，它会向这个FD对应的内核文件结构一个回调函数（通常是ep_poll_callback），注册在内核中与该 socket 事件相关的等待队列 (wait queue) 上，事件就绪时，内核通过这个回调函数来采取行动。
epoll_wait(): 阻塞等待就绪列表中的事件。（当一个 FD 接收到数据而就绪时，内核会执行预先注册好的回调函数 ep_poll_callback，这个函数会将对应的 epitem 添加到 eventpoll 对象的就绪列表 rdllist 中。）与 select/poll 不同，epoll_wait() 只需检查就绪列表是否为空，若不为空，则将就绪列表中的 epitem 所携带的事件信息从内核空间拷贝到用户空间，然后返回就绪事件的数量，而不需要去遍历整个集合，从而实现了 O(1) 的时间复杂度（严格来说是 O(k)，k为就绪FD数量）。

底层结构体

1
// epoll_create() 内核会在内存中创建了一个 eventpoll 结构体实例
2
struct eventpoll {
3
  struct mutex mtx;
4
  wait_queue_head_t wq;        // 等待队列：让调用epoll_wait()的进程在此排队休眠。
5
  wait_queue_head_t poll_wait; // poll等待队列：当eventpoll文件描述符本身被监控时（例如被另一个epoll监控）使用的等待队列
6
  struct list_head rdllist;    // “就绪队列”（双向链表）：epoll_wait()只需检查这个链表是否为空，即可知道有多少事件就绪并拷贝到用户空间，复杂度为O(1)
7
  rwlock_t lock;               // 主要用于保护就绪链表rdllist
8
  struct rb_root_cached rbr;   // 红黑树的根节点：存储所有通过epoll_ctl()注册的待监控事件
9
  struct epitem *ovflist;      // 临时中转清单：在将事件从内核向用户空间传输时，作为一个临时链表使用，以避免在持有mtx锁的情况下操作rdllist，从而优化性能
10
  struct file *file;           // 关联文件：指向内核中代表这个epoll实例的文件对象。
11
};
12

13
struct epitem {
14
  union {
15
    struct rb_node rbn;       // 红黑树节点
16
    struct rcu_head rcu;
17
  };
18
  struct list_head rdllink;     // 就绪链表节点
19
  struct epitem *next;
20
  struct epoll_filefd ffd;      // 存储了该 epitem对应的文件描述符信息，是红黑树中查找和比较的关键依据。
21
  struct eppoll_entry *pwqlist; // 指向一个列表，该列表维护了与这个 fd 相关的等待队列条目。这是实现 epoll 回调机制的关键，确保事件发生时能准确通知到对应的 epoll 实例
22
  struct eventpoll *ep;         // 指向该 epitem所属的 eventpoll实例
23
  struct hlist_node fllink;     // 反向链接：用于将本 epitem链接到被监视的 struct file对象中的一个列表。这样，当文件被关闭时，内核可以遍历此列表，清理所有相关的 epoll 监视项
24
  struct epoll_event event;     // 监视清单：保存了用户通过 epoll_ctl注册的感兴趣事件
25
};
26

27
struct epoll_event {
28
  __poll_t events;
29
  __u64 data;
30
} EPOLL_PACKED;

工作流程解读: epoll 示例代码：

1
#include <cstdio>
2
#include <cstdlib>
3
#include <cstring>
4
#include <netinet/in.h>
5
#include <sys/epoll.h>
6
#include <sys/socket.h>
7
#include <unistd.h>
8

9
#define MAXBUF     1024
10
#define MAX_EVENTS 10
11

12
int main() {
13
    int sockfd;
14
    struct sockaddr_in server_addr, client_addr;
15
    socklen_t addrlen;
16
    char buffer[MAXBUF];
17
    struct epoll_event ev, events[MAX_EVENTS];
18
    int epfd, nfds;
19
    // 创建TCP套接字
20
    sockfd = socket(AF_INET, SOCK_STREAM, 0);
21
    if (sockfd < 0) {
22
        perror("socket创建失败");
23
        exit(1);
24
    }
25
    // 设置套接字选项，避免地址占用错误
26
    int opt = 1;
27
    if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) < 0) {
28
        perror("setsockopt失败");
29
        close(sockfd);
30
        exit(EXIT_FAILURE);
31
    }
32
    // 设置服务器地址
33
    memset(&server_addr, 0, sizeof(server_addr));
34
    server_addr.sin_family = AF_INET;
35
    server_addr.sin_port = htons(8000);
36
    server_addr.sin_addr.s_addr = INADDR_ANY;
37
    // 绑定套接字到地址并监听
38
    if (bind(sockfd, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0) {
39
        perror("绑定失败");
40
        close(sockfd);
41
        exit(1);
42
    }
43
    if (listen(sockfd, 5) < 0) {
44
        perror("监听失败");
45
        close(sockfd);
46
        exit(1);
47
    }
48
    printf("基于epoll的服务器启动，监听端口8000...\n");
49

50
    // 创建epoll实例
51
    epfd = epoll_create1(0);
52
    if (epfd < 0) {
53
        perror("epoll创建失败");
54
        close(sockfd);
55
        exit(1);
56
    }
57
    // 将服务器套接字添加到epoll监听
58
    ev.events = EPOLLIN;
59
    ev.data.fd = sockfd;
60
    if (epoll_ctl(epfd, EPOLL_CTL_ADD, sockfd, &ev) < 0) {
61
        perror("epoll_ctl添加服务器套接字失败");
62
        close(epfd);
63
        close(sockfd);
64
        exit(1);
65
    }
66

67
    int i;
68
    while (true) {
69
        printf("📡等待事件发生...\n");
70
        // 等待事件发生，超时时间10秒
71
        nfds = epoll_wait(epfd, events, MAX_EVENTS, 10000);
72
        if (nfds < 0) {
73
            perror("epoll_wait错误");
74
            continue;
75
        } else if (nfds == 0) {
76
            printf("epoll等待超时，继续监听...\n");
77
            continue;
78
        }
79

80
        // 处理所有就绪的事件
81
        for (i = 0; i < nfds; ++i) {
82
            // 新的客户端连接
83
            if (events[i].data.fd == sockfd) {
84
                memset(&client_addr, 0, sizeof(client_addr));
85
                addrlen = sizeof(client_addr);
86
                int client_fd = accept(sockfd, (struct sockaddr*)&client_addr, &addrlen);
87
                if (client_fd >= 0) {
88
                    printf("✅新客户端连接: %d\n", client_fd);
89
                    // 设置新客户端为非阻塞模式（可选）
90
                    ev.events = EPOLLIN | EPOLLET; // 边缘触发模式
91
                    ev.data.fd = client_fd;
92
                    if (epoll_ctl(epfd, EPOLL_CTL_ADD, client_fd, &ev) < 0) {
93
                        perror("epoll_ctl添加客户端失败");
94
                        close(client_fd);
95
                    }
96
                }
97
            } else {
98
                // 客户端套接字有数据可读
99
                int client_fd = events[i].data.fd;
100
                memset(buffer, 0, MAXBUF);
101
                ssize_t bytes_read = read(client_fd, buffer, MAXBUF - 1);
102
                if (bytes_read > 0) {
103
                    printf("📨从客户端%d接收: %s", client_fd, buffer);
104
                    // 回声功能
105
                    write(client_fd, buffer, bytes_read);
106
                } else {
107
                    // 客户端断开连接
108
                    printf("🔌客户端%d断开连接\n", client_fd);
109
                    epoll_ctl(epfd, EPOLL_CTL_DEL, client_fd, NULL);
110
                    close(client_fd);
111
                }
112
            }
113
        }
114
    }
115
    close(epfd);
116
    close(sockfd);
117
    return 0;
118
}

1
> curl localhost:8000 # 当然你也可以直接浏览器访问
2

3
基于epoll的服务器启动，监听端口8000...
4
📡等待事件发生...
5
✅新客户端连接: 5
6
📡等待事件发生...
7
📨从客户端5接收: GET / HTTP/1.1
8
Host: localhost:8000
9
User-Agent: curl/7.81.0
10
Accept: */*
11

12
📡等待事件发生...
13
🔌客户端5断开连接
14
📡等待事件发生...

初始化：
- epfd = epoll_create(10) 创建一个 epoll 实例。
- 在 accept() 循环中，每当有新连接到来，就创建一个 epoll_event 结构体，设置好 fd 和关心的事件 EPOLLIN。
- 通过 epoll_ctl(epfd, EPOLL_CTL_ADD, ev.data.fd, &ev) 将新的连接 FD 注册到内核的红黑树中。只有在调用 epoll_ctl() 的时候，才会发生从用户态到内核态的数据拷贝。并且内核会在该文件描述符的内部结构上注册一个回调函数，使其添加到 epoll 实例内部的“就绪队列”中。
核心等待与处理：
- 在 while(true) 循环中，调用 nfds = epoll_wait(epfd, events, 5, 10000)。这个函数会阻塞，直到内核的就绪列表中有事件发生。
- epoll_wait() 直接返回就绪的 FD 列表，nfds 的值就是就绪的 FD 的数量。内核已经将这些就绪的事件填充到了 events 数组中。
- 程序只需要遍历“nfds”次，直接从 events 数组中取出就绪的 FD 进行 read() 操作。

epoll 的巨大优势:

高效的管理机制：FD 集合的管理是通过红黑树实现的，增删改查的效率都很高。FD 只需要注册一次，避免了 select/poll 反复拷贝的开销。
避免线性扫描：epoll_wait() 直接返回就绪的 FD 列表，程序无需遍历所有 FD，时间复杂度是 O(1)（或者说 O(k)，其中 k 是就绪的 FD 数量），并且 epoll_ctl() 注册时会同时注册一个回调函数，无需遍历红黑树。
内存拷贝优化：epoll 使用共享内存（mmap）技术来优化用户空间和内核空间的数据交换，进一步减少了拷贝开销。
支持边缘触发（ET）：除了水平触发（LT），epoll 还支持边缘触发模式。ET 模式更加高效，它只在 FD 状态发生变化时通知一次，要求程序员必须一次性将数据读完。这减少了 epoll_wait() 被唤醒的次数，是许多高性能服务的首选。

五、总结与对比#

特性	`select`	`poll`	`epoll`
底层数据结构	位图（bitmap）	数组（struct pollfd）	红黑树 + 就绪列表
最大连接数	有限（通常 1024）	无限制（受内存影响）	无限制（受内存影响）
FD 拷贝	每次调用都需两次拷贝	每次调用都需两次拷贝	仅在 `epoll_ctl()` 时拷贝一次
就绪 FD 查找	线性扫描 O(n)	线性扫描 O(n)	直接返回 O(1)
工作模式	水平触发 (LT)	水平触发 (LT)	水平触发 (LT) + 边缘触发 (ET)
平台	跨平台性好	跨平台性较好	Linux Only

现代网络编程基石：深入解析 I/O 多路复用及 select、poll、epoll#

一、 什么是 I/O 多路复用？#

二、 经典模型：select#

三、 select 的改进版：poll#

四、 高性能的终极选择：epoll#

五、 总结与对比#

一、什么是 I/O 多路复用？#

二、经典模型：`select`#

三、 `select` 的改进版：`poll`#

四、高性能的终极选择：`epoll`#

五、总结与对比#