高性能网络框架与零拷贝技术

在高性能网络应用领域，传统的内核网络协议栈往往成为性能瓶颈。DPDK、io_uring等高性能网络框架通过绕过内核或优化内核路径，实现了网络数据处理的极致性能。本文将深入探讨这些技术的原理，以及零拷贝、RDMA等加速技术。

零拷贝技术深度解析

传统I/O vs 零拷贝

Rendering diagram...

sendfile零拷贝实现

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <fcntl.h>
#include <unistd.h>
#include <sys/sendfile.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>

// 传统文件传输
int traditional_file_transfer(int sockfd,const char *filename) {
    int fd = open(filename,O_RDONLY);
    if (fd < 0) {
     perror("open");
     return -1;
    }
    
    // 获取文件大小
    off_t file_size = lseek(fd,0,SEEK_END);
    lseek(fd,0,SEEK_SET);
    
    // 分配缓冲区
    char *buffer = malloc(4096);
    if (!buffer) {
     close(fd);
     return -1;
    }
    
    // 传统方式：读入用户空间，再发送到socket
    ssize_t total_sent = 0;
    ssize_t n;
    
    while ((n = read(fd,buffer,4096)) > 0) {
     ssize_t sent = send(sockfd,buffer,n,0);
     if (sent < 0) {
         perror("send");
         free(buffer);
         close(fd);
         return -1;
     }
     total_sent += sent;
    }
    
    free(buffer);
    close(fd);
    
    printf("传统传输: 发送 %zd 字节\n",total_sent);
    return 0;
}

// sendfile零拷贝传输
int zero_copy_file_transfer(int sockfd,const char *filename) {
    int fd = open(filename,O_RDONLY);
    if (fd < 0) {
     perror("open");
     return -1;
    }
    
    // 获取文件大小
    off_t file_size = lseek(fd,0,SEEK_END);
    lseek(fd,0,SEEK_SET);
    
    // 使用sendfile进行零拷贝传输
    off_t offset = 0;
    ssize_t total_sent = 0;
    
    while (offset < file_size) {
     ssize_t sent = sendfile(sockfd,fd,&offset,file_size - offset);
     if (sent < 0) {
         if (errno == EAGAIN || errno == EWOULDBLOCK) {
             continue;  // 非阻塞模式，稍后重试
         }
         perror("sendfile");
         close(fd);
         return -1;
     }
     
     if (sent == 0) {
         break;  // 传输完成
     }
     
     total_sent += sent;
    }
    
    close(fd);
    
    printf("零拷贝传输: 发送 %zd 字节\n",total_sent);
    return 0;
}

// 零拷贝性能测试
void zero_copy_performance_test() {
    printf("零拷贝技术性能测试\n");
    printf("=============================\n\n");
    
    // 创建测试文件
    const char *filename = "/tmp/testfile.dat";
    int fd = open(filename,O_WRONLY | O_CREAT | O_TRUNC,0644);
    if (fd < 0) {
     perror("create test file");
     return;
    }
    
    // 写入测试数据
    const size_t file_size = 100 * 1024 * 1024;  // 100MB
    char *buffer = malloc(file_size);
    if (!buffer) {
     close(fd);
     return;
    }
    
    for (size_t i = 0; i < file_size; i++) {
     buffer[i] = (char)(i % 256);
    }
    
    write(fd,buffer,file_size);
    free(buffer);
    close(fd);
    
    printf("创建测试文件: %s (%.2f MB)\n\n",filename,file_size / (1024.0 * 1024.0));
    
    // 性能对比测试
    int server_fd = socket(AF_INET,SOCK_STREAM,0);
    if (server_fd < 0) {
     return;
    }
    
    int opt = 1;
    setsockopt(server_fd,SOL_SOCKET,SO_REUSEADDR,&opt,sizeof(opt));
    
    struct sockaddr_in addr;
    memset(&addr,0,sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = htonl(INADDR_ANY);
    addr.sin_port = htons(8888);
    
    bind(server_fd,(struct sockaddr *)&addr,sizeof(addr));
    listen(server_fd,1);
    
    printf("启动测试服务器...\n");
    
    int client_fd = socket(AF_INET,SOCK_STREAM,0);
    struct sockaddr_in client_addr;
    memset(&client_addr,0,sizeof(client_addr));
    client_addr.sin_family = AF_INET;
    client_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
    client_addr.sin_port = htons(8888);
    
    connect(client_fd,(struct sockaddr *)&client_addr,sizeof(client_addr));
    
    int accept_fd = accept(server_fd,NULL,NULL);
    
    // 测试传统方式
    printf("测试传统文件传输...\n");
    clock_t start = clock();
    traditional_file_transfer(accept_fd,filename);
    clock_t end = clock();
    double traditional_time = ((double)(end - start)) / CLOCKS_PER_SEC;
    printf("耗时: %.4f 秒\n\n",traditional_time);
    
    // 重新连接
    close(client_fd);
    close(accept_fd);
    
    client_fd = socket(AF_INET,SOCK_STREAM,0);
    connect(client_fd,(struct sockaddr *)&client_addr,sizeof(client_addr));
    accept_fd = accept(server_fd,NULL,NULL);
    
    // 测试零拷贝方式
    printf("测试sendfile零拷贝传输...\n");
    start = clock();
    zero_copy_file_transfer(accept_fd,filename);
    end = clock();
    double zero_copy_time = ((double)(end - start)) / CLOCKS_PER_SEC;
    printf("耗时: %.4f 秒\n",zero_copy_time);
    
    printf("\n性能提升: %.2fx\n",traditional_time / zero_copy_time);
    
    // 清理
    close(client_fd);
    close(accept_fd);
    close(server_fd);
    unlink(filename);
}

### splice零拷贝管道

```c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>

// 使用splice在文件和socket之间移动数据
int splice_file_to_socket(int in_fd,int out_fd,off_t *offset,size_t len) {
    int pipe_fds[2];
    
    // 创建管道
    if (pipe(pipe_fds) < 0) {
     perror("pipe");
     return -1;
    }
    
    ssize_t total_spliced = 0;
    
    while (len > 0) {
     // 从文件splice到管道
     ssize_t spliced = splice(in_fd,offset,pipe_fds[1],NULL,
                             len > 65536 ? 65536 : len,0);
     if (spliced < 0) {
         if (errno == EAGAIN || errno == EWOULDBLOCK) {
             continue;
         }
         perror("splice file to pipe");
         close(pipe_fds[0]);
         close(pipe_fds[1]);
         return -1;
     }
     
     if (spliced == 0) {
         break;  // 完成
     }
     
     // 从管道splice到socket
     ssize_t sent = splice(pipe_fds[0],NULL,out_fd,NULL,
                           spliced,0);
     if (sent < 0) {
         perror("splice pipe to socket");
         close(pipe_fds[0]);
         close(pipe_fds[1]);
         return -1;
     }
     
     total_spliced += sent;
     len -= sent;
    }
    
    close(pipe_fds[0]);
    close(pipe_fds[1]);
    
    return total_spliced;
}

// tee零拷贝数据复制
int tee_data_copy(int fd_in,int fd_out,size_t len) {
    int pipe_fds[2];
    
    if (pipe(pipe_fds) < 0) {
     perror("pipe");
     return -1;
    }
    
    ssize_t total_teed = 0;
    
    while (len > 0) {
     ssize_t teed = tee(fd_in,fd_out,len > 65536 ? 65536 : len,0);
     if (teed < 0) {
         if (errno == EAGAIN || errno == EWOULDBLOCK) {
             continue;
         }
         perror("tee");
         close(pipe_fds[0]);
         close(pipe_fds[1]);
         return -1;
     }
     
     if (teed == 0) {
         break;
     }
     
     total_teed += teed;
     len -= teed;
    }
    
    close(pipe_fds[0]);
    close(pipe_fds[1]);
    
    return total_teed;
}

// 零拷贝数据转发服务器
void zero_copy_forward_server() {
    printf("零拷贝数据转发服务器\n");
    printf("=============================\n\n");
    
    int server_fd = socket(AF_INET,SOCK_STREAM | SOCK_NONBLOCK,0);
    if (server_fd < 0) {
     perror("socket");
     return;
    }
    
    int opt = 1;
    setsockopt(server_fd,SOL_SOCKET,SO_REUSEADDR,&opt,sizeof(opt));
    
    struct sockaddr_in addr;
    memset(&addr,0,sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = htonl(INADDR_ANY);
    addr.sin_port = htons(9999);
    
    bind(server_fd,(struct sockaddr *)&addr,sizeof(addr));
    listen(server_fd,SOMAXCONN);
    
    printf("服务器启动: 0.0.0.0:9999\n");
    printf("使用splice实现零拷贝数据转发\n");
    
    while (1) {
     int client_fd = accept(server_fd,NULL,NULL);
     if (client_fd < 0) {
         if (errno == EAGAIN || errno == EWOULDBLOCK) {
             usleep(1000);
             continue;
         }
         perror("accept");
         continue;
     }
     
     printf("新连接: fd=%d\n",client_fd);
     
     // 在实际应用中，这里会创建工作线程处理连接
     // 使用splice在客户端连接之间转发数据
     
     close(client_fd);
    }
    
    close(server_fd);
}

io_uring网络优化

io_uring架构原理

Rendering diagram...

io_uring高性能网络服务器

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <liburing.h>
#include <errno.h>

#define QUEUE_DEPTH 256
#define MAX_MESSAGE_SIZE 4096

// io_uring连接上下文
typedef struct {
    int fd;
    char buffer[MAX_MESSAGE_SIZE];
    size_t buffer_len;
    bool reading;
} connection_context;

// 初始化io_uring
int init_io_uring(struct io_uring *ring,int queue_depth) {
    if (io_uring_queue_init_params(queue_depth,ring,NULL) < 0) {
     perror("io_uring_queue_init");
     return -1;
    }
    
    printf("io_uring初始化成功: 队列深度=%d\n",queue_depth);
    return 0;
}

// 接受新连接
void accept_connection(struct io_uring *ring,int server_fd) {
    struct io_uring_sqe *sqe = io_uring_get_sqe(ring);
    if (!sqe) {
     printf("无法获取SQE\n");
     return;
    }
    
    io_uring_prep_accept(sqe,server_fd,NULL,NULL,0);
    io_uring_sqe_set_data(sqe,NULL);
    io_uring_submit(ring);
}

// 读取数据
void read_connection(struct io_uring *ring,connection_context *ctx) {
    struct io_uring_sqe *sqe = io_uring_get_sqe(ring);
    if (!sqe) {
     printf("无法获取SQE\n");
     return;
    }
    
    ctx->reading = true;
    io_uring_prep_read(sqe,ctx->fd,ctx->buffer,
                    sizeof(ctx->buffer),0);
    io_uring_sqe_set_data(sqe,ctx);
    io_uring_submit(ring);
}

// 写入数据
void write_connection(struct io_uring *ring,connection_context *ctx) {
    struct io_uring_sqe *sqe = io_uring_get_sqe(ring);
    if (!sqe) {
     printf("无法获取SQE\n");
     return;
    }
    
    ctx->reading = false;
    io_uring_prep_write(sqe,ctx->fd,ctx->buffer,
                     ctx->buffer_len,0);
    io_uring_sqe_set_data(sqe,ctx);
    io_uring_submit(ring);
}

// io_uring事件处理
void process_events(struct io_uring *ring,int server_fd) {
    struct io_uring_cqe *cqe;
    unsigned head;
    unsigned count = 0;
    
    io_uring_for_each_cqe(ring,head,cqe) {
     void *data = io_uring_cqe_get_data(cqe);
     int res = cqe->res;
     
     if (data == NULL) {
         // 处理accept完成事件
         if (res < 0) {
             printf("accept错误: %s\n",strerror(-res));
         } else {
             printf("新连接: fd=%d\n",res);
             
             // 设置为非阻塞
             int flags = fcntl(res,F_GETFL,0);
             fcntl(res,F_SETFL,flags | O_NONBLOCK);
             
             // 创建连接上下文并开始读取
             connection_context *ctx = malloc(sizeof(connection_context));
             ctx->fd = res;
             ctx->buffer_len = 0;
             ctx->reading = false;
             read_connection(ring,ctx);
             
             // 继续accept
             accept_connection(ring,server_fd);
         }
     } else {
         // 处理连接的读写事件
         connection_context *ctx = (connection_context *)data;
         
         if (res < 0) {
             printf("I/O错误: %s,fd=%d\n",strerror(-res),ctx->fd);
             close(ctx->fd);
             free(ctx);
         } else {
             if (ctx->reading) {
                 // 读取完成
                 ctx->buffer_len = res;
                 printf("收到数据: %zd 字节,fd=%d\n",res,ctx->fd);
                 
                 if (res == 0) {
                     // 连接关闭
                     printf("连接关闭: fd=%d\n",ctx->fd);
                     close(ctx->fd);
                     free(ctx);
                 } else {
                     // 回显数据
                     write_connection(ring,ctx);
                 }
             } else {
                 // 写入完成
                 printf("发送数据: %zd 字节,fd=%d\n",res,ctx->fd);
                 // 继续读取
                 read_connection(ring,ctx);
             }
         }
     }
     
     count++;
    }
    
    io_uring_cq_advance(ring,count);
}

// io_uring网络服务器
void io_uring_network_server() {
    printf("io_uring高性能网络服务器\n");
    printf("=============================\n\n");
    
    struct io_uring ring;
    if (init_io_uring(&ring,QUEUE_DEPTH) < 0) {
     return;
    }
    
    // 创建监听socket
    int server_fd = socket(AF_INET,SOCK_STREAM | SOCK_NONBLOCK,0);
    if (server_fd < 0) {
     perror("socket");
     io_uring_queue_exit(&ring);
     return;
    }
    
    int opt = 1;
    setsockopt(server_fd,SOL_SOCKET,SO_REUSEADDR,&opt,sizeof(opt));
    
    struct sockaddr_in addr;
    memset(&addr,0,sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = htonl(INADDR_ANY);
    addr.sin_port = htons(8080);
    
    if (bind(server_fd,(struct sockaddr *)&addr,sizeof(addr)) < 0) {
     perror("bind");
     close(server_fd);
     io_uring_queue_exit(&ring);
     return;
    }
    
    listen(server_fd,SOMAXCONN);
    
    printf("服务器启动: 0.0.0.0:8080\n");
    printf("使用io_uring实现高性能网络处理\n");
    
    // 开始accept
    accept_connection(&ring,server_fd);
    
    // 事件循环
    while (1) {
     // 等待I/O事件
     int ret = io_uring_wait(&ring,1);
     if (ret < 0) {
         perror("io_uring_wait");
         continue;
     }
     
     // 处理事件
     process_events(&ring,server_fd);
    }
    
    // 清理（实际不会到达这里）
    io_uring_queue_exit(&ring);
    close(server_fd);
}

// io_uring性能测试
void io_uring_performance_test() {
    printf("\nio_uring性能测试\n");
    printf("=============================\n\n");
    
    printf("性能优势:\n");
    printf("1. 共享内存: 减少内核-用户空间拷贝\n");
    printf("2. 批量处理: 一次提交多个I/O请求\n");
    printf("3. 无系统调用: 提交和获取结果无需syscall\n");
    printf("4. 异步非阻塞: 避免线程阻塞\n");
    printf("5. 高并发: 支持大量并发连接\n");
    
    printf("\n性能基准测试建议:\n");
    printf("- 使用wrk进行HTTP性能测试\n");
    printf("- 使用iperf3进行带宽测试\n");
    printf("- 对比epoll + 传统I/O vs io_uring\n");
    printf("- 监控CPU使用率和延迟\n");
    printf("- 分析内存使用和拷贝次数\n");
}

DPDK高性能网络框架

DPDK架构概述

Rendering diagram...

DPDK环境配置

# DPDK安装配置
# 1. 下载DPDK
wget https://fast.dpdk.org/rel/dpdk-22.11.tar.xz
tar -xf dpdk-22.11.tar.xz
cd dpdk-22.11

# 2. 编译安装
meson build
cd build
ninja
ninja install

# 3. 配置大页内存
echo 1024 > /sys/kernel/mm/hugepages/hugepages-2048kB/nr_hugepages
mkdir -p /mnt/huge
mount -t hugetlbfs nodev /mnt/huge

# 4. 绑定网卡到DPDK
dpdk-devbind.py --status
dpdk-devbind.py -b igb_uio 0000:01:00.0

# 5. 设置CPU亲和性
echo 2-7 > /sys/devices/system/cpu/cpu2/cpulist/online
# 或使用taskset启动应用

# 6. 调优系统参数
echo 'net.ipv4.tcp_fastopen=3' >> /etc/sysctl.conf
echo 'net.core.somaxconn=4096' >> /etc/sysctl.conf
sysctl -p

# 7. 监控DPDK应用
dpdk-telemetry.py
dpdk-procinfo --file-prefix=dpdk_0 -- --stats

# 8. 性能测试
./build/examples/dpdk-l2fwd -l 2-3 -n 4 -- -p 0x3
./build/examples/dpdk-testpmd -l 2-7 -n 4 -- -i --rxq=4 --txq=4

DPDK基本应用框架

#include <stdio.h>
#include <string.h>
#include <stdint.h>
#include <errno.h>
#include <sys/queue.h>
#include <rte_eal.h>
#include <rte_common.h>
#include <rte_ethdev.h>
#include <rte_mbuf.h>

#define RX_RING_SIZE 128
#define TX_RING_SIZE 512
#define NUM_MBUFS 8191
#define MBUF_CACHE_SIZE 250
#define BURST_SIZE 32
#define MAX_PORTS 1

// DPDK应用参数
static const struct rte_eth_conf port_conf_default = {
    .rxmode = {
     .max_rx_pkt_len = RTE_ETHER_MAX_LEN,
    },
};

// 简单的DPDK数据包转发
int simple_dpdk_forwarder(int argc,char *argv[]) {
    printf("DPDK简单数据包转发器\n");
    printf("=============================\n\n");
    
    // 初始化EAL环境
    int ret = rte_eal_init(argc,argv);
    if (ret < 0) {
     rte_exit(EXIT_FAILURE,"Error with EAL initialization\n");
    }
    
    printf("EAL初始化成功\n");
    
    // 检查可用端口
    unsigned nb_ports = rte_eth_dev_count_avail();
    printf("可用端口数: %u\n",nb_ports);
    
    if (nb_ports < 1) {
     rte_exit(EXIT_FAILURE,"需要至少1个端口\n");
    }
    
    // 初始化所有端口
    for (unsigned port = 0; port < nb_ports; port++) {
     printf("初始化端口 %u...\n",port);
     
     // 配置端口
     ret = rte_eth_dev_configure(port,1,1,&port_conf_default);
     if (ret != 0) {
         rte_exit(EXIT_FAILURE,"端口配置失败\n");
     }
     
     // 调整接收队列
     ret = rte_eth_rx_queue_setup(port,0,RX_RING_SIZE,
                                rte_eth_dev_socket_id(port),
                                NULL);
     if (ret < 0) {
         rte_exit(EXIT_FAILURE,"接收队列设置失败\n");
     }
     
     // 调整发送队列
     ret = rte_eth_tx_queue_setup(port,0,TX_RING_SIZE,
                                rte_eth_dev_socket_id(port),
                                NULL);
     if (ret < 0) {
         rte_exit(EXIT_FAILURE,"发送队列设置失败\n");
     }
     
     // 启动端口
     ret = rte_eth_dev_start(port);
     if (ret < 0) {
         rte_exit(EXIT_FAILURE,"端口启动失败\n");
     }
     
     // 启用混杂模式
     rte_eth_promiscuous_enable(port);
     
     printf("端口 %u 启动成功\n",port);
    }
    
    printf("\n开始数据包转发...\n");
    
    // 主循环
    struct rte_mbuf *bufs[BURST_SIZE];
    uint16_t port_id = 0;
    
    while (1) {
     // 接收数据包
     uint16_t nb_rx = rte_eth_rx_burst(port_id,0,bufs,BURST_SIZE);
     if (unlikely(nb_rx == 0)) {
         continue;
     }
     
     // 发送数据包（简单转发）
     uint16_t nb_tx = rte_eth_tx_burst(port_id,0,bufs,nb_rx);
     
     // 释放已发送的数据包
     if (unlikely(nb_tx < nb_rx)) {
         uint16_t buf;
         for (buf = nb_tx; buf < nb_rx; buf++) {
             rte_pktmbuf_free(bufs[buf]);
         }
     }
     
     // 更新统计（在实际应用中会定期输出）
     static uint64_t total_packets = 0;
     total_packets += nb_rx;
     if (total_packets % 100000 == 0) {
         printf("已转发 %lu 个数据包\n",total_packets);
     }
    }
    
    return 0;
}

// DPDK性能优化建议
void dpdk_optimization_guide() {
    printf("DPDK性能优化指南\n");
    printf("=============================\n\n");
    
    printf("1. CPU亲和性:\n");
    printf("   - 将DPDK线程绑定到固定CPU核心\n");
    printf("   - 避免上下文切换\n");
    printf("   - 优化缓存局部性\n");
    
    printf("\n2. 内存管理:\n");
    printf("   - 使用大页内存减少TLB缺失\n");
    printf("   - 预分配内存池避免动态分配\n");
    printf("   - 使用NUMA感知的内存分配\n");
    
    printf("\n3. 网卡配置:\n");
    printf("   - 启用多队列充分利用多核\n");
    printf("   - 调整RX/TX队列大小\n");
    printf("   - 启用硬件卸载功能\n");
    
    printf("\n4. 批量处理:\n");
    printf("   - 使用BURST_SIZE提高吞吐量\n");
    printf("   - 批量处理数据包\n");
    printf("   - 减少函数调用开销\n");
    
    printf("\n5. 轮询间隔:\n");
    printf("   - 选择合适的轮询间隔\n");
    printf("   - 平衡延迟和CPU使用率\n");
    printf("   - 使用 rte_pause() 降低功耗\n");
    
    printf("\n6. 统计监控:\n");
    printf("   - 定期收集性能统计\n");
    printf("   - 监控丢包率\n");
    printf("   - 分析CPU使用情况\n");
}

RDMA网络加速

RDMA技术原理

Rendering diagram...

RDMA应用开发基础

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <infiniband/verbs.h>

// RDMA连接上下文
typedef struct {
    struct ibv_context *context;
    struct ibv_pd *pd;
    struct ibv_cq *cq;
    struct ibv_qp *qp;
    struct ibv_mr *mr;
    void *buffer;
    size_t buffer_size;
} rdma_context;

// 初始化RDMA上下文
rdma_context* init_rdma_context(const char *device_name,size_t buffer_size) {
    rdma_context *ctx = malloc(sizeof(rdma_context));
    if (!ctx) return NULL;
    
    // 获取RDMA设备
    struct ibv_device **device_list = ibv_get_device_list(NULL);
    if (!device_list) {
     printf("无法获取RDMA设备列表\n");
     free(ctx);
     return NULL;
    }
    
    struct ibv_device *device = NULL;
    for (int i = 0; device_list[i]; i++) {
     if (strcmp(ibv_get_device_name(device_list[i]),device_name) == 0) {
         device = device_list[i];
         break;
     }
    }
    
    if (!device) {
     printf("无法找到RDMA设备: %s\n",device_name);
     ibv_free_device_list(device_list);
     free(ctx);
     return NULL;
    }
    
    // 打开设备
    ctx->context = ibv_open_device(device);
    if (!ctx->context) {
     printf("无法打开RDMA设备\n");
     ibv_free_device_list(device_list);
     free(ctx);
     return NULL;
    }
    
    printf("RDMA设备: %s\n",ibv_get_device_name(device));
    
    // 分配保护域
    ctx->pd = ibv_alloc_pd(ctx->context);
    if (!ctx->pd) {
     printf("无法分配保护域\n");
     ibv_close_device(ctx->context);
     ibv_free_device_list(device_list);
     free(ctx);
     return NULL;
    }
    
    // 创建完成队列
    ctx->cq = ibv_create_cq(ctx->context,100,NULL,NULL,0);
    if (!ctx->cq) {
     printf("无法创建完成队列\n");
     ibv_dealloc_pd(ctx->pd);
     ibv_close_device(ctx->context);
     ibv_free_device_list(device_list);
     free(ctx);
     return NULL;
    }
    
    // 创建队列对
    struct ibv_qp_init_attr qp_init_attr = {
     .send_cq = ctx->cq,
     .recv_cq = ctx->cq,
     .qp_type = IBV_QPT_RC,
     .cap = {
         .max_send_wr = 100,
         .max_recv_wr = 100,
         .max_send_sge = 1,
         .max_recv_sge = 1,
     },
    };
    
    ctx->qp = ibv_create_qp(ctx->pd,&qp_init_attr);
    if (!ctx->qp) {
     printf("无法创建队列对\n");
     ibv_destroy_cq(ctx->cq);
     ibv_dealloc_pd(ctx->pd);
     ibv_close_device(ctx->context);
     ibv_free_device_list(device_list);
     free(ctx);
     return NULL;
    }
    
    // 注册内存区域
    ctx->buffer_size = buffer_size;
    posix_memalign(&ctx->buffer,4096,buffer_size);
    
    int mr_flags = IBV_ACCESS_LOCAL_WRITE | IBV_ACCESS_REMOTE_WRITE | 
               IBV_ACCESS_REMOTE_READ;
    ctx->mr = ibv_reg_mr(ctx->pd,ctx->buffer,buffer_size,mr_flags);
    if (!ctx->mr) {
     printf("无法注册内存区域\n");
     free(ctx->buffer);
     ibv_destroy_qp(ctx->qp);
     ibv_destroy_cq(ctx->cq);
     ibv_dealloc_pd(ctx->pd);
     ibv_close_device(ctx->context);
     ibv_free_device_list(device_list);
     free(ctx);
     return NULL;
    }
    
    ibv_free_device_list(device_list);
    
    printf("RDMA上下文初始化成功\n");
    printf("缓冲区地址: %p,大小: %zu\n",ctx->buffer,buffer_size);
    printf("本地密钥: 0x%x,远程密钥: 0x%x\n",
        ctx->mr->lkey,ctx->mr->rkey);
    
    return ctx;
}

// 清理RDMA上下文
void cleanup_rdma_context(rdma_context *ctx) {
    if (ctx->mr) ibv_dereg_mr(ctx->mr);
    if (ctx->qp) ibv_destroy_qp(ctx->qp);
    if (ctx->cq) ibv_destroy_cq(ctx->cq);
    if (ctx->pd) ibv_dealloc_pd(ctx->pd);
    if (ctx->context) ibv_close_device(ctx->context);
    if (ctx->buffer) free(ctx->buffer);
    free(ctx);
}

// RDMA性能测试指南
void rdma_performance_guide() {
    printf("RDMA性能测试指南\n");
    printf("=============================\n\n");
    
    printf("1. 硬件要求:\n");
    printf("   - RDMA网卡 (Mellanox/ConnectX等)\n");
    printf("   - 交换机支持RDMA\n");
    printf("   - 足够的大页内存\n");
    
    printf("\n2. 性能测试工具:\n");
    printf("   - rperf: RDMA性能测试\n");
    printf("   - ib_write_bw: 带宽测试\n");
    printf("   - ib_read_lat: 延迟测试\n");
    printf("   - perftest: 综合测试\n");
    
    printf("\n3. 优化建议:\n");
    printf("   - 使用适当的连接队列大小\n");
    printf("   - 优化内存注册策略\n");
    printf("   - 利用CPU亲和性\n");
    printf("   - 监控硬件计数器\n");
    
    printf("\n4. 应用场景:\n");
    printf("   - 高性能计算集群\n");
    printf("   - 分布式存储系统\n");
    printf("   - 高频交易系统\n");
    printf("   - 实时大数据分析\n");
}

int main() {
    printf("高性能网络框架技术\n");
    printf("=============================\n\n");
    
    // 零拷贝技术测试
    zero_copy_performance_test();
    zero_copy_forward_server();
    
    // io_uring测试
    io_uring_network_server();
    io_uring_performance_test();
    
    // DPDK测试
    // 注意：需要DPDK环境才能运行
    // simple_dpdk_forwarder(argc,argv);
    dpdk_optimization_guide();
    
    // RDMA测试
    // 注意：需要RDMA硬件才能运行
    // rdma_context *ctx = init_rdma_context("mlx5_0",4096);
    // if (ctx) cleanup_rdma_context(ctx);
    rdma_performance_guide();
    
    return 0;
}

通过零拷贝技术、io_uring、DPDK和RDMA等高性能网络框架，可以显著突破传统网络协议栈的性能限制，实现微秒级延迟和百Gbps级吞吐量，满足现代高性能计算、分布式系统和实时应用的性能需求。