简析XDP的重定向机制

  • GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。
  • GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。

一. XDP Socket示例解析

源码参见:https://github.com/xdp-project/xdp-tutorial/tree/master/advanced03-AF_XDP
该示例演示了如何通过BPF将网络数据包从XDP Hook点旁路到用户态的XDP Socket,解析过程中为突出重点,将只关注重点代码段,一些函数会被精简,比如:错误处理等

二. BPF 程序 af_xdp_kern.c

BPF程序是运行在内核态的一段代码,如下:

struct bpf_map_def SEC("maps") xsks_map = {
    .type = BPF_MAP_TYPE_XSKMAP,
    .key_size = sizeof(int),
    .value_size = sizeof(int),
    .max_entries = 64,  /* Assume netdev has no more than 64 queues */
};

SEC("xdp_sock")
int xdp_sock_prog(struct xdp_md *ctx)
{
    int index = ctx->rx_queue_index;

    if (bpf_map_lookup_elem(&xsks_map, &index))
        return bpf_redirect_map(&xsks_map, index, 0);

    return XDP_PASS;
}
  1. struct bpf_map_def SEC("maps") xsks_map: 定义了一个 BPF_MAP_TYPE_XSKMAP类型的映射表,当采用SEC(“maps”)方式来显示定义时,将在生成的bpf目标文件的ELF格式中看到相关描述,当BPF程序被加载到内核时,会自动创建名为”xsks_map”的描述符, 用户态可通过查找”xsks_map”来获取该map的描述符,这样用户态和内核BPF程序就可以共同访问该map
  2. type = BPF_MAP_TYPE_XSKMAP:指定该map的类型,它与bpf_redirect_map() 结合使用以将收到的帧传递到指定套接字
  3. key_size = sizeof(int),value_size = sizeof(int):指定key,value长度
  4. 针对以上key,value需要说明一下:对于 BPF_MAP_TYPE_XSKMAP类型的map,value必须是XDP socket描述符,key必须是int类型,原因在于bpf_redirect_map()的第二个参数,参见下面2.10
  5. max_entries = 64:指定map最多存储64个元素
  6. SEC("xdp_sock"):指定prog函数符号,应用层可通过查找”xdp_sock”加载该prog,并绑定到指定网卡
  7. int xdp_sock_prog(struct xdp_md *ctx):当网卡收到数据包时,会在xdp hook点调用该函数
  8. int index = ctx->rx_queue_index: 获取该数据包来自网卡到哪个rx队列ID,ctx有许多成员,比如:网卡ID,数据帧等等
  9. if (bpf_map_lookup_elem(&xsks_map, &index)): 判断xsks_map是否存在key为index(即rx队列号)的数据,注意,这里实际上就是判断该网卡是否绑定了xdp Socket
    10.

  10. bpf_redirect_map(&xsks_map, index, 0)bpf_redirect_map函数作用就是重定向,比如:将数据重定向到某个网卡,CPU, Socket等等;当 bpf_redirect_map函数的第一个参数的map类型为 BPF_MAP_TYPE_XSKMAP时,则表示将数据重定向到XDP Scoket

  11. bpf_redirect_map()会查找参数1即xsks_map 中 key为index 的 value 是否存在,若存在,则检查value是否是一个XDP Scoket,并且是否绑定到了该网卡(可以绑定到任意有效队列)

综合以上,该bpf程序实现的功能就是:将收到的数据包重定向到 xsks_map 中指定的XDP Socket

三. 用户态程序 af_xdp_user.c

该程序实现bpf加载到网卡,创建XDP Scoket并绑定到网卡的指定队列,并通过XDP Scoket收发数据,这里仅分析xXDP Scoket相关部分

int main(int argc, char **argv)
{
    ...

    bpf_obj = load_bpf_and_xdp_attach(&cfg);
    map = bpf_object__find_map_by_name(bpf_obj, "xsks_map");
    ...

    xsks_map_fd = bpf_map__fd(map);
    ...

    umem = configure_xsk_umem(packet_buffer, packet_buffer_size);
    ...

    xsk_socket = xsk_configure_socket(&cfg, umem);
    ...

    rx_and_process(&cfg, xsk_socket);
    ...

}

static struct xsk_socket_info *xsk_configure_socket(struct config *cfg,
                            struct xsk_umem_info *umem)
{
    ...

    ret = xsk_socket__create(&xsk_info->xsk, cfg->ifname,
                 cfg->xsk_if_queue, umem->umem, &xsk_info->rx,
                 &xsk_info->tx, &xsk_cfg);
    ...

}
  • bpf_obj = load_bpf_and_xdp_attach(&cfg): 加载bpf程序,并绑定到网卡
  • map = bpf_object__find_map_by_name(bpf_obj, "xsks_map"): 查找bpf程序内定义的xsks_map
  • umem = configure_xsk_umem(packet_buffer, packet_buffer_size): 为XDP Scoket准备UMEM
  • xsk_configure_socket()通过调用bpf helper函数xsk_socket__create()创建XDP Scoket并绑定到cfg->ifname网卡的cfg->xsk_if_queue队列,默认情况下将该【cfg->xsk_if_queue, xsk_info->xsk fd】添加到xsks_map, 这样bpf程序就可以重定向到该XDP Scoket(参见2.9, 2.10), 除非指定XSK_LIBBPF_FLAGS__INHIBIT_PROG_LOAD标志
static void rx_and_process(struct config *cfg,
               struct xsk_socket_info *xsk_socket)
{
    struct pollfd fds[2];
    int ret, nfds = 1;

    memset(fds, 0, sizeof(fds));
    fds[0].fd = xsk_socket__fd(xsk_socket->xsk);
    fds[0].events = POLLIN;

    while(!global_exit) {
        if (cfg->xsk_poll_mode) {
            ret = poll(fds, nfds, -1);
            if (ret  1)
                continue;
        }
        handle_receive_packets(xsk_socket);
    }
}
  • XDP Scoket也是一个文件描述符,因此可以通过poll/epoll/select来等待IO事件,需要说明的是:收/发的数据包是原始的以太网帧,因此在包处理上要麻烦一些

四. 总结

  • 以上简略分析了bpf程序如何将数据重定向到用户态程序,通过xsks_map来实现bpf与用户态程序的交互;
  • 需要说明的是,这些分析仅是梳理了浅层次的代码,实际上BPF是如何将数据读写到XDP Scoket收发缓冲区的呢?其实是通过创建共享内存并关联XDP Scoket的rx_ring,tx_ring,以及umem来实现的,后续继续分析
  • bpf程序通常都非常简单,复杂的是用户态程序,此外,BPF有非常多的技术细节,限于篇幅及主题不在此展开。

Enjoy GreatSQL 😃

关于 GreatSQL

GreatSQL是由万里数据库维护的MySQL分支,专注于提升MGR可靠性及性能,支持InnoDB并行查询特性,是适用于金融级应用的MySQL分支版本。

相关链接: GreatSQL社区 Gitee GitHub Bilibili

GreatSQL社区:

欢迎来GreatSQL社区发帖提问
https://greatsql.cn/

简析XDP的重定向机制

技术交流群:

微信:扫码添加 GreatSQL社区助手微信好友,发送验证信息 加群

简析XDP的重定向机制

Original: https://www.cnblogs.com/greatsql/p/16653235.html
Author: GreatSQL
Title: 简析XDP的重定向机制

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/598648/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 绿色安装MySQL5.7版本—-配置my.ini文件注意事项

    简述绿色安装MySQL5.7版本以及配置my.ini文件注意事项 前言 由于前段时间电脑重装,虽然很多软件不在C盘,但是由于很多注册表以及关联文件被删除,很多软件还需要重新配置甚至…

    数据库 2023年5月24日
    0102
  • springboot~Screw生成数据库文档

    数据库说明文档,在我们开发项目时是非常必要的,有时项目交付时,客户也是需要让我们提供的,而如果人工编写,比如耗时,通过screw组件来生成文档,非常方便。 源代码和使用:https…

    数据库 2023年6月6日
    0107
  • [spring]spring中java实现类代替注解开发

    9.使用javaconfig实现代替xml配置 The central artifacts in Spring’s new Java-configuration sup…

    数据库 2023年6月16日
    079
  • null调整为not null default xxx,不得不注意的坑

    最近碰到一个case,值得分享一下。 现象 一个DDL,将列的属性从null调整为not null default xxx, alter table slowtech.t1 mod…

    数据库 2023年6月11日
    0113
  • jdbc-实现用户登录业务(存在sql注入)

    package com.cqust; import java.sql.Connection;import java.sql.DriverManager;import java.sq…

    数据库 2023年5月24日
    084
  • 操作系统(学习笔记)

    操作系统(学习笔记) PCB=process control block=进程控制块,用于存储进程相关信息,以便进程切换; GDT=global descriptor table=…

    数据库 2023年6月14日
    082
  • day05-离线留言和离线文件

    多用户即时通讯系统05 4.编码实现04(拓展) 拓展功能: 实现离线留言,如果某个用户不在线 ,当登陆后,可以接收离线的消息 实现离线发文件,如果某个功能没有在线,当登录后,可以…

    数据库 2023年6月11日
    080
  • 第18章 MySQL8其它新特性

    第18章 MySQL8其它新特性 1. MySQL8新特性概述 MySQL从5.7版本直&a…

    数据库 2023年6月6日
    089
  • centos系统下mysql的配置

    配置文件路径 /etc/my.cnf Hole yor life get everything if you never give up. Original: https://ww…

    数据库 2023年6月9日
    072
  • 得体的注释,让我总能想起TA

    作为一个技术TL,在排查生产问题时,我经常要周转于各个工程里。系统和服务多起来后,要我了解每一段代码具体的来龙去脉逐渐几乎不可能了。 例如,今天,我要查一下调用某个三方接口所配置的…

    数据库 2023年6月9日
    0175
  • 为什么我选择MySQL Workbench・一

    一、官方 官方提供的工具必然有其优势。 MySQL Workbench有两个版本,社区版和商业版。社区版是免费的。 二、第一个选择 使用MySQL之前用的是SQL Server而微…

    数据库 2023年6月9日
    073
  • 关于.netcore即时生成缩略图踩的坑

    最近在开发一套系统,很多地方用到了缩略图,然而不同的地方用到的尺寸又不一样,上传的时候生成缩略图就没有意义了,因为你不知道会使用到哪些尺寸,于是想到即时生成的办法,前端判断图片是否…

    数据库 2023年6月9日
    099
  • 01-MySQL主从复制

    问题导入 在之前项目的基础功能实现中,后台管理和移动端在进行数据访问的时候,都是直接操作数据库MySQL。此时的系统有且仅有一台MySQL服务器,则可能会出现如下问题 ①、读和写所…

    数据库 2023年5月24日
    076
  • Map–部分方法

    1.Map.values()方法:获取Map集合中的所有键值对象 获取 Map 集合中的所有键值对象,这些键值对象将存放在另一个集合对象中 2.getOrDefault() 方法 …

    数据库 2023年6月16日
    093
  • 实现随机验证码

    Java实现随机验证码的生成 随机验证码: 法一:普通方法 核心逻辑: 1.定义一个String类型的变量存储验证码字符。 2.定义一个for循环,循环n次(n为验证码的所需要字符…

    数据库 2023年6月16日
    0120
  • Docker Maven构建缓存spring boot依赖包

    背景 每次通过 docker build ‘xxx’ 的时候,总是会去maven镜像下载一大堆Jar包,平均每次build都要在3分钟左右,效率非常低下,于…

    数据库 2023年6月6日
    0100
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球