• 基于DPDK(x86平台)应用性能优化实践


    产生性能瓶颈有多方面的原因,包括硬件(自身能力限制或BIOS设置不当)、操作系统(某些feature没打开)和软件。软件方面的性能瓶颈主要是由于编码不当导致,常见原因有以下几种:

    • 数据结构cache line未对齐,访问的数据跨cache line
    • 不恰当的内存操作
    • cache miss严重,经常跨socket访问数据
    • 锁竞争
    • 中断太多
    • context切换频繁

    本文讲述了在编码时如何利用x86平台的特点(主要是内存方面)来避免性能瓶颈的技巧,并对性能优化给出一种思路。

    UMA与NUMA

    UMA(Uniform Memory Access),即统一内存访问。在UMA内存架构中,所有处理器通过一条总线共享内存,如下图所示:

    因为UMA结构中,所有处理器均通过同一条总线访问内存,故访问内存所花时间是一样的。且访问时间与数据在内存中的位置无关。而在NUMA(Non Uniform Memory Access,非一致性内存访问)结构中,访问内存所需时间与数据在内存中的位置有关,每个处理器都有自己的本地内存,访问本地内存速度很快,通过共享总线可以访问其他处理器的本地内存。结构如图所示:

    正如前面所说,在NUMA结构中,访问内存所需时间与数据在内存中的位置有很大关系。处理器访问自己的本地内存要比访问其他处理器的本地内存要快得多。DPDK支持NUMA架构,接下来主要介绍一些进行内存操作方面需要注意的地方。

    减少内存拷贝

    出于性能考虑,要最小化数据的内存拷贝。在写代码的时候,当遇见需要拷贝数据时,考虑有没有一种更好的解决方式替代,如传递指针而非整个数据结构;在需要使用strcpy和memcpy时,用rte_strcpy和rte_memcpy作替。

    合理分配内存

    在实时处理数据包转发的系统中,一般不建议在数据面进行动态内存分配,因为不停的申请和释放动态内存会使堆产生碎片,管理这样的堆开销很大。如果真的需要在程序中动态申请内

  • 相关阅读:
    51.Python-web框架-Django开始第一个应用的增删改查
    MySQL-索引详解(三)
    JUC常见的线程池源码学习 02 ( ThreadPoolExecutor 线程池 )
    Pycharm加载项目时异常,看不到自己的项目文件
    设计模式-模板模式
    【扩展阅读之编译和解释语言的区别】
    LLVM MC layer框架说明
    海格里斯HEGERLS托盘搬运机器人四向车引领三维空间集群设备柔性运维
    Linux介绍
    spring bean的自动装配
  • 原文地址:https://blog.csdn.net/lingshengxiyou/article/details/128037217