• .NET 6 数组拷贝性能对比


    前言

    本文来对比多个不同的方法进行数组拷贝,和测试其性能

    测试性能必须采用基准(标准)性能测试方法,否则测试结果不可信。在 dotnet 里面,可以采用 BenchmarkDotNet 进行性能测试。详细请看C# 标准性能测试

    拷贝某个数组的从某个起始点加上某个长度的数据到另一个数组里面,可选方法有很多,本文仅列举出使用 for 循环拷贝,和使用 Array.Copy 方法和用 Span 方法进行拷贝进行对比

    假定有需要被拷贝的数组是 TestData 其定义如下

    1.         static Program()
    2.         {
    3.             TestData = new int[1000];
    4.             for (int i = 0; i < 1000; i++)
    5.             {
    6.                 TestData[i] = i;
    7.             }
    8.         }
    9.         private static readonly int[] TestData;

    使用 for 循环拷贝的方法如下

    1.         public object CopyByFor(int start, int length)
    2.         {
    3.             var rawPacketData = TestData;
    4.             var data = new int[length];
    5.             for (int localIndex = 0, rawArrayIndex = start; localIndex < data.Length; localIndex++, rawArrayIndex++)
    6.             {
    7.                 data[localIndex] = rawPacketData[rawArrayIndex];
    8.             }
    9.             return data;
    10.         }

    以上代码返回 data 作为 object 仅仅只是为了做性能测试,避免被 dotnet 优化掉

    另一个拷贝数组是采用 Array.Copy 拷贝,逻辑如下

    1.         public object CopyByArray(int start, int length)
    2.         {
    3.             var rawPacketData = TestData;
    4.             var data = new int[length];
    5.             Array.Copy(rawPacketData,start,data,0, length);
    6.             return data;
    7.         }

    采用新的 dotnet 提供的 Span 进行拷贝,代码如下

    1.         public object CopyBySpan(int start, int length)
    2.         {
    3.             var rawPacketData = TestData;
    4.             var rawArrayStartIndex = start;
    5.             var data = rawPacketData.AsSpan(rawArrayStartIndex, length).ToArray();
    6.             return data;
    7.         }

    接着加上一些性能调试辅助逻辑

    1.         [Benchmark]
    2.         [ArgumentsSource(nameof(ProvideArguments))]
    3.         public object CopyByFor(int start, int length)
    4.         {
    5.             var rawPacketData = TestData;
    6.             var data = new int[length];
    7.             for (int localIndex = 0, rawArrayIndex = start; localIndex < data.Length; localIndex++, rawArrayIndex++)
    8.             {
    9.                 data[localIndex] = rawPacketData[rawArrayIndex];
    10.             }
    11.             return data;
    12.         }
    13.         [Benchmark]
    14.         [ArgumentsSource(nameof(ProvideArguments))]
    15.         public object CopyByArray(int start, int length)
    16.         {
    17.             var rawPacketData = TestData;
    18.             var data = new int[length];
    19.             Array.Copy(rawPacketData,start,data,0, length);
    20.             return data;
    21.         }
    22.         public IEnumerable<object[]> ProvideArguments()
    23.         {
    24.             foreach (var start in new[] { 010100 })
    25.             {
    26.                 foreach (var length in new[] { 1020100 })
    27.                 {
    28.                     yield return new object[] { start, length };
    29.                 }
    30.             }
    31.         }

    在我的设备上的测试效果如下

    1. BenchmarkDotNet=v0.13.1, OS=Windows 10.0.19042.1200 (20H2/October2020Update)
    2. Intel Core i7-9700K CPU 3.60GHz (Coffee Lake), 1 CPU, 8 logical and 8 physical cores
    3. .NET SDK=6.0.100-preview.7.21379.14
    4.   [Host]     : .NET 6.0.0 (6.0.21.37719), X64 RyuJIT
    5.   DefaultJob : .NET 6.0.0 (6.0.21.37719), X64 RyuJIT

    img

    可以看到,在对比使用 for 循环拷贝和使用 Array.Copy 拷贝中,使用 Array.Copy 拷贝的性能更好,在拷贝的数组长度越长的时候,使用 Array.Copy 拷贝性能优势就更好

    接下来再加上 Span 的性能比较,如下面代码

    1.         [Benchmark]
    2.         [ArgumentsSource(nameof(ProvideArguments))]
    3.         public object CopyBySpan(int start, int length)
    4.         {
    5.             var rawPacketData = TestData;
    6.             var rawArrayStartIndex = start;
    7.             var data = rawPacketData.AsSpan(rawArrayStartIndex, length).ToArray();
    8.             return data;
    9.         }

    性能对比测试如下

    img

    可以看到 Span 的性能比 Array.Copy 拷贝性能更强

    在 Span 里面,转换为数组的逻辑如下

    1.         [MethodImpl(MethodImplOptions.AggressiveInlining)]
    2.         public T[] ToArray()
    3.         {
    4.             if (_length == 0)
    5.                 return Array.Empty<t>();
    6.             var destination = new T[_length];
    7.             Buffer.Memmove(ref MemoryMarshal.GetArrayDataReference(destination), ref _pointer.Value, (nuint)_length);
    8.             return destination;
    9.         }

    这里使用到的 Buffer 的有黑科技的 Memmove 方法,此方法的实现如下

    1.         [MethodImpl(MethodImplOptions.AggressiveInlining)]
    2.         internal static void Memmove<t>(ref T destination, ref T source, nuint elementCount)
    3.         {
    4.             if (!RuntimeHelpers.IsReferenceOrContainsReferences<t>())
    5.             {
    6.                 // Blittable memmove
    7.                 Memmove(
    8.                     ref Unsafe.As<t, byte="">(ref destination),
    9.                     ref Unsafe.As<t, byte="">(ref source),
    10.                     elementCount * (nuint)Unsafe.SizeOf<t>());
    11.             }
    12.             else
    13.             {
    14.                 // Non-blittable memmove
    15.                 BulkMoveWithWriteBarrier(
    16.                     ref Unsafe.As<t, byte="">(ref destination),
    17.                     ref Unsafe.As<t, byte="">(ref source),
    18.                     elementCount * (nuint)Unsafe.SizeOf<t>());
    19.             }
    20.         }

    以上性能测试使用的是 int 数组,刚好能进入 Memmove 的分支,而不是 BulkMoveWithWriteBarrier 这个分支。在里层的 Memmove 方法里面用到了很多黑科技,本文只是用来对比多个方法拷贝数组的性能,黑科技部分就需要大家自己去阅读 dotnet 的源代码啦

    另外,如果需要做完全的数组的拷贝,数组里面存放的是值类型对象,如 int 类型,那么拷贝整个数组还有另一个可选项是通过 Clone 方法进行拷贝,代码如下

    1.         public object CopyByClone()
    2.         {
    3.             var data = (int[]) TestData.Clone();
    4.             return data;
    5.         }

    使用 Clone 的方法的行为是返回数组的浅表拷贝,也就是说数组里面的元素没有做深拷贝,只是拷贝数组本身而已。对于值类型来说,就没有啥问题了

    稍微更改一下性能测试,更改的代码如下

    1.     [MemoryDiagnoser]
    2.     public class Program
    3.     {
    4.         static void Main(string[] args)
    5.         {
    6.             BenchmarkRunner.Run<program>();
    7.         }
    8.         static Program()
    9.         {
    10.             TestData = new int[1000];
    11.             for (int i = 0; i < 1000; i++)
    12.             {
    13.                 TestData[i] = i;
    14.             }
    15.         }
    16.         [Benchmark]
    17.         public object CopyByFor()
    18.         {
    19.             var rawPacketData = TestData;
    20.             var length = TestData.Length;
    21.             var data = new int[length];
    22.             for (int localIndex = 0, rawArrayIndex = 0; localIndex < data.Length; localIndex++, rawArrayIndex++)
    23.             {
    24.                 data[localIndex] = rawPacketData[rawArrayIndex];
    25.             }
    26.             return data;
    27.         }
    28.         [Benchmark]
    29.         public object CopyByArray()
    30.         {
    31.             var length = TestData.Length;
    32.             var start = 0;
    33.             var rawPacketData = TestData;
    34.             var data = new int[length];
    35.             Array.Copy(rawPacketData,start,data,0, length);
    36.             return data;
    37.         }
    38.         [Benchmark]
    39.         public object CopyByClone()
    40.         {
    41.             var data = (int[]) TestData.Clone();
    42.             return data;
    43.         }
    44.         private static readonly int[] TestData;
    45.     }

    通过下图可以了解到采用 Clone 方法和采用 Array.Copy 方法的性能差不多,但 Clone 稍微快一点

    以上是给 WPF 框架做性能优化时测试。

  • 相关阅读:
    SystemVerilog学习-10-验证量化和覆盖率
    C# Winform编程(6)高级控件
    Java的日期与时间之java.sql.Timestamp简介说明
    产品| 介绍PPT
    音频基础学习——声音的本质、术语与特性
    微服务系列之分布式日志 ELK
    Spring Security根据角色在登录后重定向用户
    Vue element表单校验规则放入computed
    内网使用adb工具使用logcat进行日志分析
    AJAX-解决回调函数地狱问题
  • 原文地址:https://blog.csdn.net/biyusr/article/details/125600271