Tim排序（Tim Sort）

一、基本思想

Tim排序是一种混合稳定排序算法。它是由插入排序和归并排序衍生出来的混合算法。它首先使用插入排序得到子数组，这些小的排序子数组被称为自然运行（run）。然后使用归并排序堆这些运行进行合并子数组，产生最终的排序数组。它的设计考虑到算法在真实世界数据上的最佳性能。它利用了插入排序在小尺寸子数组上表现非常好的事实。它是Java的Array.sort()和Python的sorted()和sort()使用的标准排序算法。

二、实现逻辑

假设有一个包含n元素的无序数组array，将考虑运行的大小为32。它可以是2的任何幂数，因为当数字是2的幂数时，合并更有效。

算法主体的步骤：

将数组化分为n/32运行；
使用插入排序函数对各个运行逐一进行排序；
使用归并排序的merge函数将排序后的运行逐一合并。

merge的步骤：

初始化辅助数组result来存储排序后的输出；
初始化3个指针i、j和k：i指向第一个子数组begin的开始，j指向第二个子数组mid+1的开始，k用begin初始化，保持排序数组result的当前索引；
直到到达array[begin,...,mid]或array[mid+1,...,end]子数组的末尾，在索引i&j的元素中挑出一个较小的值，插入到result中；
当其中一个数组用完后，挑选剩余的元素插入到result中；
将result复制到array[begin,...,end]中。

三、时间复杂度的分析

若数组元素的个数小于run的话，那么直接进行插入排序，时间复杂度为： $\Omega(n)$ 、 $\Theta(n^2)$ 、 $O(n^2)$ ，如果是二分插入排序的话，时间复杂度会减小。若数组元素的个数大于run的话，那么由于做run的插入排序会与归并排序产生并列的时间复杂度，故总时间复杂度为： $\Omega(n \log_2(n))$ 、 $\Theta(n \log_2(n))$ 、 $O(n \log_2(n))$ 。

四、空间复杂度的分析

在下述两个算法中，并没有在主体开辟数组，但是在归并排序的过程中用到了额外的数组，故空间复杂度为： $O (n)$ 。

五、算法实现

无二分优化

def tim_sort(array: list, run: int=32, reverse: bool=False) -> None:
    '''
    array: 支持数值型数据，如整型与浮点型混合；支持全为字符串类型的数据；不支持字符串型与数值型混合。
    run: 运行大小, 默认是32, 最好是2的幂数。
    reverse: 是否降序, 默认采用升序。
    '''
    def inser(l: int, r: int) -> None:
        '''
        l: 数据左侧游标(整型), r: 数据右侧游标(整型)
        '''
        for index in range(l + 1, r + 1):
            key = array[index]
            pre = index - 1
            while pre >= l and (key > array[pre] if reverse else key < array[pre]):
                array[pre + 1] = array[pre]
                pre -= 1
            array[pre + 1] = key
    
    def merge(low: int, mid: int, high: int) -> None:
        '''
        low: 数据低侧游标(整型), mid: 数据中间游标(整型), high: 数据高侧游标(整型)
        '''
        left = array[low: mid]
        right = array[mid: high]
        i = 0
        j = 0
        result = []
        while i < len(left) and j < len(right):
            if (left[i] > right[j] if reverse else left[i] <= right[j]):
                result.append(left[i])
                i += 1
            else:
                result.append(right[j])
                j += 1
        result += left[i:]
        result += right[j:]
        array[low: high] = result
    
    # choose run
    length = len(array)
    for index in range(0, length, run):
        inser(index, min(index + run - 1, length - 1))

    # merge run
    size = run
    while size < length:
        for low in range(0, length, 2 * size):
            mid = low + size
            high = min(low + 2 * size - 1, length - 1) + 1
            merge(low, mid, high)
        size = 2 * size
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51

有二分优化

def tim_sort(array: list, run: int=32, reverse: bool=False) -> None:
    '''
    array: 支持数值型数据，如整型与浮点型混合；支持全为字符串类型的数据；不支持字符串型与数值型混合。
    run: 运行大小, 默认是32, 最好是2的幂数。
    reverse: 是否降序, 默认采用升序。
    '''
    def inser(l: int, r: int) -> None:
        '''
        l: 数据左侧游标(整型), r: 数据右侧游标(整型)
        '''
        for index in range(l + 1, r + 1):
            key = array[index]
            low, high = l, index - 1
            while low <= high: # 符合单调性的序列
                mid = (low + high) // 2
                if (key < array[mid] if reverse else key > array[mid]):
                    low = mid + 1
                else:
                    high = mid - 1
            for pre in range(index, low, -1): # 从后往前
                array[pre] = array[pre - 1]
            array[low] = key
    
    def merge(low: int, mid: int, high: int) -> None:
        '''
        low: 数据低侧游标(整型), mid: 数据中间游标(整型), high: 数据高侧游标(整型)
        '''
        left = array[low: mid]
        right = array[mid: high]
        i = 0
        j = 0
        result = []
        while i < len(left) and j < len(right):
            if (left[i] > right[j] if reverse else left[i] <= right[j]):
                result.append(left[i])
                i += 1
            else:
                result.append(right[j])
                j += 1
        result += left[i:]
        result += right[j:]
        array[low: high] = result
    
    # choose run
    length = len(array)
    for index in range(0, length, run):
        inser(index, min(index + run - 1, length - 1))

    # merge run
    size = run
    while size < length:
        for low in range(0, length, 2 * size):
            mid = low + size
            high = min(low + 2 * size - 1, length - 1) + 1
            merge(low, mid, high)
        size = 2 * size
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56

相关阅读:
一幅长文细学HTML5和CSS3——一幅长文系列
PreScan快速入门到精通第二十三讲2D车辆动力学模型
通过内网穿透实现远程连接群晖Drive，轻松实现异地访问群晖NAS
Java中的this关键字
如何在Linux上安装Tomcat
Selenium安装以及案例演示【Java爬虫】
【力扣每日一题】2023.9.3 消灭怪物的最大数量
高级架构师_Docker_第2章_ Docker核心原理_ 第5节 Dockerfile简介
变量赋值中 + 号 - 号 = 号的用法
深入浅出Nodejs中的大文件读写

原文地址：https://blog.csdn.net/linjing_zyq/article/details/126335154