树排序是一种在线排序算法。它使用二叉搜索树数据结构来存储元素。通过按顺序遍历二叉搜索树,可以按排序顺序检索元素。由于它是一种在线排序算法,因此插入的元素始终按排序顺序进行维护。
假设使用一组未排序的数组 array 包含 n 个元素。
算法主体的步骤:
插入排序的步骤:
array[i];root == null,那么返回新形成的节点;如果 root->data < key,那么 root->right = insert(root->right, key);如果 root->data > key,那么 root->left = insert(root->left, key);顺序遍历操作:遍历左子树 → 访问根结点 → 遍历右子树。
在平均情况下,在BST中插入n个节点的时间复杂度为 Θ ( n log 2 ( n ) ) \Theta(n \log_2(n)) Θ(nlog2(n)) 量级。当形成的BST是平衡BST时,会发生这种情况。因此,时间复杂度为 Θ ( n log 2 ( n ) ) \Theta(n \log_2(n)) Θ(nlog2(n)) 量级。
最坏的情况发生在数组排序时,并形成最大高度为 O ( n ) O(n) O(n) 的非平衡二叉搜索树。与高度 log 2 ( n ) \log_2(n) log2(n) 的常规BST情况下的 O ( log 2 ( n ) ) O(\log_2(n)) O(log2(n)) 时间相比,它需要 O ( n ) O(n) O(n) 时间进行遍历和 O ( n 2 ) O(n^2) O(n2) 时间进行插入。最坏情况下的时间复杂度是 O ( n 2 ) O(n^2) O(n2)。可以使用自平衡数据结构(如AVL树、红黑树等)将其缩减为 O ( n log 2 ( n ) ) O(n \log_2(n)) O(nlog2(n))。
最佳情况发生在形成的二叉搜索树平衡时。时间复杂度的最佳情况是 Ω ( n log 2 ( n ) ) \Omega(n \log_2(n)) Ω(nlog2(n))。这与平均案例时间复杂度相同。
该算法的空间复杂度为: O ( n ) O(n) O(n),因为必须为二叉搜索树中的每个元素创建 n n n 个节点。
class node():
def __init__(self, val): # BST data structure
self.val = val
self.left = None
self.right = None
def insert(self, val) -> None:
if self.val:
if val < self.val: # 若逆序此处可以变为 val > self.val
if self.left is None:
self.left = node(val)
else:
self.left.insert(val)
else:
if self.right is None:
self.right = node(val)
else:
self.right.insert(val)
else:
self.val = val
def inorder(root: node, result: list) -> None:
'''
root: 存储插入序列的根节点指示。
result: 存储遍历结果的数组.
'''
if root:
inorder(root.left, result)
result.append(root.val)
inorder(root.right, result)
def tree_sort(array: list, reverse: bool=False) -> list:
'''
array: 支持数值型数据,如整型与浮点型混合;支持全为字符串类型的数据;不支持字符串型与数值型混合。
reverse: 是否降序, 默认采用升序。
'''
if not array:
return array
root = node(array[0]) # Initial
for index in range(1, len(array)): # Build
root.insert(array[index])
result = []
inorder(root, result) # Traverse BST in order
if reverse:
result.reverse()
return result