• 【数据结构与算法分析】0基础带你学数据结构与算法分析08--二叉查找树 (BST)


    假设树上每个结点都存储了一项数据,如果这些数据是杂乱无章的插入树中,那查找这些数据时并不容易,需要 O(N) 的时间复杂度来遍历每个结点搜索数据。

    如果想要时间复杂度降到 O(log⁡N) ,则需要在常数时间内,将问题的大小缩减。如果为一个结点加上限制,比如子树上的值总比当前结点的值大,而另一边总比当前结点的值小,如此便在常数时间内可以将问题的大小减半,可以判断接下来搜索左子树还是右子树。这种加以限制的二叉树被称为 二叉查找树 (Binary Search Tree, BST)。假定 BST 中左结点总是严格小于当前结点的值,而右结点总是不小于当前结点的值。

     

    二叉树的遍历四种方法很简单,如果将其用于 BST 上有什么效果呢:

    • 前序遍历: 6,2,1,4,3,8,7,9
    • 中序遍历: 1,2,3,4,6,7,8,9
    • 后序遍历: 1,3,4,2,7,9,8,6
    • 层序遍历: 6,2,8,1,4,7,9,3

    BST 中进行查找

    对 BST 的查找操作中,以下三种操作是最为简单的。

    • 判断元素是否存在,存在时将返回 true ,反之返回 false

    1. template <class Element>
    2. bool contains(BinaryTreeNode* root, const Element& target) {
    3. if (root == nullptr) {
    4. return false;
    5. }
    6. if (root->data == target) {
    7. return true;
    8. }
    9. return contains(root->data < target ? root->right : root->left, target);
    10. }
    • 查找最小值并返回其结点
    1. template <class Element>
    2. BinaryTreeNode* find_min(BinaryTreeNode* root) {
    3.   if (root == nullptr) {
    4.     return nullptr;
    5.   }
    6.   return root->left == nullptr ? root : find_min(root->left);
    7. }
    • 查找最大值并返回其结点

    1. template <class Element>
    2. BinaryTreeNode* find_max(BinaryTreeNode* root) {
    3. if (root != nullptr) {
    4. while (root->right != nullptr) {
    5. root = root->right;
    6. }
    7. }
    8. return root;
    9. }

     

    1. // 获取下界
    2. template <class Element>
    3. BinaryTreeNode* get_lower_bound(BinaryTreeNode* root, const Element& target) {
    4. auto result = root;
    5. while (root != nullptr) {
    6. if (!(root->data < target)) {
    7. result = root;
    8. root = root->left;
    9. } else {
    10. root = root->right;
    11. }
    12. }
    13. return result;
    14. }
    15. // 获取上界
    16. template <class Element>
    17. BinaryTreeNode* get_upper_bound(BinaryTreeNode* root, const Element& target) {
    18. auto result = root;
    19. while (root != nullptr) {
    20. if (target < root->data) {
    21. result = root;
    22. root = root->left;
    23. } else {
    24. root = root->right;
    25. }
    26. }
    27. return result;
    28. }

    BST 中进行插入与移除操作

    插入一个元素在 BST 上的操作十分简单,与 contains 函数一样,以 BST 的定义顺着 BST 向下寻找,直到结点的子结点为 nullptr 为止,将这个插入的结点挂载到这个查找到的子结点上。

     

    如果是移除操作呢?我们一直忽略了如何在二叉树中移除一个元素,因为正常的一棵二叉树中,如果你想移除一个结点,你需要处理移除结点之后 parent 与 child 之间的关系。这并不好处理,你不确定这些 child 是否可以挂载到 parent 上,继续以 parent 的子结点出现。幸运的是,你可以直接将其值与一个 leaf 交换,并直接删除 leaf 就好,这样你就没有 parent 的担忧了。

    这种交换的方式可以用于 BST 吗?当然是完全可以。现在只剩下一个问题了,如何保证在移除结点后,这棵树依然是 BST,稍微转换一下问题的问法:和哪个 leaf 交换不会影响 BST 的结构。

    当然是和其前驱或者后继交换后再删除不会影响 BST 的整体结构,如果前驱或后继并不是 leaf,那么递归地交换结点的值,直到结点是 leaf 为止。如果这个结点本身就是 leaf,那不用找了,决定就是你了!

    可选择前驱还是后继呢,如果结点有右子树,则代表着其后继在右子树中;如果结点有左子树,则表达其前驱在左子树中。如果没有对应的子树,代表其前驱或者后继需要回到父结点寻找,为了不必要的复杂度,一般选择在其子树中寻找前驱 / 后继结点。如果你找到了一个结点的前驱 / 后继,如果它不是 leaf,那它一定没有后继 / 前驱所对应的子树,被迫你只能一直沿着向前或向后寻找 leaf。

    BST 的平均情况分析

    一棵树的所有结点的深度和称为 内部路径长 (internal path length),我们尝试计算 BST 平均路径长。令 D(N) 是具有 N 个结点的某棵树 T 的内部路径长,则有 D(1)=0。一棵 N 结点树是由一棵 i(0≤i

     

     

    得到平均值 D(N)=O(Nlog⁡N) ,因此结点的预期深度 O(log⁡N) ,但这不意味着所有操作的平均运行时间是 O(log⁡N) 。

    Weiss 在书中为我们展示了一个随机生成的 500 个结点的 BST,其期望平均深度为 9.98。

     

     如果交替插入和删除 Θ(N^2) 次,那么树的平均期望深度将是 Θ(N) 。而下图展示了在 25 万次插入移除随机值之后树的样子,结点的平均深度为 12.51 。其中有可能的一个原因是,在移除结点时 remove 总是倾向于移除结点的前驱,而保留了结点的后继。我们可以尝试随机移除结点前驱或后继的方法来缓解这种不平衡。还有一个原因是一个给定序列,由根 (给定序列的第一个元素) 的值决定这棵树的偏向,如果根元素过大则会导致左子树的结点更多,因为序列中大部位数都小于根,反之则导致右子树结点增多。

     

     

  • 相关阅读:
    [大数据]docker搭建Hadoop
    短期经济波动:均衡国民收入决定理论(三)
    【AGC】常见典型问题FAQ 1
    寻找特殊年号
    web安全(初识)
    Ollama部署大模型并安装WebUi
    [译]这几个CSS小技巧,你知道吗?
    自制操作系统日记(6):静态桌面初步
    鸿蒙面试心得
    手把手带你实现JAVA自定义异常和全局异常处理
  • 原文地址:https://blog.csdn.net/qq_62464995/article/details/127687170