目录
前面对 map/multimap/set/multiset 进行了简单的介绍,在其文档介绍中发现,这几个容器有个共同点是: 其底层都是按照二叉搜索树来实现的 ,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N) ,因此map、 set 等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。
二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii 和E.M.Landis在1962年 发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的 绝对值 不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均 搜索长度。
一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在
O(log2_ n),搜索时间复杂度O(log2_ n)。
我们这里直接实现KV模型的AVL树,为了方便后续的操作,这里将AVL树中的结点定义为三叉链结构,并在每个结点当中引入平衡因子(右子树高度-左子树高度)。除此之外,还需编写一个构造新结点的构造函数,由于新构造结点的左右子树均为空树,于是将新构造结点的平衡因子初始设置为0即可。
template<class T> struct AVLTreeNode { AVLTreeNode(const T& data) : _pLeft(nullptr), _pRight(nullptr), _pParent(nullptr) , _data(data), _bf(0) {} AVLTreeNode* _pLeft; // 该节点的左孩子 AVLTreeNode* _pRight; // 该节点的右孩子 AVLTreeNode* _pParent; // 该节点的双亲 T _data; int _bf; // 该节点的平衡因子 };
注意:
- 给每个结点增加平衡因子并不是必须的,只是实现AVL树的一种方式,不引入平衡因子也可以实现AVL树,只不过会麻烦一点
- 树中最大元素一定是无左子树,因为最大元素如果存在左子树,中序遍历就不可能是降序序列
- 插入时,AVL树最多只需要旋转两次
AVL树插入结点时有以下三个步骤:
- 按照二叉搜索树的插入方法,找到待插入位置。
- 找到待插入位置后,将待插入结点插入到树中。
- 更新平衡因子,如果出现不平衡,则需要进行旋转。
因为AVL树本身就是一棵二叉搜索树,因此寻找结点的插入位置是非常简单的,按照二叉搜索树的插入规则:
- 待插入结点的key值比当前结点小就插入到该结点的左子树。
- 待插入结点的key值比当前结点大就插入到该结点的右子树。
- 待插入结点的key值与当前结点的key值相等就插入失败。
如此进行下去,直到找到与待插入结点的key值相同的结点判定为插入失败,或者最终走到空树位置进行结点插入。
向AVL树中插入新数据
- 在某个子树的左子树的左子树上插入新节点,导致根节点的平衡因子由1变为2
右单旋的步骤如下:
- 让y的右子树作为x的左子树。
- 让x作为y的右子树。
- 让y作为整个子树的根。
- 更新平衡因子。
右单旋后满足二叉搜索树的性质:
- y的右子树当中结点的值本身就比x的值小,因此可以作为x的左子树。
- x及其右子树当中结点的值本身就比y的值大,因此可以作为y的右子树。
右单选代码实现
- void RotateR(Node* pParent)
- {
- Node* pSubL = pParent->_pLeft;
- Node* pSubLR = pSubL->_pRight;
-
- // 改变pParent和pSubL孩子的指向
- pParent->_pLeft = pSubLR;
- if (pSubLR)
- pSubLR->_pParent = pParent;
-
- pSubL->_pRight = pParent;
-
- // 更新pParent和pSubL的双亲
- Node* pPParent = pParent->_pParent;
- pParent->_pParent = pSubL;
- pSubL->_pParent = pPParent;
-
- // 更新原pParent双亲的左||右指针域指向
- if (nullptr == pPParent)
- {
- _pRoot = pSubL;
- }
- else
- {
- if (pParent == pPParent->_pLeft)
- pPParent->_pLeft = pSubL;
- else
- pPParent->_pRight = pSubL;
- }
-
- pParent->_bf = pSubL->_bf = 0;
- }
- 在某个子树的右子树的右子树上插入新节点,导致根节点的平衡因子由-1变为-2
左单旋的步骤如下:
- 让y的左子树作为x的右子树。
- 让x作为y的左子树。
- 让y作为整个子树的根。
- 更新平衡因子。
左单旋后满足二叉搜索树的性质:
- y的左子树当中结点的值本身就比x的值大,因此可以作为x的右子树。
- x及其左子树当中结点的值本身就比y的值小,因此可以作为y的左子树。
左单旋代码实现
-
- void RotateL(Node* pParent)
- {
- Node* pSubR = pParent->_pRight;
- Node* pSubRL = pSubR->_pLeft;
-
- pParent->_pRight = pSubRL;
- if (pSubRL)
- pSubRL->_pParent = pParent;
-
- pSubR->_pLeft = pParent;
- Node* pPParent = pParent->_pParent;
- pParent->_pParent = pSubR;
- pSubR->_pParent = pPParent;
-
- if (nullptr == pPParent)
- {
- _pRoot = pSubR;
- }
- else
- {
- if (pParent == pPParent->_pLeft)
- pPParent->_pLeft = pSubR;
- else
- pPParent->_pRight = pSubR;
- }
-
- pParent->_bf = pSubR->_bf = 0;
- }
- 在某个子树的左子树的右子树上插入新节点,导致根节点的平衡因子由1变为2
左右双旋的步骤如下:
- 以y为旋转点进行左单旋。
- 以x为旋转点进行右单旋。
- 更新平衡因子。
左右双旋后满足二叉搜索树的性质:
左右双旋后,实际上就是让z的左子树和右子树,分别作为y和x的右子树和左子树,再让y和x分别作为z的左右子树,最后让z作为整个子树的根(结合图理解)。
- z的左子树当中的结点本身就比y的值大,因此可以作为y的右子树。
- z的右子树当中的结点本身就比x的值小,因此可以作为x的左子树。
- 经过步骤1/2后,y及其子树当中结点的值都就比z的值小,而x及其子树当中结点的值都就比z的值大,因此它们可以分别作为z的左右子树。
左右双旋转代码实现
- void RotateRL(Node* pParent)
- {
- Node* pSubR = pParent->_pRight;
- Node* pSubRL = pSubR->_pLeft;
- int bf = pSubRL->_bf;
-
- RotateR(pParent->_pRight);
- RotateL(pParent);
-
- // 更新部分节点的平衡因子
- if (bf == -1)
- pSubR->_bf = 1;
- else if (bf == 1)
- pParent->_bf = -1;
- }
- 在某个子树的右子树的左子树上插入新节点,导致根节点的平衡因子由-1变为-2
右左双旋的步骤如下:
- 以y为旋转点进行右单旋。
- 以x为旋转点进行左单旋。
- 更新平衡因子。
右左双旋后满足二叉搜索树的性质:
右左双旋后,实际上就是让z的左子树和右子树,分别作为x和y的右子树和左子树,再让x和y分别作为x的左右子树,最后让z作为整个子树的根(结合图理解)。
- z的左子树当中的结点本身就比x的值大,因此可以作为x的右子树。
- z的右子树当中的结点本身就比y的值小,因此可以作为y的左子树。
- 经过步骤1/2后,x及其子树当中结点的值都就比z的值小,而y及其子树当中结点的值都就比z的值大,因此它们可以分别作为z的左右子树。
右左双旋转代码实现
- void RotateLR(Node* pParent)
- {
- Node* pSubL = pParent->_pLeft;
- Node* pSubLR = pSubL->_pRight;
- int bf = pSubLR->_bf;
-
- RotateL(pParent->_pLeft);
- RotateR(pParent);
- if (-1 == bf)
- pParent->_bf = 1;
- else if (1 == bf)
- pSubL->_bf = -1;
- }
- template<class T>
- struct AVLTreeNode
- {
- AVLTreeNode(const T& data = T())
- : _pLeft(nullptr)
- , _pRight(nullptr)
- , _pParent(nullptr)
- , _data(data)
- , _bf(0)
- {}
-
- AVLTreeNode
* _pLeft; - AVLTreeNode
* _pRight; - AVLTreeNode
* _pParent; - T _data;
- int _bf; // 节点的平衡因子
- };
-
-
- // AVL: 二叉搜索树 + 平衡因子的限制
- template<class T>
- class AVLTree
- {
- typedef AVLTreeNode
Node; - public:
- AVLTree()
- : _pRoot(nullptr)
- {}
-
- // 在AVL树中插入值为data的节点
- bool Insert(const T& data);
-
- // AVL树的验证
- bool IsAVLTree()
- {
- return _IsAVLTree(_pRoot);
- }
-
- private:
- // 根据AVL树的概念验证pRoot是否为有效的AVL树
- bool _IsAVLTree(Node* pRoot);
- size_t _Height(Node* pRoot);
- // 右单旋
- void RotateR(Node* pParent);
- // 左单旋
- void RotateL(Node* pParent);
- // 右左双旋
- void RotateRL(Node* pParent);
- // 左右双旋
- void RotateLR(Node* pParent);
-
- private:
- Node* _pRoot;
- };
- template<class T>
- struct AVLTreeNode
- {
- AVLTreeNode(const T& data = T())
- : _pLeft(nullptr)
- , _pRight(nullptr)
- , _pParent(nullptr)
- , _data(data)
- , _bf(0)
- {}
-
- AVLTreeNode
* _pLeft; - AVLTreeNode
* _pRight; - AVLTreeNode
* _pParent; - T _data;
- int _bf; // 节点的平衡因子
- };
-
-
-
- // AVL: 二叉搜索树 + 平衡因子的限制
- template<class T>
- class AVLTree
- {
- typedef AVLTreeNode
Node; - public:
- AVLTree()
- : _pRoot(nullptr)
- {}
-
- bool Insert(const T& data)
- {
- // 先按照二叉搜索树的方式进行插入
- if (nullptr == _pRoot)
- {
- _pRoot = new Node(data);
- return true;
- }
-
- // 按照二叉搜索树特性:找待插入节点在树中的位置
- // 并保存其双亲
- Node* pCur = _pRoot;
- Node* pParent = nullptr;
- while (pCur)
- {
- pParent = pCur;
- if (data < pCur->_data)
- pCur = pCur->_pLeft;
- else if (data > pCur->_data)
- pCur = pCur->_pRight;
- else
- return false;
- }
-
- // 插入新节点
- pCur = new Node(data);
- if (data < pParent->_data)
- pParent->_pLeft = pCur;
- else
- pParent->_pRight = pCur;
- pCur->_pParent = pParent;
-
- while (pParent)
- {
- // 更新pParent的平衡因子
- if (pCur == pParent->_pLeft)
- pParent->_bf--;
- else
- pParent->_bf++;
-
- if (0 == pParent->_bf)
- break;
- else if (-1 == pParent->_bf || 1 == pParent->_bf)
- {
- pCur = pParent;
- pParent = pCur->_pParent;
- }
- else
- {
- // pParent->_bf: 2 || -2
- // pParent的节点失去平衡
- if (2 == pParent->_bf)
- {
- // 右子树高-->最后必须左单旋
- if (1 == pCur->_bf)
- RotateL(pParent);
- else
- RotateRL(pParent);
- }
- else
- {
- if (-1 == pCur->_bf)
- RotateR(pParent);
- else
- RotateLR(pParent);
- }
-
- break;
- }
- }
-
- return true;
- }
-
- void InOrder()
- {
- _InOrder(_pRoot);
- }
-
- Node* LeftMost()
- {
- if (nullptr == _pRoot)
- return nullptr;
-
- Node* pCur = _pRoot;
- while (pCur->_pLeft)
- pCur = pCur->_pLeft;
-
- return pCur;
- }
-
- Node* RightMost()
- {
- if (nullptr == _pRoot)
- return nullptr;
-
- Node* pCur = _pRoot;
- while (pCur->_pRight)
- pCur = pCur->_pRight;
-
- return pCur;
- }
-
- bool IsAVLTree()
- {
- return _IsAVLTree(_pRoot);
- }
-
- private:
- // 验证二叉搜索树是否为有效的
- bool _IsAVLTree(Node* pRoot)
- {
- if (nullptr == pRoot)
- return true;
-
- int leftHeight = _Height(pRoot->_pLeft);
- int rightHeight = _Height(pRoot->_pRight);
-
- if (abs(rightHeight - leftHeight) > 1 ||
- rightHeight - leftHeight != pRoot->_bf)
- return false;
-
- return _IsAVLTree(pRoot->_pLeft) && _IsAVLTree(pRoot->_pRight);
- }
-
- size_t _Height(Node* pRoot)
- {
- if (nullptr == pRoot)
- return 0;
-
- size_t leftHeight = _Height(pRoot->_pLeft);
- size_t rightHeight = _Height(pRoot->_pRight);
-
- return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
- }
-
-
- void RotateR(Node* pParent)
- {
- Node* pSubL = pParent->_pLeft;
- Node* pSubLR = pSubL->_pRight;
-
- // 改变pParent和pSubL孩子的指向
- pParent->_pLeft = pSubLR;
- if (pSubLR)
- pSubLR->_pParent = pParent;
-
- pSubL->_pRight = pParent;
-
- // 更新pParent和pSubL的双亲
- Node* pPParent = pParent->_pParent;
- pParent->_pParent = pSubL;
- pSubL->_pParent = pPParent;
-
- // 更新原pParent双亲的左||右指针域指向
- if (nullptr == pPParent)
- {
- _pRoot = pSubL;
- }
- else
- {
- if (pParent == pPParent->_pLeft)
- pPParent->_pLeft = pSubL;
- else
- pPParent->_pRight = pSubL;
- }
-
- pParent->_bf = pSubL->_bf = 0;
- }
-
- void RotateL(Node* pParent)
- {
- Node* pSubR = pParent->_pRight;
- Node* pSubRL = pSubR->_pLeft;
-
- pParent->_pRight = pSubRL;
- if (pSubRL)
- pSubRL->_pParent = pParent;
-
- pSubR->_pLeft = pParent;
- Node* pPParent = pParent->_pParent;
- pParent->_pParent = pSubR;
- pSubR->_pParent = pPParent;
-
- if (nullptr == pPParent)
- {
- _pRoot = pSubR;
- }
- else
- {
- if (pParent == pPParent->_pLeft)
- pPParent->_pLeft = pSubR;
- else
- pPParent->_pRight = pSubR;
- }
-
- pParent->_bf = pSubR->_bf = 0;
- }
-
- void RotateRL(Node* pParent)
- {
- Node* pSubR = pParent->_pRight;
- Node* pSubRL = pSubR->_pLeft;
- int bf = pSubRL->_bf;
-
- RotateR(pParent->_pRight);
- RotateL(pParent);
-
- // 更新部分节点的平衡因子
- if (bf == -1)
- pSubR->_bf = 1;
- else if (bf == 1)
- pParent->_bf = -1;
- }
-
- void RotateLR(Node* pParent)
- {
- Node* pSubL = pParent->_pLeft;
- Node* pSubLR = pSubL->_pRight;
- int bf = pSubLR->_bf;
-
- RotateL(pParent->_pLeft);
- RotateR(pParent);
- if (-1 == bf)
- pParent->_bf = 1;
- else if (1 == bf)
- pSubL->_bf = -1;
- }
-
- void _InOrder(Node* pRoot)
- {
- if (pRoot)
- {
- _InOrder(pRoot->_pLeft);
- cout << pRoot->_data << " ";
- _InOrder(pRoot->_pRight);
- }
- }
-
- private:
- Node* _pRoot;
- };