点击跳转到文章:【list的基本使用】
要模拟实现list,必须要熟悉list的底层结构以及其接口的含义,list的底层是带头双向循环链表,通过上一篇文章的学习,这些内容已基本掌握,现在我们来模拟实现list容器的主要接口。
与前面的vector类似,由于使用了模板,也只分成.cpp和.h两个文件。
.cpp文件里放节点类,迭代器类,list类及其成员函数,测试函数的实现,在.h文件里进行测试。
本文的重点是:对三个类的区分与理解,迭代器类的实现。
1.为什么定义节点结构体时使用struct而不是class?
答:(1)其实用class也可以,但是class与struct默认的访问限定不同,当没有声明公有,私有时,struct内容默认是公有,class内容默认的私有,所以用class要加上public。
(2)当我们用class没有加上public,也没有实例化对象时,编译不会报错(报私有成员的错误),因为模版是不会被细节编译的。只有当我们实例化出对象,模版才会被编译,并且类的实例化并不是对所有成员函数都实例化,而是调用哪个成员函数就实例化哪个。这叫做按需实例化。
2.可用匿名对象初始化。如果T是自定义类型,则调用其默认构造,并且T是内置类型也升级成了有默认构造的概念了。
template <class T>
struct ListNode
{
ListNode<T>* _next;
ListNode<T>* _prev;
T _data;
ListNode(const T& data = T())
:_next(nullptr)
,_prev(nullptr)
,_data(data)
{}
};
前面学习的string类和vector的迭代器用的是原生指针类型,即T*。但是在list容器中是不能这样的,因为前面两者的底层物理空间是连续的,符合迭代器++与- -的行为。但是list是由一个一个节点构成的,物理空间不连续,Node*的++和- -不符合迭代器的行为,无法变遍历。
所以用一个类把Node* 封装,就可以重载运算符,使得用起来像内置类型,但会转换成函数调用,继而控制Node*的行为。
遍历需要的核心运算符重载是 *,!=,++ 和 ->。所以只需要利用带头双向循环链表的特性,对Node * 进行封装,从而控制Node * 的行为。
class ListIterator
{
typedef ListNode<T> Node;
typedef ListIterator<T> Self;//名字变得简短
public:
Node* _node;//定义一个节点指针
ListIterator(Node* node)
:_node(node)
{}
//前置:返回之后的值
//++it;//返回与自己一样的类型
Self& operator++()
{
_node = _node->_next;
return *this;
}
Self& operator--()
{
_node = _node->_prev;
return *this;
}
//后置:返回之前的值
Self operator++(int)
{
Self tmp(*this);
_node = _node->_next;
return tmp;
}
Self operator--(int)
{
Self tmp(*this);
_node = _node->_prev;
return tmp;
}
T& operator*()
{
return _node->_data;
}
//返回的是数据的地址
T* operator->()
{
return &_node->_data;
}
bool operator!=(const Self& it)
{
return _node != it._node;
}
bool operator==(const Self& it)
{
return _node == it._node;
}
};
假设某个场景下存在一个坐标类:
struct Pos
{
int _row;
int _col;
Pos(int row = 0,int col = 0)
:_row(row)
,_col(col)
{}
};
如果我们插入坐标,并且想要打印出坐标,该如何遍历?
错误示范:
void test_list2()
{
list<Pos> lt1;
lt1.push_back(Pos(100, 100));//使用匿名对象
lt1.push_back(Pos(200, 200));
lt1.push_back(Pos(300, 300));
//这里的it是Pos*,是结构体指针
list<Pos>::iterator it = lt1.begin();
while (it != lt1.end())
{
cout << *it << " ";//err
++it;
}
cout << endl;
}
原因:因为这里的*it返回的是Pos自定义类型,而访问自定义类型需要需要在类中自己重载流插入(<<),这里并没有重载,所以报错。
正确操遍历的两种方式:
方式1:通过.操作符直接访问结构体的成员变量(一般不这样访问数据)。
cout << (*it)._row << ":" << (*it)._col << endl;//ok
方式2:通过重载->运算符,对结构体指针进行解引用。
cout << it.operator->()->_row << ":" << it.operator->()->_col << endl;//ok
注意:其实这里严格来说是有两个箭头,第一个运算符重载的调用 it.operator->() 返回的是 Pos*,第二个箭头才是原生指针,Pos*再用箭头访问。为了可读性,省略了一个->。
void test_list2()
{
list<Pos> lt1;
lt1.push_back(Pos(100, 100));//使用匿名对象
lt1.push_back(Pos(200, 200));
lt1.push_back(Pos(300, 300));
//这里的it是Pos*,是结构体指针
list<Pos>::iterator it = lt1.begin();
while (it != lt1.end())
{
//方式1:
//cout << (*it)._row << ":" << (*it)._col << endl;//ok
//*it就是Pos结构体,再用.操作符访问成员
//方式2:
cout << it->_row << ":" << it->_col << endl;//ok
//cout << it.operator->()->_row << ":" << it.operator->()->_col << endl;//ok
++it;
}
cout << endl;
}
在我们遍历数据时,有时会写一个打印函数,引用传参,一般建议加const,这就出现了一个const链表:
void Func(const list<int>& lt1)
{
list<int>::const_iterator it = lt1.begin();
while (it != lt1.end())
{
cout << *it << " ";
++it;
}
cout << endl;
}
const迭代器不是在普通迭代器前面加const,即不是const iterator。
//err 这样使it本身也不能++了
const list< int >::iterator it = it.begin();
const 迭代器目的:本身可以修改,指向的内容不能修改,类似const T* p。
所以我们要再定义一个类,控制*和->的返回值就可以了。
template <class T>
class ListConstIterator
{
typedef ListNode<T> Node;
typedef ListConstIterator<T> Self;//名字变得简短
public:
Node* _node;//定义一个节点指针
ListConstIterator(Node* node)
:_node(node)
{}
//前置:返回之后的值
//++it;//返回与自己一样的类型
Self& operator++()
{
_node = _node->_next;
return *this;
}
Self& operator--()
{
_node = _node->_prev;
return *this;
}
//后置:返回之前的值
Self operator++(int)
{
Self tmp(*this);
_node = _node->_next;
return tmp;
}
Self operator--(int)
{
Self tmp(*this);
_node = _node->_prev;
return tmp;
}
// 所以我们要再定义一个类,使用const控制*和->的返回值就可以
const T& operator*()
{
return _node->_data;
}
const T* operator->()
{
return &_node->_data;
}
bool operator!=(const Self& it)
{
return _node != it._node;
}
bool operator==(const Self& it)
{
return _node == it._node;
}
};
可以发现,其实普通迭代器和const迭代器的本质区别是 * 和 ->,这两个运算符的返回类型的变化。两个类冗余,所以可以通过模板,给不同的模板参数,让编译器自己实例化两个类。
template <class T,class Ref,class Ptr>
struct ListIterator
{
typedef ListNode<T> Node;
typedef ListIterator<T, Ref, Ptr> Self;//名字变得简短
Node* _node;//定义一个节点指针
ListIterator(Node* node)
:_node(node)
{}
//前置:返回之后的值
//++it;//返回与自己一样的类型
Self& operator++()
{
_node = _node->_next;
return *this;
}
Self& operator--()
{
_node = _node->_prev;
return *this;
}
//后置:返回之前的值
Self operator++(int)
{
Self tmp(*this);
_node = _node->_next;
return tmp;
}
Self operator--(int)
{
Self tmp(*this);
_node = _node->_prev;
return tmp;
}
Ref operator*()
{
return _node->_data;
}
Ptr operator->()
{
return &_node->_data;
}
bool operator!=(const Self& it)
{
return _node != it._node;
}
bool operator==(const Self& it)
{
return _node == it._node;
}
};
(1) 类中是否需要写析构函数?
这个迭代器类不要写析构函数,因为这里的节点不是迭代器的,是链表的,不用把它释放。我们使用begin,end返回节点给迭代器,是借助迭代器修改,访问数据,所以我们不需要释放。
(2) 类中是否需要写拷贝构造进行深拷贝和写赋值拷贝?
这里也不需要写拷贝构造进行深拷贝,因为这里要的就是浅拷贝。begin返回了第一个节点的迭代器给it,这里就是用默认生成的拷贝构造,浅拷贝给it,那这两个迭代器就指向同一个节点,所以这里用默认的拷贝构造和赋值拷贝就可以了。
template <class T>
class list
{
typedef ListNode<T> Node;
public:
//物理空间不是连续的,不符合迭代器的行为,无法遍历
//typedef Node* iterator;
//规范命名
//typedef ListIterator iterator;
//typedef ListConstIterator const_iterator;
typedef ListIterator<T, T&, T*> iterator;
typedef ListIterator<T, const T&, const T*> const_iterator;
//………………
private:
Node* _head;
};
包含普通迭代器和const迭代器。
iterator begin()
{
//iterator it(_head->_next);
//return it;
return iterator(_head->_next);//使用匿名对象
}
iterator end()
{
return iterator(_head);
}
const_iterator begin()const
{
return const_iterator(_head->_next);
}
const_iterator end()const
{
return const_iterator(_head);
}
iterator insert(iterator pos, const T& x)
{
Node* cur = pos._node;//找到当前节点
Node* newnode = new Node(x);//申请节点
Node* prev = cur->_prev;//找到前一个节点
//prev newnode cur 进行链接
newnode->_next = cur;
cur->_prev = newnode;
prev->_next = newnode;
newnode->_prev = prev;
return iterator(newnode);
}
注意:链表的insert没有迭代器失效问题,因为没有扩容的概念,pos位置的节点不会改变。但是STL库里insert也给了返回值,返回的是新插入位置的迭代器。
iterator erase(iterator pos)
{
assert(pos != end());//防止删除头节点
Node* cur = pos._node;//找到当前节点
Node* prev = cur->_prev;//找到前一个节点
Node* next = cur->_next;//找到后一个节点
prev->_next = next;
next->_prev = prev;
delete cur;
return iterator(next);
}
注意:链表的erase后有迭代器失效问题,pos失效了,因为pos指向的节点被释放了。所以也要返回值,返回的是删除节点的下一个节点的迭代器。
可以复用前面的 insert和 erase 。
//尾插:end()的下一个位置
void push_back(const T& x)
{
//Node* newnode = new Node(x);//申请节点并且初始化
//Node* tail = _head->_prev;
链接节点
//tail->_next = newnode;
//newnode->_prev = tail;
//_head->_prev = newnode;
//newnode->_next = _head;
insert(end(), x);
}
//尾删
void pop_back()
{
erase(--end());//注意:前置--
}
//头插:在begin前面插入
void push_front(const T& x)
{
insert(begin(), x);
}
//头删
void pop_front()
{
erase(begin());
}
主要包含:构造函数,拷贝构造,initializer_list构造(列表构造)。
注意:由于这些都是在有哨兵位节点的前提下实现的,所以可以把申请哨兵位头节点这一步骤提取出来。
//空初始化,申请哨兵位头节点
void empty_init()
{
_head = new Node();
_head->_next = _head;
_head->_prev = _head;
}
list()
{
empty_init();
}
//拷贝构造:直接复用尾插,前提要有哨兵位头节点
//lt2(lt1)
list(const list<T>& lt)
{
empty_init();
//注意:使用范围for时加上const和&
for (const auto& e : lt)
{
push_back(e);
}
}
//initializer_list构造,前提要有哨兵位头节点
list(initializer_list<T> il)
{
empty_init();
for (const auto& e : il)
{
push_back(e);
}
}
析构函数的作用是:删除整个链表结构,包括哨兵位节点。
//清空当前数据 留头节点,其余节点释放
void clear()
{
auto it = begin();
while (it != end())
{
//返回删除节点的下一个节点的迭代器
it = erase(it);
}
}
//析构:销毁整个链表
~list()
{
clear();
delete _head;
_head = nullptr;
}