• 模拟实现vector


    一:vector的成员变量与迭代器

    • 我们知道vector里面可以存各种数据类型,所以必定会用到模板,假设vector的模板参数为T,那么T*这个指针封装后就是vector的迭代器
    • 和string的迭代器很像,只不过string确定存的是字符,所以迭代器直接是char的指针,而vector存的数据类型不确定,就使用T的指针
    • 而vector的3个成员变量_start,_finish,_endofstorage也就是3个迭代器,分别指向vector的开头,vector有效数据的结尾,vector容量的结尾
    • 在这里插入图片描述
    template <class T>
    	class vector
    	{
    	public:
    		typedef T* iterator;
    		typedef const T* const_iterator;
    		iterator begin()
    		{
    			return _start;
    		}
    		iterator end()
    		{
    			return _finish;
    		}
    		const_iterator begin() const
    		{
    			return _start;
    		}
    		const_iterator end() const
    		{
    			return _finish;
    		}
    	private:
    		iterator _start;
    		iterator _finish;
    		iterator _endofstorage;
    	};
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 根据这3个迭代器,我们就能轻松的得出vector的size和capacity,就是用_finish和_endofstorage分别与_start相减
    • operator[]就更简单了,和我们使用一维数组时一样,直接返回_start[pos]
    • 当_start==_finish,我们就能确定vector目前为空
    size_t size() const
    		{
    			return _finish - _start;
    		}
    		size_t capacity() const
    		{
    			return _endofstorage - _start;
    		}
    		T& operator[](size_t pos)
    		{
    			assert(pos < size());
    			return _start[pos];
    		}
    		const T& operator[](size_t pos) const
    		{
    			assert(pos < size());
    			return _start[pos];
    		}
    		bool empty() const
    		{
    			return _start == _finish;
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    二:vector的构造与析构

    • 普通的构造和析构很简单,不用多说
    • 主要关注支持迭代器的构造函数,我们需要重新搞一个迭代器,因为如果直接用之前封装的iterator当参数,那么只支持传vector的迭代器构造
    • 我们换成模板参数后,则可以支持任意容器的迭代器来构造vector
    		vector()
    		{
    			_start = nullptr;
    			_finish = nullptr;
    			_endofstorage = nullptr;
    		}
    		~vector()
    		{
    			if (_start)
    			{
    				delete[] _start;
    			}
    			_start = _finish = _endofstorage;
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    	template <class InputIterator>
    	vector(InputIterator first, InputIterator end)
    			:_start(nullptr)
    			, _finish(nullptr)
    			, _endofstorage(nullptr)
    		{
    			while (first != end)
    			{
    				push_back(*first);
    				first++;
    			}
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    三:reserve与resize


    1.reverse

    • vector当容量不足时需要扩容,reserve的重要性不言而喻,后面的insert,push_back,拷贝构造都需要用到,但是编写代码时却很容易出错

    • 大家应该都能想到,先判断传入的参数是否大于目前容量,大于则进行扩容,即申请一块新的空间,将旧的空间数据拷贝过去,然后释放旧空间,最后更新3个成员变量的指向

    • 最容易错的地方就是将旧空间的数据拷贝到新空间的这一步

    • 我们通常会想到memcpy,方便快捷,还是内存拷贝,不用担心数据类型,似乎毫无问题,但其实有着重大的隐患

    • 如果vector中存的是内置类型,比如int,char那么没有什么问题,但是要是存的是string,问题就来了

    • memcpy直接拷贝了string的_str,_size,_capacity,而_str指向了一片堆上的空间,这就变成了浅拷贝,完成拷贝后,我们释放旧空间,编译器也会调用string的析构函数释放其指向的空间

    • 那我们新空间的_str就成了野指针,指向了一片未知空间,最后vector使用完毕调用析构函数时,就会再次释放_str指向的空间,而此时这片空间已经被释放过了,不再是堆上分配来的空间,我们无权释放,硬性释放会导致我们的程序崩溃
      在这里插入图片描述

    • 解决方法就是不使用memcpy,而是遍历使用=操作符进行赋值,对于string,编译器会调用string的operator=完成深拷贝,就可以避免上述问题

    	void reserve(size_t n)
    	{
    		size_t len = size();
    		if (n > capacity())
    		{
    			T* tmp = new T[n];
    			if (_start)//_start不为空指针
    			{
    				//禁止使用memcpy,对于需要深拷贝的对象会出问题
    				//比如vector
    				for (int i = 0; i < len; i++)
    				{
    					tmp[i] = _start[i];//string的operator=
    				}
    				delete[] _start;
    			}
    			_start = tmp;
    			_finish = _start + len;
    			_endofstorage = _start + n;
    		}
    	}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21

    2.resize

    • 相比于reverse,resize就要简单许多
    • 需要注意的是T类型的参数如何进行缺省,const T& val = T(),利用T类型的自己的构造函数构造一个匿名对象作为缺省值
    • 当n小于vector容量时,直接修改_finish
    • 当n大于vector容量时,扩容后将val拷贝进去
    void resize(size_t n, const T& val = T())
    	{
    		if (n <= size())
    		{
    			_finish = _start + n;
    		}
    		else
    		{
    			if (n > capacity())
    			{
    				reserve(n);
    			}
    			while (_finish < _start + n)
    			{
    				*_finish = val;
    				_finish++;
    			}
    		}
    	}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    四:拷贝构造与operator=


    1. 拷贝构造

    • 进行拷贝构造时我们也容易使用memcpy进行拷贝,也会造成和reserve一样的问题
    • 所以我们可以用另一种巧妙的方式避免浅拷贝,那就是遍历要拷贝的vector,将其中每一个数据push_back进新的vector中
    • 而push_back是通过_finish=x进行赋值的,会调用相应类型的operator=,而完成深拷贝
    • 还有一个细节就是,我们遍历进行push_back之前需要先对新的vector进行reserve保证两个vector最终容量一直
    • 如果直接push-back,可能新的vector容量只有原vector的size的大小,造成容量不一致
    		vector(const vector<T>& v)
    			:_start(nullptr)
    			, _finish(nullptr)
    			, _endofstorage(nullptr)
    		{
    			reserve(v.capacity()); //直接push_back的话capacity可能不一样大
    			for (auto e : v)
    			{
    				push_back(e);
    			}
    			/*_start = new T[v.capacity()];
    			memcpy(_start, v._start, sizeof(T) * v.size());
    			_endofstorage = _start + v.capacity();
    			_finish = _start + v.size();*/
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    2.operator=

    • operator=的编写可以参考Date类的operator=
    • 关键就是传参是不传引用,使其传参时完成一次拷贝构造,然后把这个完成拷贝构造后的vector和目前的vector进行交换
    		void swap(vector<T>& v)
    		{
    			std::swap(_start, v._start);
    			std::swap(_finish, v._finish);
    			std::swap(_endofstorage, v._endofstorage);
    		}
    		vector<T>& operator=(vector<T> v)
    		{
    			swap(v);
    			return *this;
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    五: 插入与删除


    1.push_back

    • push_back要注意的是vector可能为空或者容量不足,我们需要先进行扩容后,再进行插入
    	void push_back(const T& x)
    	{
    		if (_finish == _endofstorage)
    		{
    			size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
    			reserve(newcapacity);
    		}
    		*_finish = x;
    		_finish++;
    	}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    2.pop_back

    • pop_back我们也不用真删,修改_finish的值即可,前提是vector不为空,为空就不能再删了
    void pop_back()
    		{
    			assert(!empty());
    			_finish--;
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5

    3.insert

    • insert注意插入的位置不能超过_finish,因为insert是在pos位置的后面插入,所以pos最多到_finish-1
    • 与push_back相同,insert也要先检查容量,容量不足时扩容后才能进行插入
    • 当扩容后,pos迭代器失效,因为此时pos还指向之前旧空间的位置,我们需要更新pos才能正常进行插入
    • 插入时需要把pos以后的数据往后移动,所以insert是个O(n)的接口,不推荐频繁使用
    	iterator insert(iterator pos, const T& x)
    		{
    			assert(pos < _finish);
    			if (_finish == _endofstorage)
    			{
    				size_t len = pos - _start;
    				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
    				reserve(newcapacity);
    				pos = _start + len;
    			}
    			iterator end = _finish - 1;
    			while (end >= pos)
    			{
    				*(end + 1) = *end;
    				end--;
    			}
    			*pos = x;
    			_finish++;
    			return pos;
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    4.erase

    • 要删除的位置要小于_finish,_finish没有存数据,所以pos最多到_finish-1
    • 同样erase也是时间为O(n)的接口,不推荐频繁使用
    		iterator erase(iterator pos)
    		{
    			assert(pos < _finish);
    			iterator it = pos + 1;
    			while (it != _finish)
    			{
    				*(it - 1) = *it;
    				it++;
    			}
    			_finish--;
    			return pos;
    		}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    5.插入和删除导致的迭代器失效

    • reserve,resize,insert,push_back会造成vector扩容的操作,都会让vector的迭代器失效
    • 根本原因是扩容时vector已经有了新的空间,而迭代器还在指向被释放了旧空间造成
    • erase同样可能导致迭代器失效,按理来说,删除pos位置元素,之后的元素会往前移,迭代器应该不会失效,但是尾删时,迭代器会指向_finish位置,而-finish位置是没有元素的,此时也认为迭代器失效了
    • 如何解决?
    • 使用前,对迭代器重新赋值即可
  • 相关阅读:
    操作系统笔记
    【正点原子STM32连载】第五十章 照相机实验 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
    Flink 知识点整理及八股文问题<第一部分 Flink简介>
    激光雷达检测负障碍物(附大概 C++ 代码)
    ServletInvocableHandlerMethod类简介说明
    mac 安装 homebrew
    自动升级程序的实现方案(delphi版)
    【项目】手把手带你用 SpringBoot、Uniapp、MySql 开发一个简单的活动报名项目
    服务响应时间的衡量指标
    Docker Debian安装Docker
  • 原文地址:https://blog.csdn.net/m0_63445149/article/details/126823198