• 【 C++ 】vector的模拟实现


    目录

    1、基本成员变量

    2、默认成员函数

            构造函数

            析构函数

            拷贝构造函数

            赋值运算符重载函数

    3、容器访问相关函数接口

            operator[ ]运算符重载

            迭代器

            范围for

    4、vector空间增长问题

            size和capacity

            reserve扩容

            resize

            swap交换数据

    5、增加的相关函数接口

            push_back尾插

            insert

    6、删除的相关函数接口

            pop_back尾删

            erase

            clear清空数据

    7、源码链接


    1、基本成员变量

    1. namespace cpp
    2. {
    3. template<class T>
    4. class vector
    5. {
    6. public:
    7. typedef T* iterator;
    8. typedef const T* const_iterator;
    9. private:
    10. iterator _start; //指向容器的头
    11. iterator _finish; //指向有效数据的尾
    12. iterator _endofstoage;//指向容器的尾
    13. };
    14. }

    2、默认成员函数

    构造函数

    • 1、无参构造函数

    只需要把每个成员变量初始化为nullptr即可。

    1. //无参构造函数
    2. vector()
    3. :_start(nullptr)
    4. , _finish(nullptr)
    5. , _endofstoage(nullptr)
    6. {}
    • 2、带参构造函数

    vector的带参构造函数首先在初始化列表对基本成员变量初始化,在将迭代器区间在[first, last)的数据一个个尾插到容器当中即可:

    1. //带参构造函数
    2. template <class InputIterator>
    3. vector(InputIterator first, InputIterator last)
    4. : _start(nullptr)
    5. , _finish(nullptr)
    6. , _endofstoage(nullptr)
    7. {
    8. //将迭代器区间在[first, last)的数据一个个尾插到容器当中
    9. while (first != last)
    10. {
    11. push_back(*first);
    12. first++;
    13. }
    14. }
    • 3、用n个val去初始化vector

    vector的构造函数还支持用n个val去初始化,只需要先调用reserve函数开辟n个大小的空间,再利用for循环把val的值依次push_back尾插进去即可。

    1. //用n个val来构造vector
    2. vector(size_t n, const T& val = T())
    3. : _start(nullptr)
    4. , _finish(nullptr)
    5. , _endofstoage(nullptr)
    6. {
    7. reserve(n);
    8. for (size_t i = 0; i < n; i++)
    9. {
    10. push_back(val);
    11. }
    12. }

    这样写会出现一个问题:内存寻址错误。当我想实现下面的语句时:

    cpp::vector<int> v(10, 4);

    这里我调用的地方两个参数都是int,此时调用构造函数时匹配的是第二个传迭代器区间的构造函数,导致这样的原因在于编译器会优先寻找最匹配的那个函数。此构造函数的第一个参数是unsigned int类型,所以不会优先匹配此构造函数。因此我们需要再重载一个第一个参数为int类型的构造函数即可解决

    1. vector(int n, const T& val = T())
    2. : _start(nullptr)
    3. , _finish(nullptr)
    4. , _endofstoage(nullptr)
    5. {
    6. reserve(n);
    7. for (int i = 0; i < n; i++)
    8. {
    9. push_back(val);
    10. }
    11. }

    析构函数

    首先判断该容器_start是否为空,不为空就释放空间+置空即可。

    1. //析构函数
    2. ~vector()
    3. {
    4. if (_start)//避免释放空指针
    5. {
    6. delete[] _start;//释放容器所指向的空间
    7. _start = _finish = _endofstoage = nullptr;//置空
    8. }
    9. }

    拷贝构造函数

    拷贝构造可以借助先前string的拷贝构造思路,利用现代方法解决,首先对基本成员变量进行初始化,接着建立一个tmp的模板将要拷贝的数据利用构造函数去传递过去,再将这个tmp模板与自己交换即可。

    1. //拷贝构造函数
    2. vector(const vector& v)
    3. :_start(nullptr)
    4. , _finish(nullptr)
    5. , _endofstoage(nullptr)
    6. {
    7. vector tmp(v.begin(), v.end());//调用构造函数
    8. swap(tmp);
    9. }

    赋值运算符重载函数

    这里是传值传参,没有引用传参,直接利用vector调用构造函数返回的值与左值进行swap交换即可进行赋值

    1. //赋值运算符重载
    2. vector& operator=(vector v)//调用构造
    3. {
    4. this->swap(v);//交换这两个对象
    5. return *this;//返回
    6. }

    3、容器访问相关函数接口

    operator[ ]运算符重载

    直接返回pos位置的数据即可进行下标+[ ]的方式进行访问

    1. //operator[]运算符重载
    2. T& operator[](size_t pos)
    3. {
    4. assert(pos < size());//检测pos的合法性
    5. return _start[pos];
    6. }

    为了方便const对象也可以调用[ ]运算符重载,因此还推出了一个const版本的[ ]运算符重载。

    1. //const版本的[]运算符重载
    2. const T& operator[](size_t pos) const
    3. {
    4. assert(pos < size());//检测pos的合法性
    5. return _start[pos];
    6. }

    迭代器

    vector的begin直接返回容器的_start起始位置即可,vector的end返回容器的_finish的位置。

    1. //begin
    2. iterator begin()
    3. {
    4. return _start;//返回容器起始位置
    5. }
    6. //end
    7. iterator end()
    8. {
    9. return _finish;//返回有效数据下一个的地址
    10. }

    这里迭代器同样也要考虑到const对象调用的可能性,因此推出const版本的迭代器如下:

    1. //const版本迭代器
    2. const_iterator begin() const
    3. {
    4. return _start;
    5. }
    6. //end
    7. const_iterator end() const
    8. {
    9. return _finish;
    10. }

    范围for

    和前面一样,范围for的底层是通过迭代器实现的,写法也很简单:

    1. void test_vector()
    2. {
    3. cpp::vector<int> v;
    4. v.push_back(1);
    5. v.push_back(2);
    6. v.push_back(3);
    7. v.push_back(4);
    8. v.push_back(5);
    9. //范围for
    10. for (auto e : v)
    11. {
    12. cout << e << " ";//1 2 3 4 5
    13. }
    14. }

    4、vector空间增长问题

    size和capacity

    指针相减可以得到对应的个数,因此获取size只需_finish - _start。获取capacity只需_endofstoage - _start。

    • size函数:
    1. size_t size() const //最好加上const,普通对象和const对象均可调用
    2. {
    3. return _finish - _start; //指针相减就能得到size的个数
    4. }
    • capacity函数:
    1. size_t capacity() const
    2. {
    3. return _endofstoage - _start;
    4. }

    reserve扩容

    reserve扩容和string的扩容非常相似。先开辟一块新的扩好容的空间,如果旧空间里头有数据,那么就利用for循环将容器中的数据一个一个拷贝到新空间,再释放旧空间,最后指向新空间。如果没有,直接指向新空间即可。

    1. //reserve扩容
    2. void reserve(size_t n)
    3. {
    4. size_t sz = size();//提前算出size()的大小,方便后续更新_finish
    5. if (n > capacity())
    6. {
    7. T* tmp = new T[n];
    8. if (_start)//判断旧空间是否有数据
    9. {
    10. //不能用memcpy,因为memcpy是浅拷贝
    11. for (size_t i = 0; i < size(); i++)
    12. {
    13. tmp[i] = _start[i];//将容器当中的数据一个个拷贝到tmp当中
    14. }
    15. delete[] _start;//释放旧空间
    16. }
    17. _start = tmp;//指向新空间
    18. }
    19. //更新_finish和_endofstoage
    20. _finish = _start + sz;
    21. _endofstoage = _start + n;
    22. }
    • 补充1:

    在扩容结束后要记得更新_finish和_endofstoage,这里的_finsh要加上原先的size()长度,要先用变量sz保存下来,否则后续扩容后会更改指针的指向由原先的_start变为tmp,若直接+ size()函数的返回值会导致结果为随机值。

    • 补充2:

    不能使用memcpy进行数据拷贝,因为memcpy是浅拷贝,它会将一段内存空间中内容原封不动的拷贝到另外一段内存空间中,导致后续delete时拷贝过的数据一并给delete了,具体我下篇博文详谈。


    resize

    1. 如果 n 小于当前容器的size(),则内容将减少到其前 n 个元素,删除超出(并销毁)的元素。
    2. 如果 n 大于当前容器 size(),则通过在末尾插入所需数量的元素以达到 n 的大小来扩展内容。若指定了 val,则新元素将初始化为 val 的副本,否则,它们将进行值初始化。
    3. 如果 n 也大于当前容器容量capacity(),则会自动重新分配分配的存储空间。
    1. //resize
    2. //void resize(size_t n, T val = T())
    3. void resize(size_t n, const T& val = T()) //利用T()调用默认构造函数的值进行初始化,这样写说明C++的内置类型也有自己的构造函数
    4. {
    5. //如果 n > capacity()容量,就需要扩容
    6. if (n > capacity())
    7. {
    8. reserve(n);
    9. }
    10. //如果 n > size(),就需要把有效数据_finish到_start + n之间的数据置为缺省值val
    11. if (n > size())
    12. {
    13. while (_finish < _start + n)
    14. {
    15. *_finish = val;
    16. _finish++;
    17. }
    18. }
    19. //如果 n < size(),更新有效数据到_start + n
    20. else
    21. {
    22. _finish = _start + n;
    23. }
    24. }
    • 补充:C++的内置类型也有自己的构造函数和析构函数,这样才能更好的支持模板。
    1. void test()
    2. {
    3. int i = 0;
    4. int j = int();
    5. int k = int(1);
    6. cout << i << endl;//0
    7. cout << j << endl;//0
    8. cout << k << endl;//1
    9. }

    swap交换数据

    直接调用库函数的swap去进行成员变量的交换即可。

    1. //交换函数
    2. void swap(vector& v)
    3. {
    4. std::swap(_start, v._start);
    5. std::swap(_finish, v._finish);
    6. std::swap(_endofstoage, v._endofstoage);
    7. }

    5、增加的相关函数接口

    push_back尾插

    push_back尾插和之前写过的尾插大同小异,先判断是否需要扩容,把尾插的值赋过去,再更新有效数据地址_finish即可:

    1. void push_back(const T& x)
    2. {
    3. //检测是否需要扩容
    4. if (_finish == _endofstoage)
    5. {
    6. size_t newcapcacity = capacity() == 0 ? 4 : capacity() * 2;
    7. reserve(newcapcacity);
    8. }
    9. *_finish = x;
    10. _finish++;
    11. }

    这里push_back还可以复用下文实现好的insert进行尾插,当insert中的pos为_finish时,insert实现的就是push_back尾插。而_finish可以通过调用迭代器end函数来解决。

    1. void push_back(const T& x)
    2. {
    3. //法二:复用insert
    4. insert(end(), x); //当insert中的参数pos为end()时,就是尾插
    5. }

    insert

    首先要坚持插入的位置是否越界,以及是否需要扩容。接着检测是否需要扩容。再挪动数据,最后把值插入进去。

    • 注意:

    注意扩容以后,pos就失效了,要记得更新pos,否则会发生迭代器失效。可以通过设定变量n来计算扩容前pos指针位置和_start指针位置的相对距离,最后在扩容后,让_start再加上先前算好的相对距离n就是更新后的pos指针的位置了。其实这里还有一个迭代器失效的问题,具体是啥,后续专门推出一篇迭代器失效的文章。下面给出完善修正后的insert:

    1. //insert
    2. iterator insert(iterator pos, const T& x)
    3. {
    4. //检测参数合法性
    5. assert(pos >= _start && pos <= _finish);
    6. //检测是否需要扩容
    7. /*扩容以后pos就失效了,需要更新一下*/
    8. if (_finish == _endofstoage)
    9. {
    10. size_t n = pos - _start;//计算pos和start的相对距离
    11. size_t newcapcacity = capacity() == 0 ? 4 : capacity() * 2;
    12. reserve(newcapcacity);
    13. pos = _start + n;//防止迭代器失效,要让pos始终指向与_start间距n的位置
    14. }
    15. //挪动数据
    16. iterator end = _finish - 1;
    17. while (end >= pos)
    18. {
    19. *(end + 1) = *(end);
    20. end--;
    21. }
    22. //把值插进去
    23. *pos = x;
    24. _finish++;
    25. return pos;
    26. }

    6、删除的相关函数接口

    pop_back尾删

    首先判断_finish是否大于_start,若大于,直接_finsh--即可,否则啥也不需要操作。

    1. void pop_back()
    2. {
    3. if (_finish > _start)//判断是否可以进行删除
    4. {
    5. _finish--;
    6. }
    7. }

    pop_back也可以复用下文的erase实现,当erase的参数为_finish时,实现的就是尾删,而_finish可以通过调用迭代器end()函数来解决。

    1. void pop_back()
    2. {
    3. //法二:复用erase
    4. erase(end() - 1);
    5. //不能用end()--,因为end()是传值返回,返回的是临时对象,临时对象具有常性,不能自身++或--,因此要用end() - 1
    6. }

    erase

    首先要检查删除位置pos的合法性,其次从pos + 1的位置开始往前覆盖即可删除pos位置,最后记得返回的值为删除位置的下一个位置,其实返回的就是pos,因为在pos删除后,下一个值会覆盖到pos的位置上。

    1. //erase
    2. iterator erase(iterator pos)
    3. {
    4. //检查合法性
    5. assert(pos >= _start && pos < _finish);
    6. //从pos + 1的位置开始往前覆盖,即可完成删除pos位置的值
    7. iterator it = pos + 1;
    8. while (it < _finish)
    9. {
    10. *(it - 1) = *it;
    11. it++;
    12. }
    13. _finish--;
    14. return pos;
    15. }
    • 补充1:

    一般vector删除数据,都不考虑缩容的方案,当size() < capacity() / 2 时,可以考虑开一个size()大小的新空间,拷贝数据,释放旧空间。缩容的本质是时间换空间。一般设计不会考虑缩容,因为实际比较关注时间效率,不是太关注空间效率,因为现在硬件设备空间都比较大,空间存储也比较便宜。

    • 补充2:
    1. erase也会存在失效,erase的失效是意义变了,或者不存在有效访问数据有效范围。
    2. 一般不会使用缩容的方案,那么erase的失效,一般也不存在野指针的失效。

    后续专门推出一篇博文讲解迭代器失效。这里先给出结论:

    1. erase(pos)以后pos失效了,pos的意义变了,但是在不同平台下面对于访问pos的反应是不一样的,我们用的时候要以失效的角度去看待此问题。
    2. 对于insert和erase造成迭代器失效问题,linux的g++平台检查很佛系,基本靠操作系统本身野指针越界检擦机制。windows下VS系列检擦更严格一些,使用一些强制检擦机制,意义变了可能会检擦出来。
    3. 虽然g++对于迭代器失效检查时是非常佛系的,但是套在实际场景中,迭代器意义变了,也会出现各种问题。

    clear清空数据

    只需要把起始位置的指针_start赋给有效数据指针_finish即可完成数据的清空。

    1. //clear清空数据
    2. void clear()
    3. {
    4. _finish = _start;
    5. }

    7、源码链接

    源码链接直达:vector模拟实现完善版

  • 相关阅读:
    Spring的注解开发-@Import整合第三方框架原理
    嵌入式开发工具链概述
    SpringMVC实现接收前端的数据(从一个网页输入数据,然后将数据提交到另外一个网页,并进行输出)
    Edu Codeforce133 (D、F) DP、组合数学
    C++(36)-低版本升级到VS2019项目时遇到的问题
    共享购模式:数据驱动的消费增值新体验
    虹科示波器 | 汽车免拆检测 | 2017款路虎发现车行驶中发动机抖动且加速无力
    uboot启动学习笔记 二 启动前准备工作及启动介质选择
    嵌入式程序开发3
    北京化工大学2022-2023-1 ACM集训队每周程序设计竞赛(10)题解
  • 原文地址:https://blog.csdn.net/bit_zyx/article/details/125722525