• C++ vector


    目录

    1.vector的介绍及使用  

    1.1 vector的介绍

    1.2 vector的使用

    1.2.1 vector的定义

    1.2.2 vector iterator 的使用

    1.2.3 vector 空间增长问题

    1.2.3 vector 增删查改

    1.2.4 vector 迭代器失效问题。(重点)

    1.2.5 vector 在OJ中的使用

    2.vector深度剖析及模拟实现

    使用memcpy拷贝问题

    动态二维数组理解

    模拟实现vector:


    1.vector的介绍及使用  

    1.1 vector的介绍

    1. vector 是表示可变大小数组的序列容器。
    2. 就像数组一样, vector 也采用的连续存储空间来存储元素。也就是意味着可以采用下标对 vector 的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
    3. 本质讲, vector 使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector 并不会每次都重新分配大小。
    4. vector 分配空间策略: vector 会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
    5. 因此, vector 占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
    6. 与其它动态序列容器相比( deque, list and forward_list ), vector 在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list forward_list统一的迭代器和引用更好

    1.2 vector的使用

    1.2.1 vector的定义

     以上就是vector的构造函数,重点关注1和3

    1.2.2 vector iterator 的使用

    我们可以看到这里的iterator行为上就像指针一样,但又不一定是指针 ,而对于vector这里来说,这里的iterator就是一个原生指针,后面会讲到迭代器失效的问题。

    1.2.3 vector 空间增长问题

     这里的resize和reserve和之前的string的含义一样,这里就看看函数的使用方式即可:

    capacity 的代码在 vs g++ 下分别运行会发现, vs下capacity是按1.5倍增长的,g++是按2倍增长的。
    这个问题经常会考察,不要固化的认为, vector 增容都是 2 倍,具体增长多少是根据具体的需求定义的。 vs是PJ版本STL,g++是SGI版本STL 。( 也就是不同编译器的实现方式不同,所以可能会导致有不同的结果)
    reserve 只负责开辟空间,如果确定知道需要用多少空间, reserve 可以缓解 vector 增容的代价缺陷问题。
    resize 在开空间的同时还会进行初始化,影响 size

    这是vs下的扩容:

     reserve的优势就在于如果我们知道要开多少空间,我们就可以一次性开好,就可以避免频繁的扩容,因为我们知道频繁扩容是要付出代价的,所以C++在这方面做的很好。

    1.2.3 vector 增删查改

     为什么不推荐使用insert以及erase呢?因为我们知道数组删除数据是要挪动数据的,这样就导致花费更多时间,所以一般情况下不推荐使用

    上述内容很简单,查网站就会使用,不过多讲解,下面主要讲解迭代器失效的问题;
     

    1.2.4 vector 迭代器失效问题。(重点)

    迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。
    为什么会这样呢?
    下面我们看几个例子:
    1. 会引起其底层空间改变的操作,都有可能是迭代器失效 ,比如: resize reserve insert assign 、push_back等。
    拿扩容来说,reserve的底层实现是讲原来的空间释放掉,然后开辟新的空间,这样迭代器所在的位置就发生了改变,所以最后就导致了迭代器失效了。
    我们看看下面这段代码:
    1. #include <iostream>
    2. using namespace std;
    3. #include <vector>
    4. int main()
    5. {
    6. vector<int> v{ 1,2,3,4,5,6 };
    7. auto it = v.begin();
    8. v.assign(100, 3);
    9. //因为这里扩容过,所以迭代器肯定失效
    10. while (it != v.end())
    11. {
    12. cout << *it << " ";
    13. ++it;
    14. }
    15. cout << endl;
    16. return 0;
    17. }

    结果正如我们所料:

    解决这个办法就是更新一下迭代器即可正常使用。

    看看其他例子:

    2. 指定位置元素的删除操作--erase
    1. int main()
    2. {
    3. int a[] = { 1, 2, 3, 4 };
    4. vector<int> v(a, a + sizeof(a) / sizeof(int));
    5. // 使用find查找3所在位置的iterator
    6. vector<int>::iterator pos = find(v.begin(), v.end(), 3);
    7. // 删除pos位置的数据,导致pos迭代器失效。
    8. v.erase(pos);
    9. cout << *pos << endl; // 此处会导致非法访问
    10. return 0;
    11. }
    erase 删除 pos 位置元素后, pos 位置之后的元素会往前搬移, 没有导致底层空间的改变,理论上讲迭代器不应该会失效 ,但是: 如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是没有元素的,那么pos就失效了。因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效了。
    我们可以看到 vs实现的方式是比较严格的 ,如果不更新迭代器这就无法使用了。后面我们会模拟实现vector,后面我们模拟实现的就可以使用。
    如果要 删除vector中所有的偶数,我们应该怎么做呢?
    下面这样就是有问题的:
    1. int main()
    2. {
    3. vector<int> v{ 1, 2, 3, 4 };
    4. auto it = v.begin();
    5. while (it != v.end())
    6. {
    7. if (*it % 2 == 0)
    8. v.erase(it);
    9. ++it;
    10. }
    11. return 0;
    12. }

    不难发现这里肯定是有问题的,因为删除完4之后it又++就已经越界访问了。

    我们可以在不是偶数的时候再++,同时更新一下it,是偶数的就不用++

    1. int main()
    2. {
    3. vector<int> v{ 1, 2, 3, 4 };
    4. auto it = v.begin();
    5. while (it != v.end())
    6. {
    7. if (*it % 2 == 0)
    8. it = v.erase(it);
    9. else
    10. {
    11. ++it;
    12. }
    13. }
    14. for (auto& e : v)
    15. {
    16. cout << e << endl;
    17. }
    18. return 0;
    19. }

    但是在Linux底下g++编译器就没有检查的那么严格:

    看看扩容这段代码:

    1. // 1. 扩容之后,迭代器已经失效了,程序虽然可以运行,但是运行结果已经不对了
    2. int main()
    3. {
    4. vector<int> v{ 1,2,3,4,5 };
    5. for (size_t i = 0; i < v.size(); ++i)
    6. cout << v[i] << " ";
    7. cout << endl;
    8. auto it = v.begin();
    9. cout << "扩容之前,vector的容量为: " << v.capacity() << endl;
    10. // 通过reserve将底层空间设置为100,目的是为了让vector的迭代器失效
    11. v.reserve(100);
    12. cout << "扩容之后,vector的容量为: " << v.capacity() << endl;
    13. // 经过上述reserve之后,it迭代器肯定会失效,在vs下程序就直接崩溃了,但是linux下不会
    14. // 虽然可能运行,但是输出的结果是不对的
    15. while (it != v.end())
    16. {
    17. cout << *it << " ";
    18. ++it;
    19. }
    20. cout << endl;
    21. return 0;
    22. }

     

     可以看到Linux底下是没有报错的,因为空间还是原来的空间,后序元素往前搬移了,it的位置还是有效的,但是对于刚刚那个偶数那题Linux下也会报错:

     

    4. 与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效

    最后说说如何解决这类问题:

    迭代器失效解决办法:在使用前,对迭代器重新赋值即可

    1.2.5 vector 在OJ中的使用

    因为数组在实际的应用非常广泛,所以C++的vector的运用也是非常多,而且嵌套vector远远比C语言中的二维数组好用,下面我们就来看看vector在oj中的应用:

    1. 力扣
    这题杨辉三角实现起来其实并不是很难,但是如果使用C语言来做就很难受了,因为开辟空间那里就会让你非常头疼,但是对于C++来说这又不是一件难事了。这里就体现了嵌套vector的优点了。
    思路:
    先开辟好一个vector>,这样相当于C语言中的二维数组了。然后调整好空间,在第一行以及对角线的那一行初始化为1,其他的初始化为0,然后我们就可以遍历这个嵌套vector,判断是否0的元素,是就让其加上上一行的前一个以及上一行的那个。
    实现方式:
    1. class Solution {
    2. public:
    3. vector<vector<int>> generate(int numRows) {
    4. //先开辟空间
    5. vector<vector<int>> vv;
    6. vv.resize(numRows);
    7. for(size_t i= 0 ;i<vv.size();++i)
    8. {
    9. vv[i].resize(i+1,0);
    10. vv[i][0] = vv[i][vv[i].size()-1] = 1;
    11. }
    12. //把剩下为0的位置处理以下
    13. for(size_t i= 0;i<vv.size();++i)
    14. {
    15. for(size_t j = 0;j<vv[i].size();++j)
    16. {
    17. if(vv[i][j] == 0)
    18. {
    19. vv[i][j] = vv[i-1][j-1] + vv[i-1][j];
    20. }
    21. }
    22. }
    23. return vv;
    24. }
    25. };

    2.力扣

    这道题如果使用哈希表的话就超出了这个空间复杂度了,用暴力查找的方式又不符合题意,这里有一个思路非常巧妙:

    我们可以利用位运算来解决,因为这个除了这个数字其他的数字都出现过3次,我们可以把数组中的每一个数字的二进制位加起来,然后让结果%3就可以得到我们所想要的二进制位了,(不论是0还是1,%3的结果都是我们想要的那个数的二进制位),最后我们用ret每次接受一下要的到二进制位,就可以得到答案。

    代码实现:

    1. class Solution {
    2. public:
    3. int singleNumber(vector<int>& nums) {
    4. //我们可以把所有的二进制位全部加起来,然后%3就可以得到所求的数字的二进制位了
    5. int ret = 0;//我们要求的数字
    6. for(int i = 0;i<32;++i)
    7. {
    8. int sum = 0;
    9. for(auto e:nums)
    10. {
    11. sum += ((e>>i) & 1);
    12. }
    13. //把要求的数字的二进制位找出来
    14. if(sum%3)
    15. {
    16. ret |= (1<<i);
    17. }
    18. }
    19. return ret;
    20. }
    21. };

    3.数组中出现次数超过一半的数字_牛客题霸_牛客网

    思路:因为所出现的元素的个数超过了一般半,我们就可以通过计数的方式记录它,如果是这个元素就++,不是就--,最后得到的那个数一定是我们想要的数,另外,我们还可以拓展一下:如果这个数不一定存在那要怎么处理?

    我们可以对这个记录一下这个数,然后再遍历一次数组,通过计数的方式去确认是否存在。

    代码实现:

    1. class Solution {
    2. public:
    3. int MoreThanHalfNum_Solution(vector<int> numbers) {
    4. //因为所出现的元素的个数超过了一般半,我们就可以通过计数的方式记录它,如果是这个元素就++,不是就--
    5. //这样的话就可以在最后的时候找到这个元素
    6. int tmp = numbers[0];//记录我们要求的数据
    7. int times = 1;
    8. for(int i = 1;i<numbers.size();++i)
    9. {
    10. //如果次数减到0就把tmp换成下一个元素
    11. if(times == 0)
    12. {
    13. tmp = numbers[i];
    14. times = 1;
    15. }
    16. if(numbers[i] == tmp)
    17. {
    18. ++times;
    19. }
    20. else{
    21. --times;
    22. }
    23. }
    24. //到这里就已经找到了就是tmp
    25. return tmp;
    26. }
    27. };

    4.力扣

    这一题的难度比较大,运用到了回溯算法

    思路:

    我们可以通过一个数组来记录数字与字母之间的映射关系,然后利用回溯算法(递归)就解决像这种组合问题,下面通过这题来大概讲解一下回溯:

     这个很像二叉树的遍历,但又复杂一点,这个可以看成多叉树的遍历方式。我们可以通过每一层的递归来达到一个组合的效果。

    代码实现:

    1. class Solution {
    2. //映射数组
    3. string numstr[10] = {"","","abc","def","ghi","jkl","mno","pqrs","tuv","wxyz"};
    4. public:
    5. //递归子函数
    6. void combine(string& digits,int i,vector<string>& vcombine,string retstr)
    7. {
    8. if(i == digits.size())
    9. {
    10. vcombine.push_back(retstr);
    11. return;
    12. }
    13. //找到对应的字母
    14. int num = digits[i]- '0';
    15. string str = numstr[num];
    16. //遍历串中的所有字符,然后进入下一层
    17. for(auto ch:str)
    18. {
    19. combine(digits,i+1,vcombine,retstr+ch);
    20. }
    21. }
    22. vector<string> letterCombinations(string digits) {
    23. vector<string> vcombine;
    24. if(digits.empty())
    25. {
    26. return vcombine;
    27. }
    28. int i = 0;
    29. string retstr;//用来每次加,然后最后加到vcombine中
    30. //递归
    31. combine(digits,i,vcombine,retstr);
    32. return vcombine;
    33. }
    34. };

    下面通过画递归展开图再来看看其中的细节:

    2.vector深度剖析及模拟实现

    使用memcpy拷贝问题

    1. memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
    2. 如果拷贝的是自定义类型的元素, memcpy 既高效又不会出错,但 如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

    这个和之前讲拷贝构造的时候很像,都是浅拷贝导致的问题。 可能会引起内存泄漏甚至程序崩溃。

    动态二维数组理解

    在前面就已经看过了二维数组的题了,这里不过多介绍,还是介绍一下memcpy也会使内存崩溃的结果:

     要解决这个问题,我们还是要进行深拷贝,这是下面的reserve的模拟实现代码来解决这个问题:

     我们可以通过这个一个对象赋值的方式来进行深拷贝

    模拟实现vector:

    1. template<class T>
    2. class vector
    3. {
    4. public:
    5. // Vector的迭代器是一个原生指针
    6. typedef T* iterator;
    7. typedef const T* const_iterator;
    8. iterator begin()
    9. {
    10. return _start;
    11. }
    12. iterator end()
    13. {
    14. return _end;
    15. }
    16. const_iterator cbegin()
    17. {
    18. return _start;
    19. }
    20. const_iterator cend() const
    21. {
    22. return _end;
    23. }
    24. // construct and destroy
    25. vector()
    26. :_start(nullptr)
    27. ,_end(nullptr)
    28. ,_endOfStorage(nullptr)
    29. {}
    30. vector(int n, const T& value = T())
    31. :_start(nullptr)
    32. , _end(nullptr)
    33. , _endOfStorage(nullptr)
    34. {
    35. reserve(n);
    36. for (int i = 0; i < n; ++i)
    37. {
    38. push_back(value);
    39. }
    40. }
    41. template<class InputIterator>
    42. vector(InputIterator first, InputIterator last)
    43. :_start(nullptr)
    44. , _end(nullptr)
    45. , _endOfStorage(nullptr)
    46. {
    47. while (first != last)
    48. {
    49. push_back(*first);
    50. ++first;
    51. }
    52. }
    53. vector(const vector<T>& v)
    54. :_start(nullptr)
    55. , _end(nullptr)
    56. , _endOfStorage(nullptr)
    57. {
    58. //找个工具人
    59. vector<T> tmp(v._start, v._end);
    60. swap(tmp);
    61. }
    62. vector<T>& operator= (vector<T> v)
    63. {
    64. swap(v);
    65. return *this;
    66. }
    67. ~vector()
    68. {
    69. delete[] _start;
    70. _start = _end = _endOfStorage = nullptr;
    71. }
    72. // capacity
    73. size_t size() const
    74. {
    75. return _end - _start;
    76. }
    77. size_t capacity() const
    78. {
    79. return _endOfStorage - _start;
    80. }
    81. void reserve(size_t n)
    82. {
    83. //坚持不缩容
    84. if (n > capacity())
    85. {
    86. //开辟新的空间,然后赋值过去
    87. T* tmp = new T[n];
    88. size_t oldsize = size();
    89. if (_start)
    90. {
    91. for (size_t i = 0; i < oldsize; ++i)
    92. {
    93. tmp[i] = _start[i];
    94. }
    95. delete[]_start;
    96. }
    97. _start = tmp;
    98. _end = _start + oldsize;
    99. _endOfStorage = _start + n;
    100. }
    101. }
    102. void resize(size_t n, const T& value = T())
    103. {
    104. //要扩容
    105. if (n > capacity())
    106. {
    107. int newcapacity = capacity() == 0 ? 4 : 2 * capacity();
    108. reserve(newcapacity);
    109. }
    110. if (n > size())
    111. {
    112. while (_end != _start + n)
    113. {
    114. push_back(value);
    115. }
    116. }
    117. else
    118. {
    119. _end = _start + n;
    120. }
    121. }
    122. ///access///
    123. T& operator[](size_t pos)
    124. {
    125. assert(pos < size());
    126. return _start[pos];
    127. }
    128. const T& operator[](size_t pos)const
    129. {
    130. assert(pos < size());
    131. return _start[pos];
    132. }
    133. ///modify/
    134. void push_back(const T& x)
    135. {
    136. if (size() == capacity())
    137. {
    138. int newcapacity = capacity() == 0 ? 4 : 2 * capacity();
    139. reserve(newcapacity);
    140. }
    141. *_end = x;
    142. ++_end;
    143. }
    144. void pop_back()
    145. {
    146. assert(_end > _start);
    147. --_end;
    148. }
    149. void swap(vector<T>& v)
    150. {
    151. std::swap(_start, v._start);
    152. std::swap(_end, v._end);
    153. std::swap(_endOfStorage, v._endOfStorage);
    154. }
    155. iterator insert(iterator pos, const T& x)
    156. {
    157. assert(_start <= pos);
    158. assert(_end > pos);
    159. //判断增容
    160. int distance = pos - _start;
    161. if (_end == _endOfStorage)
    162. {
    163. int newcapacity = capacity() == 0 ? 4 : 2 * capacity();
    164. reserve(newcapacity);
    165. //这里的扩容不处理会导致迭代器失效
    166. pos = _start + distance;
    167. }
    168. //挪动数据,插入
    169. auto end = _end -1;
    170. while (end >= pos)
    171. {
    172. *(end+1) = *end;
    173. --end;
    174. }
    175. *pos = x;
    176. ++_end;
    177. return pos;
    178. }
    179. iterator erase(iterator pos)
    180. {
    181. assert(pos >= _start);
    182. assert(pos < _end);
    183. //挪动数据
    184. iterator ret = pos + 1;
    185. while (ret < _end)
    186. {
    187. *(ret - 1) = *ret;
    188. ++ret;
    189. }
    190. --_end;
    191. return pos;
    192. }
    193. private:
    194. iterator _start; // 指向数据块的开始
    195. iterator _end; // 指向有效数据的尾
    196. iterator _endOfStorage; // 指向存储容量的尾
    197. };

    其中实现过程中最容易错误的就是insert以及erase扩容问题,这是最容易出错的。

    扩容是防止浅拷贝,所有把利用赋值来实现深拷贝。insert以及erase要注意更新迭代器,防止迭代器失效。

  • 相关阅读:
    Centos安装RabbitMQ超详细(必须收藏)
    为什么MySQL的浮点数类型不够精准?(实例证明)
    基于LADRC自抗扰控制的VSG三相逆变器预同步并网控制策略(Simulink仿真实现)
    【OpenGL ES】渲染管线
    Linux:IP转INT详解
    离散数学 --- 谓词逻辑 --- 谓词合式公式详解
    python系列笔记——可变数据类型和不可变数据类型常考知识点
    Java学习笔记6.2.2 字符流 - 字节字符转换流
    【C语言】学生宿舍信息管理系统
    NCBI/BIG测序数据下载---Aspera下载安装使用
  • 原文地址:https://blog.csdn.net/weixin_72068014/article/details/127887887