目录
- STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。
- STL是C++标准库的一部分。
◆ 原始版本
Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使用。 HP 版本--所有STL实现版本的始祖。◆ P. J. 版本
由P. J. Plauger开发,继承自HP版本,被Windows Visual C++采用,不能公开或修改,缺陷:可读性比较低,符号命名比较怪异。◆ RW版本
由Rouge Wage公司开发,继承自HP版本,被C++ Builder采用,不能公开或修改,可读性一般。◆ SGI版本
由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版本。被GCC(Linux)采用,可移植性好,可公开、修改甚至贩卖,从命名风格和编程风格上看,阅读性非常高。我们后面学习STL要阅读部分源代码,主要参考的就是这个版本。

- STL库的更新太慢了。这个得严重吐槽,上一版靠谱是C++98,中间的C++03基本一些修订。C++11出来已经相隔了13年,STL才进一步更新。
- STL现在都没有支持线程安全。并发环境下需要我们自己加锁。且锁的粒度是比较大的。
- STL极度的追求效率,导致内部比较复杂。比如类型萃取,迭代器萃取。
- STL的使用会有代码膨胀的问题,比如使用vector/vector/vector这样会生成多份代码,当然这是模板语法本身导致的。
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
string类的文档介绍:
1. 字符串是表示字符序列的类。
2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作,单字节字符字符串的设计特性。
3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
1. string是表示字符串的字符串类。
2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
3. string在底层实际是:basic_string模板类的别名,typedef basic_string
string; 4. 不能操作多字节或者变长字符的序列。
在使用string类时,必须包含#include头文件以及using namespace std;
| (constructor)函数名称 | 功能说明 |
| string() | 构造空的string类对象,即空字符串 |
| string(const char* s) | 用字符串来构造string类对象 |
| string(const string &s) | 拷贝构造函数 |
| string (const string& s, size_t pos, size_t len = npos); | 从第pos个位置拷贝npos个 |
| string(size_t n, char c) | string类对象中包含n个字符c |
- void Teststring()
- {
- string s1; //构造空的string类对象s1
- string s2("hello word"); //用字符串构造string类对象s2
- string s3(s2); //拷贝构造s3
- string s4(s2,5,3); //拷贝构造s2,从第5个位置开始(从0开始)取3个字符
- string s5(s2,5,10); //拷贝构造s2,从第5个位置开始,取10个字符,不够,有多少取多少
- string s6(s2,5); //拷贝构造s2,从第5个位置开始,取余下的
-
- cout << s1 << endl;
- cout << s2 << endl;
- cout << s3 << endl;
- cout << s4 << endl;
- cout << s5 << endl;
- cout << s6 << endl;
- }
-
- int main()
- {
- Teststring();
-
- return 0;
- }

| 函数名称 | 功能说明 |
| size (重点) | 返回字符串有效字符长度 |
| length | 返回字符串有效字符长度 |
| capacity | 返回空间总大小 |
| empty (重点) | 检测字符串释放为空串,是返回true,否则返回false |
| clear (重点) | 清空有效字符 |
| reserve (重点) | 为字符串预留空间 |
| resize (重点) | 将有效字符的个数该成n个,多出的空间用字符c填充 |
- void Teststring2()
- {
- string s1("hello word");
-
- for(size_t i=0;i<s1.size();i++)
- {
- cout << s1[i] << " "; //这里的[]实际是调用的运算符重载
- cout << s1.operator[](i) << " "; //[]运算符重载
- }
- cout << endl;
- cout << s1.size() << endl;
- cout << s1.capacity() << endl;
- }
-
- int main()
- {
- Teststring2();
-
- return 0;
- }
查看扩容机制:
- void Teststring5()
- {
- //查看扩容机制
- string s;
- size_t sz = s.capacity();
- for(int i=0;i<100;i++)
- {
- s.push_back('c');
- if(sz != s.capacity())
- {
- sz = s.capacity();
- cout << "capacity changed: " << sz << endl;
- }
- }
- }

注意:
- size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一 致,一般情况下基本都是用size()。
- clear()只是将string中有效字符清空,不改变底层空间大小。
- resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
- reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于 string的底层空间总大小时, reserver不会改变容量大小。
| 函数名称 | 功能说明 |
| operator[ ] | 返回pos位置的字符, const string类对象调用 |
| begin+ end | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 |
| rbegin + rend | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 |
| 范围for | C++11支持更简洁的范围for的新遍历方式 |
用迭代器遍历
- void Teststring3()
- {
- string s1("hello word");
- const string s2("hello word");
-
- string::iterator it1 = s1.begin(); //begin为开始位置
- while(it1 != s1.end()) //end为最后的下一个位置
- {
- cout << *it1 << " ";
- ++it1;
- }
-
- string::const_iterator it2 = s2.begin(); //const迭代器,只读,不可以修改
- while(it1 != s2.end())
- {
- cout << *it2 << " ";
- ++it2;
- }
-
- }
-
- void Teststring4()
- {
- string s1("hello word");
-
- string::reverse_iterator rit = s1.rbegin(); //反向迭代器
- while(rit != s1.rend())
- {
- cout << *rit << " ";
- ++rit;
- }
- }
| 函数名称 | 功能说明 |
| push_back | 在字符串后尾插字符 |
| append | 在字符串后追加一个字符串 |
| operator+= (重点) | 在字符串后追加字符串 |
| c_str(重点) | 返回C格式字符串 |
| find + npos(重点) | 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置 |
| rfind | 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置 |
| substr | 在str中从pos位置开始,截取n个字符,然后将其返回 |
- void Teststring4()
- {
- string s1("hello word");
- s1.push_back('!');
- cout << s1 << endl;
-
- s1.append("hello bit");
- cout << s1 << endl;
-
- s1.append(10,'x');
- cout << s1 << endl;
-
- }

find 和 substr的用法举例:
- void Teststring6()
- {
- string s1("test.c");
- size_t pos1 = s1.find('.');
- if(pos1 != s1.npos)
- {
- string suffix = s1.substr(pos1);
- cout << suffix << endl;
- }
- else
- {
- cout << "找不见" << endl;
- }
- }

注意:
- 在string尾部追加字符时, s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般 情况下string类的+=操作用的比较多, +=操作不仅可以连接单个字符,还可以连接字符串。
- 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。
| 函数 | 功能说明 |
| operator+ | 尽量少用,因为传值返回,导致深拷贝效率低 |
| operator>> (重点) | 输入运算符重载 |
| operator (重点) | 输出运算符重载 |
| getline (重点) | 获取一行字符串 |
| relational operators (重点) | 大小比较 |
注意:下述结构是在32位平台下进行验证, 32位平台下指针占4个字节。
vs下string的结构:
string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:
◆ 当字符串长度小于16时,使用内部固定的字符数组来存放。
◆ 当字符串长度大于等于16时,从堆上开辟空间。
- union _Bxty
- { // storage for small buffer or pointer to larger one
- value_type _Buf[_BUF_SIZE];
- pointer _Ptr;
- char _Alias[_BUF_SIZE]; // to permit aliasing
- } _Bx;
◆ 这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高。
◆ 其次:还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间总的容量
◆ 最后:还有一个指针做一些其他事情。
◆ 故总共占16+4+4+4=28个字节。
g++下string的结构
G++下, string是通过写时拷贝实现的, string对象总共占4个字节,内部只包含了一个指针,该指 针将来指向一块堆空间,内部包含了如下字段:
◆ 空间总大小
◆ 字符串有效长度
◆ 引用计数
◆ 指向堆空间的指针,用来存储字符串。
- struct _Rep_base
- {
- size_type _M_length;
- size_type _M_capacity;
- _Atomic_word _M_refcount;
- };
本章完。