本章我们来了解一下string类。
目录
总结:1. string是表示字符串的字符串类2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作 string 的常规操作。3. string 在底层实际是: basic_string 模板类的别名,typedef basic_stringstring; 4. 不能操作多字节或者变长字符的序列。在 使用 string 类时,必须包含 #include 头文件以及 using namespace std ;
注意:下面只是一些最常用的接口
(constructor)函数名称 | 功能说明 |
string() | 构造空的string类对象,即空字符串 |
string(const char* s) | 用C-string来构造string类对象 |
string(size_t n, char c) | string类对象中包含n个字符c |
string(const string&s) | 拷贝构造函数 |
- void Teststring()
- {
-
- string s1; // 构造空的string类对象s1
-
- string s2("hello bit"); // 用C格式字符串构造string类对象s2
-
- string s3(s2); // 拷贝构造s3
-
- }
- // 注意:string类对象支持直接用cin和cout进行输入和输出
- string s("hello, bit!!!");
- cout << s.size() << endl;
- cout << s.length() << endl;
- cout << s.capacity() << endl;
- cout << s << endl;
-
- // 将s中的字符串清空,注意清空时只是将size清0,不改变底层空间的大小
- s.clear();
-
-
- // 将s中有效字符个数增加到10个,多出位置用'a'进行填充
- // “aaaaaaaaaa”
- s.resize(10, 'a');
-
-
- // 将s中有效字符个数增加到15个,多出位置用缺省值'\0'进行填充
- // "aaaaaaaaaa\0\0\0\0\0"
- // 注意此时s中有效字符个数已经增加到15个
- s.resize(15);
-
-
- // 将s中有效字符个数缩小到5个
- s.resize(5);
注意:
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致, 一般情况下基本都是用size()。
2. clear()只是将string中有效字符清空,不改变底层空间大小
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字 符个数增多时: resize(n)用0来填充多出的元素空间, resize(size_t n, char c)用字符c来填充多出的元素空间。
注意: resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
4. reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于 string的底层空间总大小时, reserver不会改变容量大小。
函数名称 | 功能说明 |
返回pos位置的字符, const string类对象调用 | |
begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 | |
begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 | |
范围for | C++11支持更简洁的范围for的新遍历方式 |
- string s("hello Bit");
- // 3种遍历方式:
- // 需要注意的以下三种方式除了遍历string对象,还可以遍历是修改string中的字符,
- // 另外以下三种方式对于string而言,第一种使用最多
- // 1. for+operator[]
- for (size_t i = 0; i < s.size(); ++i)
- cout << s[i] << endl;
-
- // 2.迭代器
- string::iterator it = s.begin();
- while (it != s.end())
- {
- cout << *it << endl;
- ++it;
- }
-
- // string::reverse_iterator rit = s.rbegin();
- // C++11之后,直接使用auto定义迭代器,让编译器推到迭代器的类型
- auto rit = s.rbegin();
- while (rit != s.rend())
- cout << *rit << endl;
-
- // 3.范围for
- for (auto ch : s)
- cout << ch << endl;
函数名称 | 功能说明 |
在字符串后尾插字符c | |
在字符串后追加一个字符串 | |
在字符串后追加字符串str | |
返回C格式字符串 | |
从字符串pos位置开始往后找字符c ,返回该字符在字符串中的位置 | |
从字符串pos位置开始往前找字符c ,返回该字符在字符串中的位置 | |
在str中从pos位置开始,截取n个字符,然后将其返回 |
- // 测试string:
- // 1. 插入(拼接)方式:push_back append operator+=
- // 2. 正向和反向查找:find() + rfind()
- // 3. 截取子串:substr()
- // 4. 删除:erase
- void Teststring5()
- {
- string str;
- str.push_back(' '); // 在str后插入空格
- str.append("hello"); // 在str后追加一个字符"hello"
- str += 'b'; // 在str后追加一个字符'b'
- str += "it"; // 在str后追加一个字符串"it"
- cout << str << endl;
- cout << str.c_str() << endl; // 以C语言的方式打印字符串
-
- // 获取file的后缀
- string file("string.cpp");
- size_t pos = file.rfind('.');
- string suffix(file.substr(pos, file.size() - pos));
- cout << suffix << endl;
-
- // npos是string里面的一个静态成员变量
- // static const size_t npos = -1;
-
- // 取出url中的域名
- string url("http://www.cplusplus.com/reference/string/string/find/");
- cout << url << endl;
- size_t start = url.find("://");
- if (start == string::npos)
- {
- cout << "invalid url" << endl;
- return;
- }
- start += 3;
- size_t finish = url.find('/', start);
- string address = url.substr(start, finish - start);
- cout << address << endl;
-
- // 删除url的协议前缀
- pos = url.find("://");
- url.erase(0, pos + 3);
- cout << url << endl;
- }
注意:
1. 在string尾部追加字符时, s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多, 一般 情况下string类的+=操作用的比较多, +=操作不仅可以连接单个字符,还可以连接字符串。
2. 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。
函数 | 功能说明 |
尽量少用,因为传值返回,导致深拷贝效率低 | |
输入运算符重载 | |
输出运算符重载 | |
获取一行字符串 | |
大小比较 |
- // string comparisons
- #include
- #include
-
- int main ()
- {
- std::string foo = "alpha";
- std::string bar = "beta";
-
- if (foo==bar) std::cout << "foo and bar are equal\n";
- if (foo!=bar) std::cout << "foo and bar are not equal\n";
- if (foo< bar) std::cout << "foo is less than bar\n";
- if (foo> bar) std::cout << "foo is greater than bar\n";
- if (foo<=bar) std::cout << "foo is less than or equal to bar\n";
- if (foo>=bar) std::cout << "foo is greater than or equal to bar\n";
-
- return 0;
- }
更多的这里就不在介绍了。
注意:下述结构是在32位平台下进行验证, 32位平台下指针占4个字节。
string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字 符串的存储空间:
1. 当字符串长度小于16时,使用内部固定的字符数组来存放
2. 当字符串长度大于等于16时,从堆上开辟空间
- union _Bxty
- {
- // storage for small buffer or pointer to larger one
- value_type _Buf[_BUF_SIZE];
- pointer _Ptr;
- char _Alias[_BUF_SIZE]; // to permit aliasing
- } _Bx;
这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高。
其次:还有一个size_t字段保存字符串长度, 一个size_t字段保存从堆上开辟空间总的容量
最后:还有一个指针做一些其他事情。
故总共占16+4+4+4=28个字节。
G++下, string是通过写时拷贝实现的, string对象总共占4个字节,内部只包含了一个指针,该指 针将来指向一块堆空间,内部包含了如下字段:
1. 空间总大小
2. 字符串有效长度
3. 引用计数
- struct _Rep_base
- {
- size_type _M_length;
- size_type _M_capacity;
- _Atomic_word _M_refcount;
- };
4. 指向堆空间的指针,用来存储字符串。
本章完!