STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。
Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使用。
HP 版本——所有STL实现版本的始祖。
由P. J. Plauger开发,继承自HP版本,被Windows Visual C++采用,不能公开或修改,缺陷:可读性比较低,符号命名比较怪异。
由Rouge Wage公司开发,继承自HP版本,被C+ + Builder 采用,不能公开或修改,可读性一般。
由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版本。被GCC(Linux)采用,可移植性好, 可公开、修改甚至贩卖,从命名风格和编程风格上看,阅读性非常高。我们后面学习STL要阅读部分源代码, 主要参考的就是这个版本。
- STL库的更新太慢了。这个得严重吐槽,上一版靠谱是C++98,中间的C++03基本一些修订。C++11出来已经相隔了13年,STL才进一步更新。
- STL现在都没有支持线程安全。并发环境下需要我们自己加锁。且锁的粒度是比较大的。
- STL极度的追求效率,导致内部比较复杂。比如类型萃取,迭代器萃取。
- STL的使用会有代码膨胀的问题,比如使用vector/vector/vector这样会生成多份代码,当然这是模板语法本身导致的。
C语言中,字符串是以’\0’结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数, 但是这些库函数与字符串是分离开的,不太符合OOP思想(面向对象思想),而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
string类其实是一个类模版实例化出来的模版类
string类的文档介绍
我们可以看到,它其实是basic_string
这个类模板实例化出来的类的一个typedef。
这里,
basic_string
实例化出来的模板类除了string还有三个。
它们都是basic_string这个类模板实例化出来的模板类,区别在于它们对应的模板参数的类型不同。
对于string类:其实它的底层就是一个动态的字符数组,
string就是一个char
类型的字符数组
wstring就是对应的wchar_t
的字符数组
u16string就是char16_t
的字符数组
u32string就是char32_t
的字符数组
这些不同类型的字符对应的大小也是不同的。
那么为什么要搞出这么多字符呢?
这里实际上是因为ASCll码
这里面的所有符号和字母都一个对应的ASCII码值。
实际上内存里存的并不是字母本身,而是它们对应的ASCII码值(这里以16进制显示)。
但是ASCII主要是来显示英语这些语言的,并且世界上还有很多国家,很多种语言比如现在我们要让计算机能显示中文,用ASCII码就不行了啊、。
那基于这样的原因呢,有人就又发明了Unicode——万国码(兼容ASCII):
Unicode又进行了划分,分为UTF-8
、UTF-16
、UTF-32
这些。
所以呢,为了应对这些不同的编码,就产生了这些不同的字符类型,所以就有了
basic_string
这个泛型字符串类模板,我们可以用它实例化出不同类型的字符串类。
总结:
- string是表示字符串的字符串类
- 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
- string在底层实际是:
basic_string
模板类的别名,typedef basic_string
string; - 不能操作多字节或者变长字符的序列。
- 在使用string类时,必须包含#include头文件以及using namespace std;
(constructor)函数名称 | 功能说明 |
---|---|
string() (空字符串构造函数 默认构造函数 重点) | 构造一个空字符串,长度为零个字符 |
string(const char* s) (重点) | 用一个常量字符串来构造字符串类对象 |
string (const string& str, size_t pos, size_t len = npos) (不经常使用) | 复制 str 中从字符位置 pos 开始并跨越 len 字符的部分(如果 str 太短或 len 是string::npos,则直到 str 的末尾) |
string (const char* s, size_t n) | 拿s指向字符串的前n个字符去构造string对象 |
string (size_t n, char c) | 拿n个字符c去构造string对象 |
string (const string& str)(重点) | 拷贝构造 |
template string (InputIterator first, InputIterator last) | 迭代器之后讲解 |
下面我们开始逐个讲解:
string (const string& str, size_t pos, size_t len = npos)
这里是拿str中的一个子串去构造string对象,这个字串是从str中下标pos位置开始,长度为len的一个字串。
如果这里的str
比较短,或者这里给的len
是string::npos
,则这个字串一直到str
的末尾。
举个简单的例子:
这里的len是30,那这里字符串的长度是不够的,比30短,但这里却不会报错,这里会取到字符串的结尾位置。
这里如果给的len
是string::npos
,也会一直到str末尾,并且这里len
会给缺省值,这个缺省值就是npos
。
这里的npos
是什么呢?
它是一个静态成员变量,值是-1,但是这里它的类型是size_t
(无符号整型),所以它在这里其实是整型的最大值。
string (const char* s, size_t n)
用s指向字符串的前n个字符去构造string对象:
其他的老铁可以暂时结合文档看一下,重要的之后会给大家进行讲解。
resize
和reserve
有了以上的知识我们回头再看 一下容量中的resize
和reserve
。
在此之前我们观察一下,对于一个string对象,在不断插入数据的过程中它是如何进行扩容的。
int main()
{
string s;
size_t sz = s.capacity();
cout << "capacity changed: " << sz << '\n';
for (int i = 0; i < 100; ++i)
{
s.push_back('c');
if (sz != s.capacity())
{
sz = s.capacity();
cout << "capacity changed: " << sz << '\n';
}
}
return 0;
}
在这里简单了解过扩容机制之后,我们来看一下
reserve
。reserve
可以帮助我们更改容量大小,这样如果我们知道需要多大的空间,就可以一次开到位,就不用再一次一次的扩容了。
我们现在指定reserve100个容量,它不一定开的就是100,可能由于对齐啊等等的一些原因,它会给你多开一些空间,但是肯定不会比100小。
如果我们知道需要多少空间,reserve就可以帮助我们提前开辟好空间,然后就可以减少扩容,提升效率。
那resize
又有什么作用呢?
resize
不仅可以开空间,而且还能对开好的空间进行初始化。
这里我们没有指定第二个参数,既要填入的字符,默认给的是\0
,当然我们也可以自己指定要填入的字符:
>
如果我们传的n小于当前字符串长度,它还可以帮我们删除多出来的内容:
注意这里只会改变size
,capacity
并没有改变。
一般情况下是不会轻易缩容的,缩容的话一般是不支持原地缩的,由于底层内存管理的一些原因,是没法原地缩的。
如果支持原地缩,是不是就要支持释放一部分,我们申请一块空间,不用了只释放其中的一部分。
但是是不支持只释放一部分的,就像我们free是不是要求传的指针必须是指向其实位置的。
所以如果真的要缩容的话,只能异地缩,就是开一块新的小空间,把需要的数据拷贝过去,然后把原空间释放掉。所以缩容是要付出性能的代价的,系统原生是不支持的,我们需要自己去搞。所以不到万不得已不要轻易缩容。
现在我们想遍历一个string对象,首先可以循环用
[ ]
遍历,因为string是重载了[ ]
的,或者我也可以用范围for。除了这些方法外我们还可以用迭代器。
我们举个简单的例子:
int main()
{
string s1("hello world");
string::iterator it = s1.begin();
while (it != s1.end())
{
cout << *it << " ";
it++;
}
return 0;
}
这里的it就是我们定义的一个string类的迭代器(string::iterator
是类型),现阶段呢,大家可以认为迭代器是一个像指针一样的东西(不一定是指针)。
这里的begin,会返回指向字符串第一个字符的迭代器。
这里的end会返回指向最后一个字符后面位置的迭代器。
我们可以理解成这样两个位置的指针:
迭代器除了像上面那样支持正向从前向后遍历,也支持反向遍历,反向遍历的叫做反向迭代器。
这里的rbegin()返回指向字符串最后一个字符的反向迭代器。
这里的rend()返回一个反向迭代器,迭代器指向字符串第一个字符的前一个。
下面我们再来看之前的例子:
int main()
{
string s1("hello world");
string::reverse_iterator it = s1.rbegin();
while (it != s1.rend())
{
cout << *it << " ";
it++;
}
return 0;
}
对于const对象不能被修改,那么普通迭代器可以认为它是一个像指针一样的东西,那我们对它解引用就不可以修改它,所以这里我们就不能用普通迭代器,会造成权限放大。
我们看到begin()
,如果是const对象调用begin,那么返回的是const迭代器const_iterator,普通迭代器可以读改数据,但是const迭代器就只能读,不能修改。
const反向迭代器就是const对象调用
rbegin()
和rend()
返回的迭代器const_reverse_iterator
operator[]
也是有普通版本和const版本的,普通对象调[]就返回char&
const对象就返回const char&
,不能修改。
at
作用跟[]
是一样的。但是呢,它们两个还是有区别的,区别在于:
用[]
如果越界访问的话是直接报错的,它内部是断言去判断的。at
是抛异常
back
和front
作用是返回最后一个和第一个字符,但是这个我们用[]
就能搞定,所以大家简单了解一下就行了。
insert
和erase
使用
insert
我们可以向string对象中插入字符和字符串:
这里insert提供了好几个版本,我们只需要掌握几个常用的就好。
现在我们想在world前面插入一个字符串hello,我们就可以考虑用这个:
第一个参数是插入的位置,第二个是插入的字符串。
现在我们想在第五个位置插入1个空格可以用这个:
注意: 对于string来说,我们不推荐频繁使用insert。因为string底层是字符数组,那我们学过数据结构知道在顺序表里插入元素需要要挪动数据,效率是比较低的。
举个简单的例子:
我们举个例子:
我们再来看substr:
substr
可以帮助我们获取string对象中指定的一个子串。
举个例子:
这里我们获取了第六个位置开始长度为五的子串。
我们再来看一下
c_str
:
它的作用是返回一个指向当前string对象对应的字符数组的指针,类型为const char*。
我们举个例子:
int main()
{
string s;
cin >> s;
cout << s << endl;
return 0;
}
现在我想输入hello world 能正常输出吗?
这里的cin,我们在用它们输入的时候是有可能输入多个值的,那当我们输入多个值的时候,它们默认是以空格或者换行来区分我们输入的多个值的。
所以我们这里输入的hello world
,会被认为是两个值以空格分隔开,所以cin值读到了空格前面的hello,后面的world就被留在缓冲区了。
我们可以用
getline
解决这种问题:
getline它读取到空格才结束,当然它还支持我们自己指定结束符。第一个参数就是接收cin,第二个参数接收我们要输入的string对象。
这里关于string的常用接口就讲的差不多了,这里string的接口很多,如果后面有遇到不清楚的这里建议大家去阅读官方文档 string