目录
一.什么是STL
1.什么是STL
2.STL的版本
3.STL的六大组件
4.STL的缺陷
二.什么是string
1.为什么学string?
2.文档中对string的介绍
3.总结
三.string类的成员函数
1.string类对象的常见构造
2.string类对象的容量操作
3.string类对象的访问及遍历操作
4.string类对象的修改操作
5.string类非成员函数
四.string类的模拟实现
1.成员变量&迭代器声明&输入输出函数重载的友元声明
2.string类对象的常见构造
3.迭代器(可以将其看做指针)
4.string类对象的容量操作
5.string类对象的修改操作
6.string类对象的访问
7.string类非成员函数
8.string类中字符串相关的特殊操作
9.string对象的输入输出函数重载
五.使用string类应注意的事项
1.真实的string类内部成员变量
2.真实的string类扩容方式(不同的编译器可能不同)
3. 使用reserve进行扩容时的过程
4.[ ]和at的区别
5.拷贝构造函数和赋值运算符重载的相关细节
6.string和vector
要想模拟实现string我们得先了解什么是string,而了解string我们必先要知道STL.
STL的全称是standard template libaray-标准模板库,是c++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构和算法的软件框架,通俗来说: 将常见的数据结构以模板的方式封装起来,并且提供一些通用灵活的算法.
①.原始版本 Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本, 本着开源精神,他们声明允许任何人任意 运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使 用, HP 版本--所有STL实现版本的始祖。
②.P. J. 版本 由P. J. Plauger开发, 继承自HP版本, 被Windows Visual C++采用, 不能公开或修改, 缺陷:可读性比较低, 符号命名比较怪异。
③.RW版本 由Rouge Wage公司开发, 继承自HP版本, 被C+ + Builder 采用, 不能公开或修改, 可读性一般。
④.SGI版本 由Silicon Graphics Computer Systems, Inc公司开发, 继承自HP版 本。被GCC(Linux)采用, 可移植性好, 可公开、修改甚至贩卖, 从命名风格和编程 风格上看, 阅读性非常高。我们后面学习STL要阅读部分源代码, 主要参考的就是这个版本。
我们将要模拟实现的string类就是属于容器的一部分.
①.STL库的更新太慢了,这个得严重吐槽,上一版靠谱是C++98,中间的C++03基本一些修订,C++11出来已经相隔了13年,STL才进一步更新.
②.STL现在都没有支持线程安全,并发环境下需要我们自己加锁,且锁的粒度是比较大的.
③.STL极度的追求效率,导致内部比较复杂,比如类型萃取,迭代器萃取.
④.STL的使用会有代码膨胀的问题,比如使用vector
/vector /vector 这样会生成多份代码,当然这是模板语法本身导致的.
C语言中的字符串: C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP(面向对象程序设计)的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问.
因此: 在常规工作中,为了简单、方便、快捷,基本都使用string类,很少有人去使用C库中的字符串操作函数.
①.字符串是表示字符序列的类.
②.标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性.
③.string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)).
④.string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string).
⑤.注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作.
注意: 在使用string类时, 必须包含#include
以及using namespace std;
注意: 我们这里只对常用的一些成员函数进行讲解并不是全部.
注意:
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size().
2. clear()只是将string中有效字符清空,不改变底层空间大小.
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间. 注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变.
4. reserve(size_t res_arg=0): 为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小.
注意:
1. 在string尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般情况下string类的+=操作用的比较多,+=操作不仅可以连接单个字符,还可以连接字符串.
2. 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好.
//输入输出函数重载
friend ostream& operator<<(ostream& _cout, const lzStr::string& s);
friend istream& operator>>(istream& _cin, lzStr::string& s);
//迭代器声明
typedef char* iterator;
//成员变量
char* _str;
size_t _capacity;
size_t _size;
string(const char* str = "")//构造函数
:_str(nullptr)
, _size(0)
, _capacity(0)
{
if (str != nullptr) {
_str = new char[strlen(str) + 1];
strcpy(_str, str);
_size = strlen(str);
_capacity = strlen(str);
}
else {
perror("string:");
}
}
string(const string& s)//拷贝构造函数
:_str(nullptr)
{
lzStr::string tempStr(s._str);
swap(tempStr);
}
string& operator=(const string& s) {//赋值运算符重载
if (this != &s) {
lzStr::string tempStr(s._str);
this->swap(tempStr);
}
return *this;
}
~string() {//析构函数
if (_str != nullptr) {
delete[] _str;
_str = nullptr;
}
}
iterator begin() {
return _str;
}
iterator end() {
return _str + _size;
}
size_t size()const {//有效元素个数
return _size;
}
size_t capacity()const {//容量
return _capacity;
}
bool empty()const {//判断有效元素个数是否为0
if (size() == 0) {
return true;
}
return false;
}
void resize(size_t n, char c = '\0') {//改变有效元素个数,以c填充
int new_size = n;
if (new_size > size()) {
if (new_size > capacity()) {
reserve(new_size);
}
int i;
for (i = size(); i < new_size; i++) {
_str[i] = c;
}
}
_size = new_size;
_str[n] = '\0';
}
void reserve(size_t n) {//扩容
if (n > capacity()) {
char* temp = new char[n + 1];
strcpy(temp, _str);
delete[] _str;
_str = temp;
_capacity = n;
}
}
void push_back(char c) {//尾插字符
if (_size == _capacity) {
reserve(_capacity*2);
}
*end() = c;
_size++;
*end() = '\0';
}
string& operator+=(char c) {//+=运算符重载,类似于尾插字符
push_back(c);
return *this;
}
void append(const char* str) {//在尾部追加字符串
size_t new_size = _size + strlen(str);
if (new_size > _capacity) {
reserve(_capacity * 2);
}
int i = _size,j=0;
while (str[j] != '\0') {
_str[i] = str[j];
++i, ++j;
}
_str[i] = '\0';
_size = i;
}
string& operator+=(const char* str) {//+=运算符重载,类似于尾插字符串
append(str);
return *this;
}
void clear() {//将有效元素个数置为0
*begin() = '\0';
_size = 0;
}
void swap(string& s) {//交换
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
const char* c_str()const {//将string对象转为字符串
return _str;
}
char& operator[](size_t index) {//[]运算符重载(普通类型)
if (index<0 || index>=size()) {
perror("operator[]:");
}
return *(_str + index);
}
const char& operator[](size_t index)const {//[]运算符重载(const类型)
if (index < 0 || index >= size()) {
perror("const operator[]:");
}
return *(_str + index);
}
bool operator<(const string& s) {//<运算符重载
if (strcmp(_str, s._str) < 0) {
return true;
}
return false;
}
bool operator<=(const string& s) {//<=运算符重载
if (strcmp(_str, s._str) > 0) {
return false;
}
return true;
}
bool operator>(const string& s) {//>运算符重载
if (strcmp(_str, s._str) > 0) {
return true;
}
return false;
}
bool operator>=(const string& s) {//>=运算符重载
if (strcmp(_str, s._str) < 0) {
return false;
}
return true;
}
bool operator==(const string& s) {//==运算符重载
if (strcmp(_str, s._str) == 0) {
return true;
}
return false;
}
bool operator!=(const string& s) {//!=运算符重载
if (strcmp(_str, s._str) == 0) {
return false;
}
return true;
}
// 返回c在string中第一次出现的位置
size_t find(char c, size_t pos = 0) const {
if (pos < 0 || pos >= size()) {
perror("find c:");
}
int i;
for (i = pos; i < size(); i++) {
if (_str[i] == c) {
return i;
}
}
return -1;
}
// 返回子串s在string中第一次出现的位置
size_t find(const char* s, size_t pos = 0) const {
if (pos < 0 || pos >= size()) {
perror("find s:");
}
int i;
for (i = pos; i < size(); i++) {
int j = 0;
int i_1 = i;
while (i_1 < size() && j < strlen(s) && _str[i_1] == s[j]) {
++i_1, ++j;
}
if (j == strlen(s)) {
return i;
}
}
return -1;
}
// 在pos位置上插入字符c/字符串str,并返回该字符的位置
string& insert(size_t pos, char c) {
if (pos < 0 || pos >= size()) {
perror("insert c:");
}
int new_size = size() + 1;
if (new_size > capacity()) {
reserve(capacity() * 2);
}
auto i = begin() + pos;
for (auto j = end() - 1; j >= i; --j) {
*(j + 1) = *j;
}
*i = c;
_size = new_size;
return *this;
}
string& insert(size_t pos, const char* str) {
if (pos < 0 || pos >= size()) {
perror("insert s:");
}
int new_size = size() + strlen(str);
if (new_size > capacity()) {
reserve(capacity() * 2);
}
auto i = begin() + pos;
for (auto j = end() - 1; j >= i; --j) {
*(j + strlen(str)) = *j;
}
for (int j = 0; str[j] != '\0'; ++j) {
*i = str[j];
++i;
}
_size = new_size;
return *this;
}
// 删除pos位置上的元素,并返回该元素的下一个位置
string& erase(size_t pos, size_t len) {
if (pos < 0 || pos >= size()) {
perror("erase:");
}
auto i = begin() + pos;
int new_size = size() - len;
for (auto j = i + len; j < end(); ++j) {
*i = *j;
++i;
}
_size = new_size;
return *this;
}
//输出函数重载
ostream& lzStr::operator<<(ostream& _cout, const lzStr::string& s) {
int i;
for (i = 0; i < s.size(); i++) {
_cout << s[i];
}
return _cout;
}
//输入函数重载
istream& lzStr::operator>>(istream& _cin, lzStr::string& s) {
char* str = (char*)malloc(sizeof(char) * 100);
char* buf = str;
int i = 1;
while ((*buf = getchar()) == ' ' || (*buf == '\n'));
for (; ; ++i) {
if (*buf == '\n') {
*buf = '\0';
break;
}
else if (*buf == ' ') {
*buf = '\0';
break;
}
else if (i % 100 == 0) {
i += 100;
str = (char*)realloc(str, i);
}
else {
buf = (str + i);
*buf = getchar();
}
}
s._str = str;
s._capacity = s._size = i;
return _cin;
}
当我们创建一个string类型的对象时,我们直接使用sizeof()打印其大小我们会发现在32位的操作系统下是28个字节,但我们所推测出的string类中的变量只有: char* str, size_t size, size_t capacity;根据这些变量计算出来的string的大小应该为12,那么为什么多出来了16个字节呢? c++在创建string容器的时候,在其中给了一个char str[16],当我们所写入的字符串长度小于16个字节时就不会使用char* str来new动态字符数组了,这样的设定大大提高了我们使用string时的效率,当然我们使用reverse对string对象进行扩容时也可以发现这些问题,当我们一直将string对象的capacity增大时,并不会出现什么问题,但是如果我们,使用reverse将string对象的capacity缩小时,string对象的capacity并不会改变,因为申请空间是要经历很多的过程的并不容易,所以我们在其生命周期结束之前,没必要对其进行空间的释放,但也会有例外,当我们将其capacity缩小到小于16字节的时候,这时c++给予我们的str[16]就完全够用了,因此将动态申请的空间释放掉,直接使用str[16]即可,此时capacity的大小为15,因为需要一个字节来存储'\0',再次缩小并不会再发生改变.
在string中使用reserve进行扩容时,编译器并不会按照我们要求进行扩容,而是按capacity*1.5(vs中)的方式进行扩容,直到capacity大于等于我们的需求时停止. 而vector并不相同,在vector中使用reserve进行扩容的时候,编译器会按照我们的需求进行扩容,我们需要多少就会将其扩容到多少,向小扩容并不会生效.
1.开辟新空间.
2.拷贝元素.
3.释放旧空间.
4.使用新空间.
我们使用[ ]和at时应注意他两的区别,效果相同都可以用来访问字符串中的元素,区别于发生错误时,如果使用的是[ ]则会直接导致程序崩溃,如果使用的是at则会在出现错误的地方抛出异常.
a.问题:
当我们自己来实现一个string的类时,我们要注意类的拷贝构造函数和赋值运算符重载中使用浅拷贝所产生的问题.
b.解决浅拷贝的几种方法:
①. 深拷贝.(旧)
(前提类中存在空间资源的调度)我们在拷贝构造函数和赋值运算符重载这两个成员函数中使用老版本的深拷贝进行实现,就是在涉及空间资源的拷贝时我们在其中每次调用时都新new一个空间来供调用对象使用.
②. 深拷贝.(新)
(前提类中存在空间资源的调度)我们在拷贝构造函数和赋值运算符重载这两个成员函数中使用新版本的深拷贝进行实现,就是在这两个函数中以参数对象的_str为参数调用类的构造函数重新构造出来一个对象,并将该临时对象中的成员和调用这俩个函数的对象中的成员一一进行交换,最后调用这两个函数的对象中就有了新的成员,而临时对象中的成员都会被释放掉.
③. 写时拷贝.(存在缺陷不推荐使用)
什么是写时拷贝?
当我们在定义拷贝构造函数和赋值运算符重载时我们都是使用浅拷贝的方式进行定义的,当然可能会有疑问?我们如果使用浅拷贝进行定义那么当这两个成员函数被调用后一定会出现多个对象使用同一块空间的问题,那么怎么解决呢?我们在多个对象使用同一块空间时只要不对空间中的值进行修改那么就不会出现问题,因此我们在空间中又多增加了一块空间用来记录这个空间有多少个对象在共享,在拷贝构造函数和赋值运算符重载中每次调用时都对这块空间中的计数器加1,然后再进行浅拷贝,另外在涉及空间内容修改的成员函数中都对这个计数空间中的值进行检测,如果共享个数大于1,那么就重新申请一块空间并将原空间中的内容拷贝过去,并将新空间中计数器的值赋为1,将老空间的中计数器的值-1,让对象指向这块新空间并在新空间上对其进行操作,这就是写时拷贝,另外得注意析构函数,我们在析构函数定义时得先判断对象所使用的的空间中的计数器是否为1,不为1则将计数器的值-1,为1则将空间释放掉.
读时也拷贝?(缺陷)
当我们使用[ ]或者迭代器时既可以修改空间中的内容,也可以访问空间中的内容,那么编译器是没法知道我们要做什么,因此在这两个成员函数内部增加了判断,当空间只有一个对象使用时直接返回相应的值即可,但是如果空间不止一个对象在使用,此时依旧会使用写时拷贝技术进行处理,因此当我们使用[ ]遍历空间中的内容时,系统如果发现这个空间并不是一个对象在使用,那么就算我们只读,[ ]函数内部依旧会进行-->重新申请新空间-->拷贝元素-->使用新空间,等一系列写时拷贝技术进行处理.
问题:
string类是管理字符的动态顺序表,vector是管理任意类型元素的动态顺序表,那么既然vector
区别:
1.字符数组不一定是字符串,因为在c/c++中规定,字符串的最后一个有效元素之后必须是\0.
2.string类有和字符串相关的一些特殊操作.