标准模板库 STL是C++标准库的重要组成部分,stl分为六大组件:算法、容器、迭代器、空间适配器、仿函数 、配接器。包含了里常用的基本数据结构和基本算法,在STL中体现了泛型化程序设计的思想。
string丰富的函数接口成就了其强大的功能,我们将模拟实现其常用的几个,帮助我们更好的理解string类。string由三个成员变量组成:分别是存储字符串的字符指针、存储有效数据个数的size以及表示当前类容量的capacity:
size_t _size;
size_t _capacity;
char* _str;
首先先来编写构造函数,在我们创建string类时,我们可能会用一个字符串初始类或者仅仅创建:
void test_string6()
{
ztb::string s1("hello world");
ztb::string s2;
}
所以我们需要带参和无参两个构造可以合并为一个全缺省的构造函数:
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
memcpy(_str, str, _capacity + 1);
}
这里如果使用初始化列表的话需要注意初始化的顺序要与成员变量的声明顺序一致,不然会出现错误。
我们知道自定义类型的传值,是需要拷贝构造函数来完成的:
string(const string& t)
{
_str = new char[t._capacity + 1];
memcpy(_str, t._str, t._size + 1);
_capacity = t._capacity;
_size = t._size;
}
类对象在销毁时会自动调用析构函数,完成对象中的资源清理工作:
~string()
{
if (_str)
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
}
[ ]符号的重载是非常实用的:
char& operator[](size_t pos)//考虑到要可以读可以写,使用引用返回
{//可读可写
assert(pos < _size);
return *(_str + pos);
}
const char& operator[](size_t pos)const
{//只读
assert(pos < _size);
return *(_str + pos);
}
const类型的使得,const对象也可以调用。
在向string中添加数据前先要判断容量是否还够,所以先来编写扩容逻辑:
void reserve(const size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
memcpy(tmp, _str, _size + 1);
delete[] _str;
_str = tmp;
_capacity = n ;///成员不考虑斜杆0
}
}
push_back用来尾插一个字符,需要注意的是在判断容量不足扩容时:容量为0的情况(无参构造string类):
void push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
append函数用来插入一个字符串同push_back一样需要判断容量是否足够:
void append(const char* str)
{
size_t len = strlen(str);
if (len + _size > _capacity)
{
reserve((len + _size) * 2);
}
memcpy(_str + _size, str, len + 1);
_size += len;
}
insert函数是在pos位置前插入n个字符或者插入一个字符串:
void insert(size_t pos, size_t n, char ch)
{
assert(pos <= _size);
if (_size + n > _capacity)
{
reserve(_size + n);//至少
}
size_t end = _size;
while (end >= pos && end != npos)end可能会减到负数,所以要制约
{
_str[end + n] = _str[end];
--end;
}
for (size_t i = 0; i < n; i++)
{
_str[pos+i] = ch;
}
_size += n;
}
其中使用我们在数据结构时常用的挪动数据的逻辑,其中需要注意的是当pos位置为0时end可能会减到-1(end为size_t类型所以是个很大的数字)为了避免这个错误,应限制end。
void insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);//至少
}
size_t end = _size;
while (end >= pos && end != npos)end可能会减到负数,所以要制约
{
_str[end + len] = _str[end];
--end;
}
for (size_t i = 0; i < len; i++)
{
_str[pos + i] = str[i];
}
_size += len;
}
resize和reserve就像是malloc和calloc的关系,resize可以给指定的_size初始化指定的字符默认为斜杆零。reserve增加的是容量而resize增加的是_size。 resize() 调整字符串的大小。如果字符串长度变小,多余的字符会被截掉。
void resize(size_t n, char ch = '\0')
{
if (n < _size)
{
_size = n;
_str[_size] = '\0';
}
else
{
reserve(n);
for (size_t i = _size; i < n; i++)
{
_str[i] = ch;
}
_size = n;
_str[_size] = '\0';
}
}
赋值运算符的现代写法如下啊:如果string s1; string s2("hello world"); s1=s2;
运算符重载通过拷贝构造穿过来的s2通过交换函数,与成员变量做了交换
void swap(string& tmp)
{
std::swap(_str, tmp._str);
std::swap(_size, tmp._size);
std::swap(_capacity, tmp._capacity);
}
string& operator=(string tmp)
{
swap(tmp);
return *this;
}
+=也是比较常用的,让添加数据变得比较方便:
string& operator+=(const char* str)
{
append(str);
return *this;
}
string& operator+=(const char ch)
{
push_back(ch);
return *this;
}
比较大小的函数也不可少哦:
bool operator<(const string& s)
{
int ret = memcmp(_str, s._str, _size > s._size ? s._size : _size);
return ret == 0 ? _size < s._size : ret < 0;
}
bool operator==(const string& s)
{
return (_size == s._size) && (memcpy(_str, s._str, _size));
}
bool operator<=(const string& s)
{
return *this < s || *this == s;
}
bool operator>(const string& s)
{
return !(*this <= s);
}
bool operator>=(const string& s)
{
return !(*this < s);
}
bool operator!=(const string& s)
{
return !(*this == s);
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
ostream& operator<<(ostream& out, const string& s)
{
for (auto a : s)
{
out << a;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch = in.get();
// 处理前缓冲区前面的空格或者换行
while (ch == ' ' || ch == '\n')
{
ch = in.get();
}
//in >> ch;
char buff[128];
int i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[i] = '\0';
s += buff;
i = 0;
}
//in >> ch;
ch = in.get();
}
if (i != 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
流插入和流提取也模拟出来了,其中使用buff实现了类似空间适配器功能。
当string类对象_size小于某个值时字符串将会存储在数组中,当大于等于某个值时会存储到堆空间中。
返回起始位置和终数据位置的迭代器iterator在string类中 此迭代器就如同指针:
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str+_size;
}
const_iterator begin()const
{
return _str;
}
const_iterator end()const
{
return _str + _size;
}
c_str函数是为了兼容C语言设计的接口,使用C语言可以使用其将string类中的字符串打印出来。
const char* c_str()
{
return _str;
}
返回当前类的_size和_capacity的函数接口:
size_t size()const
{
return _size;
}
size_t capacity()const
{
return _capacity;
}
erase函数用来删除pos位置开始指定长度的数据:
void erase(size_t pos, size_t len = npos)
{
assert(pos <= _size);
if (len == npos || len + pos >= _size)
{
_str[pos] = '\0';
_size = pos;
//_str[_size] = '\0';这句不用加吧
}
else
{
size_t end = len + pos;
while (end <= _size)
{
_str[pos++] = _str[end++];
}
_size -= len;
}
}
如果未指定len则将pos位置起到数据结尾全部删除。
find函数可以从pos位置开始查找指定字符或者字符串:
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
return i;
}
return npos;
}
size_t find(const char* str, size_t pos = 0)
{
assert(pos < _size);
const char* tmp = strstr(_str + pos, str);
if (tmp)
{
return tmp - _str;
}
return npos;
}
substr函数可以截取一个string对象中的一部分并返回生成的新类:
string substr(size_t pos = 0, size_t len = npos)
{
assert(pos < _size);
size_t n = len;
if (len == npos || len + pos > _size)
{
n = _size - pos;
}
string tmp;
tmp.reserve(n);
for (size_t i = pos; i < pos + n; i++)
{
tmp += _str[i];
}
return tmp;
}