【C++】string类模拟

文章目录

  • 成员变量和查看接口
      • 迭代器(读和读写)
      • operator[](读和读写)
      • c_str()
      • size()
  • 构造函数
      • 用字符串构造
      • 用对象构造(两种方法)
      • 析构
  • 赋值运算符重载
  • 扩容和调整
      • reserve()
      • resize()
      • clear()
  • 增删查改
      • push_back()
      • append()
      • operator+=()
      • insert()(字符和字符串)
      • erase()
      • find() (字符和字符串)
      • substr()
  • string大小比较
      • operator<()
      • operator==()
      • 复用
  • IO流
      • operator<<()
      • operator>>()

成员变量和查看接口

  string类中有三个成员变量分别记录有效元素个数、容量和字符串。而静态变量npos=1表示整型的最大值,且只能在类外部进行赋值

成员变量:

private:
	size_t _size;	//个数
	size_t _capacity; //容量
	char* _str;		//字符数组
public:
	const static size_t npos; //表示整形最大值

迭代器(读和读写)

typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
	return _str; 
}
iterator end()
{
	return _str + _size;
}
const_iterator begin() const
{
	return _str;
}
const_iterator end() const
{
	return _str + _size;
}

operator[](读和读写)

  const成员函数前面的返回值也必须加上constthis->_str 不能被修改,而指针是内置类型,指针不能被修改,但是指针指向区域内容却可以被修改,因此返回值前面加上 const

char& operator[](size_t pos) 
{
	assert(pos < _size);
	return _str[pos]; 
}
const char& operator[](size_t pos)const
{
	assert(pos < _size);
	return _str[pos];
}

c_str()

const char* c_str() const
{
	return _str;
}

size()

size_t size() const
{
	return _size;
}

构造函数

用字符串构造

  注意,无参时我们给缺省值,给空串,里面不能带 空格,空格也是有效字符。new 开空间的时候,要开字符串长度 +1个,strlen() 函数只会记录有效字符个数,我们需要多卡一个空间给 \0 字符

string(const char* str = "")
{
	_size = strlen(str);
	_capacity = _size;
	_str = new char[_capacity + 1];
	memcpy(_str, str, _size + 1);
}	

用对象构造(两种方法)

  方法 1memcpy 库函数,而不是 strcpy ,对于 “abc \0 def” 这种字符串,strcpy没办法处理,遇到 \0 就终止了,而 memcpy 是按内存中字节拷贝的
  方法 2 的话,调用了 swap() 库函数,且复用了用字符串构造函数,这里还需注意必须初始化 _str ,它是指针类型的,编译器不会自动初始化,那么和 tmp 交换后,析构 tmp 就会析构一段非法空间,而报错

//方法 1
string(const string& s)
{
	_str = new char[s._capacity + 1];
	memcpy(_str, s._str, s._size + 1);
	_size = s._size;
	_capacity = s._capacity;
}
//方法 2
string(const string& s)
	:_size(0)
	,_capacity(0)
	,_str(nullptr)
{
	string tmp(s._str);
	swap(tmp);
}

析构

~string()
{
	delete[] _str;
	_str = nullptr;
	_size = _capacity = 0;
}

赋值运算符重载

  方法一比较原始,实现方法和 reserve() 函数一样,先开一样大小的空间,然后拷贝数据,再销毁原来空间,更新 _str,_capacity,_size
  方法二调用库里面的 swap() 函数便能轻松解决,那么思考为什么我们不直接交换 swap(*this, tmp) ?先看库里面 swap() 函数实现,不难发现里面的对象交换需要相互赋值,而赋值又要调用 operator(),而 operator() 里面又会调用 swap() 依次进行就变成了死递归
【C++】string类模拟_第1张图片

//方法一
string& operator=(const string& s)
{
	if (this != &s)
	{
		char* tmp = new char[s._capacity + 1];
		memcpy(tmp, s._str, s._size+1);
		delete[] _str;
		_str = tmp;
		_size = s._size;
		_capacity = s._capacity;
	}
	return *this;
}
//方法二
string& operator=(string tmp)
{
    //std::swap(*this,tmp);//这样写死递归
	std::swap(_str, tmp._str);
	std::swap(_size, tmp._size);
	std::swap(_capacity, tmp._capacity);
	return *this;
}

扩容和调整

  扩容我们采取异地扩容的方式,考虑到 reserve() 函数外部也可以用,因此加个判断,异地扩容后记得把原来空间释放掉

reserve()

void reserve(size_t n)
{	
	//异地扩容
	if (n > _capacity)
	{
		char* tmp = new char[n + 1];
		memcpy(tmp, _str, _size + 1);
		delete[] _str;
		_str = tmp;
		_capacity = n;
	}
}

resize()

  空间变小的话,我们还是不改变 _capacity,把 _size 改了,再赋上 \0 就行,空间大了的话,我们就异地扩容,再给要改变的 ch 加上缺省值 \0

void resize(size_t n, char ch = '\0')
{
	if (n < _size) {
		_size = n;
		_str[_size] = '\0';
	}
	else {
		reserve(n);
		for (size_t i = _size; i < n; i++)
		{
			_str[i] = ch;
		}
		_size = n;
		_str[_size] = '\0';
	}
}

clear()

void clear()
{
	_size = 0;
	_str[_size] = '\0';
}

增删查改

push_back()

	void push_back(const char ch)
	{
		//扩容×2
		if (_size == _capacity)
		{
			//有可能用空串初始化的
			reserve(_capacity == 0 ? 4 : _capacity * 2);
		}
		_str[_size] = ch;
		++_size;
		_str[_size] = '\0';
	}

append()

	void append(const char* str)
	{
		size_t len = strlen(str);
		if (_size + len > _capacity)
		{
			reserve(_size + len);
		}
		//strcpy(_str + _size, str);
		memcpy(_str + _size, str, len + 1);
		_size += len;
	}

operator+=()

  直接复用前面两个函数 push_back() 和 append() ,调用这两个函数,再考虑空间够不够,不够就扩容再尾插

	string& operator+=(const char ch)
	{
		push_back(ch);
		return *this;
	}
	string& operator+=(const char* str)
	{
		append(str);
		return *this;
	}

insert()(字符和字符串)

  首先,检查一下插入位置的合法性,然后这意一下,end 是无符号类型,考虑 pos为0 时会造成死循环,end减为 -1 却是整形最大值,因此我们前面设置的静态变量 npos 便发挥了作用。最后注意边界问题,是否需要扩容

	void insert(size_t  pos, size_t n, char ch)
	{
		assert(pos <= _size);
		if (_size + n > _capacity)
		{
			reserve(_size + n);
		}

		size_t end = _size;
		_size += n;
		//end是无符号类型,考虑pos为0时 的死循环
		while (end >= pos && end != npos)
		{
			_str[end + n] = _str[end];
			end--;
		}
		for (size_t i = 0; i < n; i++)
		{
			_str[pos + i] = ch;
		}
	}
	void insert(size_t pos, const char* str)
	{
		assert(pos <= _size);
		size_t len = strlen(str);
		if (len + _size > _capacity)
		{
			reserve(len + _size);
		}
		size_t end = _size;
		_size += len;
		while (end >= pos && end != npos)
		{
			_str[end + len] = _str[end];
			end--;
		}
		for (size_t i = 0; i < len; i++)
		{
			_str[pos + i] = str[i];
		}
	}

erase()

  删除字符的个数我们给缺省值,方便边界判断。考虑 pos 的合法性后,再处理边界问题,删除工作就是不断从后往前迭代

void erase(size_t pos, size_t len = npos)
{
	assert(pos <= _size);
	if (len == npos || pos + len >= _size){
		_str[pos] = '\0';
		_size = pos;
	}
	else {
		size_t end = pos + len;
		while (end <= _size)
		{
			_str[end-len] = _str[end];
			++end;
		}
		_size -= len;
	}
}

find() (字符和字符串)

  没有找到找到就返回 npos ,缺省值从 0 开始找,找字符串有很多中算法,KMP,BF … 这里我们直接调用 strstr() 库函数简单实现就行

size_t find(char ch, size_t pos = 0)
{
	assert(pos < _size);
	for (size_t i = pos; i < _size; i++)
	{
		if (_str[i] == ch)
		{
			return i;
		}
	}
	return npos;
}
size_t find(const char* str, size_t pos = 0)
{
	assert(pos < _size);
	const char* ptr = strstr(_str + pos, str);
	if (ptr){
		return ptr - _str;
	}
	else {
		return npos;
	}
}

substr()

  检查 pos 合法性后,我需要计算切割字符串的长度。注意我们返回的是一个临时的 string 类,开好空间,然后调用 operator+= 函数,它会自动处理后面的 \0

string substr(size_t pos=0, size_t len = npos)
{
	assert(pos < _size);
	size_t n = len;
	if (len == npos || pos + len >= _size)
	{
		n = _size - pos;
	}
	string tmp;
	tmp.reserve(n);
	for (size_t i = pos; i < pos + n; i++)
	{
		tmp += _str[i];
	}
	return tmp;
}

string大小比较

operator<()

  由于字符串比较情况种类较多,比如 “abc” “abcd” 这种情况, 库函数 strcmp,memcmp 便不再适用, 它们适用于相同长度的字符串比较,长度不同容易出现越界问题,这里我们直接自己实现

bool operator<(const string& s) const
{
	size_t lt1 = 0;
	size_t lt2 = 0;
	while (lt1 < _size && lt2 < s._size)
	{
		if (_str[lt1] < s._str[lt2]) {
			return true;
		}
		else if (_str[lt1] > s._str[lt2]) {
			return false;
		}
		else {
			lt1++;
			lt2++;
		}
	}
	return _size < s._size;
}

operator==()

bool operator==(const string& s) const
{
	return _size == s._size && memcmp(_str, s._str, _size) == 0;
}

复用

bool operator<=(const string& s) const
{
	return *this < s || *this == s;
}
bool operator>(const string& s) const
{
	return !(*this <= s);
}
bool operator>=(const string& s) const
{
	return *this > s || *this == s;
}
bool operator!=(const string& s) const
{
	return !(*this == s);
}

IO流

operator<<()

ostream& operator<<(ostream& out, const string& s)
{
	for (auto ch : s)
	{
		out << ch;
	}
	return out;
}

operator>>()

  插入前要处理,缓冲区前面的空格和换行,用循环解决掉空格和换行字符。进行流插入的时候,我们设置一个中将数组,让插入数据先放在buff数组中,避免调用多次 operator+= 函数而引起多次扩容判断,最后再处理后面的 \0

istream& operator>>(istream& in, string& s)
{
	s.clear();
	char ch = in.get();
	//除去缓冲区的空格和换行
	while (ch == ' ' || ch == '\n')
	{
		ch = in.get();
	}
	//用一个中将容器,减少扩容次数
	char buff[128];
	size_t i = 0;
	while (ch != ' ' && ch != '\n')
	{
		buff[i++] = ch;
		if (i == 127)
		{
			//加上'\0'以免+=出问题
			buff[i] = '\0';
			s += buff;
			i = 0;
		}
		ch = in.get();
	}
	if (i != 0)
	{
		buff[i] = '\0';
		s += buff;
	}
	return in;
}

你可能感兴趣的:(C++,c++,开发语言,服务器)