字符串处理总结之三(C++string类)

在介绍完C#字符串处理方法之后,接下来介绍一下C++的字符串处理方法。C++的字符串处理方法没有C#的方便,它没有提供很多想C#那样实用的函数。在标准库中存在的string类型和传统的C字符串相比提供了较大的便利。

相比char*的字符串,C++标准程序库中的string类,具有不必担心内存是否足够、字符串长度等等的优势,而且作为一个类出现,他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 进行赋值操作,== 进行比较,做串联(是不是很简单?)。我们尽可以把它看成是C++的基本数据类型

首先,为了在我们的程序中使用string类型,我们必须包含头文件 。如下:

#include <string>//注意这里不是string.h string.hC字符串头文件

1. 声明一个C++字符串

声明一个字符串变量很简单:string Str;

这样我们就声明了一个字符串变量,但既然是一个类,就有构造函数和析构函数。上面的声明没有传入参数,所以就直接使用了string的默认的构造函数,这个函数所作的就是把Str初始化为一个空字符串。String类的构造函数和析构函数如下:

a)    string s;  //生成一个空字符串s

b)    string s(str) //拷贝构造函数 生成str的复制品

c)    string s(str,stridx) //将字符串str始于位置stridx”的部分当作字符串的初值

d)    string s(str,stridx,strlen) //将字符串str始于stridx且长度顶多strlen”的部分作为字符串的初值

e)    string s(cstr) //C字符串作为s的初值

f)    string s(chars,chars_len) //C字符串前chars_len个字符作为字符串s的初值。

g)    string s(num,c) //生成一个字符串,包含numc字符

h)    string s(beg,end) //以区间beg;end(不包含end)内的字符作为字符串s的初值

i)    s.~string() //销毁所有字符,释放内存

2. 字符串操作函数

   这里是C++字符串的重点,我先把各种操作函数罗列出来,不喜欢把所有函数都看完的人可以在这里找自己喜欢的函数,再到后面看他的详细解释。

a) =,assign()   //赋以新值

b) swap()   //交换两个字符串的内容

c) +=,append(),push_back() //在尾部添加字符

d) insert() //插入字符

e) erase() //删除字符

f) clear() //删除全部字符

g) replace() //替换字符

h) + //串联字符串

i) ==,!=,<,<=,>,>=,compare()  //比较字符串

j) size(),length()  //返回字符数量

k) max_size() //返回字符的可能最大个数

l) empty()  //判断字符串是否为空

m) capacity() //返回重新分配之前的字符容量

n) reserve() //保留一定量内存以容纳一定数量的字符

o) [ ], at() //存取单一字符

p) >>,getline() //stream读取某值

q) <<  //将谋值写入stream

r) copy() //将某值赋值为一个C_string

s) c_str() //将内容以C_string返回

t) data() //将内容以字符数组形式返回

u) substr() //返回某个子字符串

v)查找函数

w)begin() end() //提供类似STL的迭代器支持

x) rbegin() rend() //逆向迭代器

y) get_allocator() //返回配置器

下面详细介绍:

3. C++字符串和C字符串的转换

C++提供的由C++字符串得到对应的C_string的方法是使用data()c_str()copy(),其中,data()以字符数组的形式返回字符串内容,但并不添加’\0’c_str()返回一个以‘\0’结尾的字符数组,而copy()则把字符串的内容复制或写入既有的c_string或字符数组内。C++字符串并不以’\0’结尾。我的建议是在程序中能使用C++字符串就使用,除非万不得已不选用c_string

4. 大小和容量函数

一个C++字符串存在三种大小:a)现有的字符数,函数是size()length(),他们等效。Empty()用来检查字符串是否为空。b)max_size() 这个大小是指当前C++字符串最多能包含的字符数,很可能和机器本身的限制或者字符串所在位置连续内存的大小有关系。我们一般情况下不用关心他,应该大小足够我们用的。但是不够用的话,会抛出length_error异常c)capacity()重新分配内存之前 string所能包含的最大字符数。这里另一个需要指出的是reserve()函数,这个函数为string重新分配内存。重新分配的大小由其参数决定,默认参数为0,这时候会对string进行非强制性缩减。

还有必要再重复一下C++字符串和C字符串转换的问题,许多人会遇到这样的问题,自己做的程序要调用别人的函数、类什么的(比如数据库连接函数Connect(char*,char*)),但别人的函数参数用的是char*形式的,而我们知道,c_str()data()返回的字符数组由该字符串拥有,所以是一种const char*,要想作为上面提及的函数的参数,还必须拷贝到一个char*,而我们的原则是能不使用C字符串就不使用。那么,这时候我们的处理方式是:如果此函数对参数(也就是char*)的内容不修改的话,我们可以这样Connect((char*)UserID.c_str(), (char*)PassWD.c_str()),但是这时候是存在危险的,因为这样转换后的字符串其实是可以修改的,所以我强调除非函数调用的时候不对参数进行修改,否则必须拷贝到一个char*上去。当然,更稳妥的办法是无论什么情况都拷贝到一个char*上去。同时我们也祈祷现在仍然使用C字符串进行编程的高手们写的函数都比较规范,那样我们就不必进行强制转换了。

5. 元素存取

我们可以使用下标操作符[]和函数at()对元素包含的字符进行访问。但是应该注意的是操作符[]并不检查索引是否有效(有效索引0~str.length()),如果索引失效,会引起未定义的行为。而at()会检查,如果使用at()的时候索引无效,会抛出out_of_range异常。

有一个例外不得不说,const string a;的操作符[]对索引值是a.length()仍然有效,其返回值是’\0’。其他的各种情况,a.length()索引都是无效的。举例如下:

const string Cstr(“const string”);

string Str(“string”);

Str[3];    //ok

Str.at(3);  //ok

 

Str[100]; //未定义的行为

Str.at(100);  //throw out_of_range

 

Str[Str.length()]  //未定义行为

Cstr[Cstr.length()] //返回 ‘\0’

Str.at(Str.length());//throw out_of_range

Cstr.at(Cstr.length()) ////throw out_of_range

我不赞成类似于下面的引用或指针赋值:

char& r=s[2];

char* p= &s[3];

因为一旦发生重新分配,r,p立即失效。避免的方法就是不使用。

6. 比较函数

C++字符串支持常见的比较操作符(>,>=,<,<=,==,!=),甚至支持stringC-string的比较(如 str<”hello”)。在使用>,>=,<,<=这些操作符的时候是根据当前字符特性将字符按字典顺序进行逐一得比较。字典排序靠前的字符小,比较的顺序是从前向后比较,遇到不相等的字符就按这个位置上的两个字符的比较结果确定两个字符串的大小。同时,string(“aaaa”) 

另一个功能强大的比较函数是成员函数compare()。他支持多参数处理,支持用索引值和长度定位子串来进行比较。他返回一个整数来表示比较结果,返回值意义如下:0-相等 〉0-大于 <0-小于。举例如下:

string s(“abcd”);

s.compare(“abcd”); //返回0

s.compare(“dcba”); //返回一个小于0的值

s.compare(“ab”); //返回大于0的值

  

s.compare(s); //相等

s.compare(0,2,s,2,2); //”ab””cd”进行比较 小于零

s.compare(1,2,”bcx”,2); //”bc””bc”比较。

还可以使用STL的比较算法

7. 更改内容

这在字符串的操作中占了很大一部分。

首先讲赋值,第一个赋值方法当然是使用操作符=,新值可以是string(如:s=ns) c_string(如:s=”gaint”)甚至单一字符(如:s=’j’)。还可以使用成员函数assign(),这个成员函数可以使你更灵活的对字符串赋值。还是举例说明吧:

s.assign(str); //不说

s.assign(str,1,3);//如果str”iamangel” 就是把”ama”赋给字符串

s.assign(str,2,string::npos);//把字符串str从索引值2开始到结尾赋给s

s.assign(“gaint”); //不说

s.assign(“nico”,5);//’n’ ‘I’ ‘c’ ‘o’ ‘\0’赋给字符串

s.assign(5,’x’);//把五个x赋给字符串

把字符串清空的方法有三个:s=””;s.clear();s.erase();(我越来越觉得举例比说话让别人容易懂!)

string提供了很多函数用于插入(insert)、删除(erase)、替换(replace)、增加字符。

先说增加字符(这里说的增加是在尾巴上),函数有 +=append()push_back()。举例如下:

s+=str;//加个字符串

s+=”my name is jiayp”;//加个C字符串

s+=’a’;//加个字符

 

s.append(str);

s.append(str,1,3);//不解释了 同前面的函数参数assign的解释

s.append(str,2,string::npos)//不解释了

 

s.append(“my name is jiayp”);

s.append(“nico”,5);

s.append(5,’x’); 

 

字符串操作是一个不小的主题,在标准C++,string字符串类成为一个标准,之所以抛弃char*的字符串而选用C++标准程序库中的string类,是因为他和前者比较起来,不必担心内存是否足够、字符串长度等等,而且作为一个类出现,他集成的操作函数足以完成我们大多数情况下的需要.

你可能感兴趣的:(字符串处理总结之三(C++string类))