在看C++的string类型的时候,突然发现string类型可以对其字符串常量中的字符进行修改,而我记得字符串常量是被存储在常量存储区,内部的常量是不允许被修改的,那为什么用string类型时可以被修改呢。
还是通过代码深入了解下这个问题:
上面两段代码,第一段无法运行,第二段能正常运行。
第一段无法运行原因在于字符串 "abcde" 是被存储在常量存储区,对应的常量是不允许被修改的。那同样是字符串常量,为什么赋值到string类型下,其对应的常量可以被修改呢,这个让我百思不得其解,一开始我认为可能给string p分配了对应的存储空间将"abcde"一个个单独存储,就像数组存储字符串一样。
上面看出无论p对应字符串长度如何变化,p分配到的内存空间始终保持不变。
原因在于string p在存储单元中并不是直接存储字符串本身的,而是存放字符串地址。
那问题又回归至:同样是字符串常量,同样是存储字符串常量的地址,为什么赋值到char *p中不能修改,而赋值到string类型下,其对应的常量可以被修改。
后来在网上找到一种说法:
C++中string一般实现通过下面几个变量实现
char* ptr; // 内存指针, 用来保存字符串
size_t cap; // 动态内存的长度
size_t len; // 字符串的长度
实际的实现会更加复杂, 而且是模板。
仔细一下,也有道理。string并不是C++语言本身具有的基本类型(而Char、int、float、double等是C++的基本类型)。string是一个类,正因如此要#include
而对于类来说,其内部包含了很多函数,具有很强大的功能,所以对于赋值到string类型下的常量可以被修改也就不足为怪了,但肯定一点就是字符串常量被修改时肯定不在常量存储区(说不定被单个字符拿出来存到其他地方修改然后再经过XXX处理)——其实问题并未完全解决还望大神提点。
string这个类提供了相当丰富的函数来完成对字符串操作,其存放的字符串不包含'\0',以及通过c_str()与C风格字符串进行转换。
下面是对string一些总结<引用>
一,C语言的字符串
在C语言里,对字符串的处理一项都是一件比较痛苦的事情,因为通常在实现字符串的操作的时候都会用到最不容易驾驭的类型--指针。
比如下面这个例子:
//example 1:
char str[12] = "Hello";
char *p = str;
*p = ’h’; //改变第一个字母
//example 2:
char *ptr = "Hello";
*ptr = ’h’; //错误
第一个字符串时用数组开辟的,它是可以改变的变量。而第二个字符串则是一个常量,也就是字面值。ptr只是指向它的指针而已,而不能改变指向的内容。
看两者的汇编即可明了:
char p[] = "Hello";
004114B8 mov eax,dword ptr [string "Hello" (4166FCh)]
004114BD mov dword ptr [ebp-10h],eax
004114C0 mov cx,word ptr ds:[416700h]
004114C7 mov word ptr [ebp-0Ch],cx
char *ptr = "Hello";
004114CB mov dword ptr [ebp-1Ch],offset string "Hello" (4166FCh)
可见用数组和用指针是完全不相同的。
要想通过指针来改变常量是错误,正确的写法应该是用const指针。
const char *ptr = "Hello";
二,初识string类
正是因为C风格字符串(以空字符结尾的字符数组)太过复杂难于掌握,不适合大程序的开发,所以C++标准库定义了一种string类,定义在头文件。注意
看下面例子:
//example 3:
string str("world"); //可以用C风格字符串初始化
string words = "Hello";
string greet = words;
string join = greet + words; //可以像基本类型一样操作
但是如果试图把string类型的对象直接赋给C风格的字符串的话,编译器会报错的。
string var = "Olympic";
char *ptr = var; //error!
但是实际应用中这个问题也难以避免,很多时候我们还是需要将string类型的转化为char*来实现自定义的操作,C++标准库也为了和之前用C写的程序兼容,于是可以用string的c_str()函数。
string var = "Olympic";
char *ptr = var.c_str(); //还不能被编译
但是c_str()为了防止意外地修改string对象,返回的是const指针,所以上面这段代码是不能被编译的。正确的应该是用const指针。
string var = "Olympic";
const char *p = var.c_str(); //Correct!
这个c_str()方法在C++IO流操作上也被广泛应用。
在打开文件时,如果要指定文件名,可以用C风格的字符串。如果用到string类型的字符串作为文件名时,就必须调用c_str()方法将其转换为一个C风格字符串。
//example 4:
string filename; //定义文件名称
cin 》 filename;
ifstream.open(filename.c_str()); //要使用C风格字符串
三, 深入了解string类
对string有一定了解以后,我们可以来了解C++标准库定义的一系列丰富的字符串操作,当然都是基于string类型。从某一种程度上来说,string就是一种字符容器。
标准库为string定义了很多方法,包括构造、插入(insert)、替换(assign和replace)、比较(compare)、查找(find)、删除(erase)、连接(append)以及对子串的操作(substr)。而每一种操作都有很多种重载。
比如插入,除了包括标准容器的插入方式以外,string类本身还有一些特有的插入方法。
//example 5:
//与标准容器相同的插入操作:
str.insert(iter, value) //在迭代器iter之前插入value, 返回新元素的迭代器
str.insert(iter, n, value); //在迭代器iter之前插入n个value,返回void
str.insert(iter, begin, end); //在迭代器iter之前插入迭代器begin和end标记范围内的元素,返回void
//string类特有的插入方法:
str.insert(pos, n, ch); //在下标为pos的字符之前插入n个字符ch
str.insert(pos, str2); //在下标为pos的字符之前插入string类型的对象str2的副本
str.insert(pos1, str2, pos2, len); //在下标为pos1的z字符之前插入string类型str2中从下表为pos2开始的len个字符
str.insert(pos, cp); //在下标为pos的字符前插入字符指针cp指向的C风格字符串的副本
总之string是一种非常灵活的字符串类型,标准库让我们可以忽略内存管理和具体实现方式,我们只需要关注其接口就好。并且初学者在使用字符串的时候也应尽量使用这种类型,而不是C风格的字符串。
之所以抛弃char*的字符串而选用C++标准程序库中的string类,是因为他和前者比较起来,不必担心内存是否足够、字符串长度等等,而且作为一个类出现,他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作,== 进行比较,+ 做串联(是不是很简单?)。我们尽可以把它看成是C++的基本数据类型。
好了,进入正题……
首先,为了在我们的程序中使用string类型,我们必须包含头文件 .如下:
#include //注意这里不是string.h string.h是C字符串头文件
1.声明一个C++字符串
声明一个字符串变量很简单:
string Str;
这样我们就声明了一个字符串变量,但既然是一个类,就有构造函数和析构函数。上面的声明没有传入参数,所以就直接使用了string的默认的构造函数,这个函数所作的就是把Str初始化为一个空字符串。String类的构造函数和析构函数如下:
a) string s; //生成一个空字符串s
b) string s(str) //拷贝构造函数 生成str的复制品
c) string s(str,stridx) //将字符串str内"始于位置stridx"的部分当作字符串的初值
d) string s(str,stridx,strlen) //将字符串str内"始于stridx且长度顶多strlen"的部分作为字符串的初值
e) string s(cstr) //将C字符串作为s的初值
f) string s(chars,chars_len) //将C字符串前chars_len个字符作为字符串s的初值。
g) string s(num,c) //生成一个字符串,包含num个c字符
h) string s(beg,end) //以区间beg;end(不包含end)内的字符作为字符串s的初值
i) s.~string() //销毁所有字符,释放内存
都很简单,我就不解释了。
2.字符串操作函数
这里是C++字符串的重点,我先把各种操作函数罗列出来,不喜欢把所有函数都看完的人可以在这里找自己喜欢的函数,再到后面看他的详细解释。
a) =,assign() //赋以新值
b) swap() //交换两个字符串的内容
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase() //删除字符
f) clear() //删除全部字符
g) replace() //替换字符
h) + //串联字符串
i) ==,!=,<,<=,>,>=,compare() //比较字符串
j) size(),length() //返回字符数量
k) max_size() //返回字符的可能最大个数
l) empty() //判断字符串是否为空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量内存以容纳一定数量的字符
o) [ ], at() //存取单一字符
p) 》,getline() //从stream读取某值
q) 《 //将谋值写入stream
r) copy() //将某值赋值为一个C_string
s) c_str() //将内容以C_string返回
t) data() //将内容以字符数组形式返回
u) substr() //返回某个子字符串
v)查找函数
w)begin() end() //提供类似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
下面详细介绍:
2.1 C++字符串和C字符串的转换
C++提供的由C++字符串得到对应的C_string的方法是使用data()、c_str()和copy(),其中,data()以字符数组的形式返回字符串内容,但并不添加’\0’.c_str()返回一个以’\0’结尾的字符数组,而copy()则把字符串的内容复制或写入既有的c_string或字符数组内。C++字符串并不以’\0’结尾。我的建议是在程序中能使用C++字符串就使用,除非万不得已不选用c_string.由于只是简单介绍,详细介绍掠过,谁想进一步了解使用中的注意事项可以给我留言(到我的收件箱)。我详细解释。
2.2 大小和容量函数
一个C++字符串存在三种大小:a)现有的字符数,函数是size()和length(),他们等效。Empty()用来检查字符串是否为空。b)max_size() 这个大小是指当前C++字符串最多能包含的字符数,很可能和机器本身的限制或者字符串所在位置连续内存的大小有关系。我们一般情况下不用关心他,应该大小足够我们用的。但是不够用的话,会抛出length_error异常c)capacity()重新分配内存之前 string所能包含的最大字符数。这里另一个需要指出的是reserve()函数,这个函数为string重新分配内存。重新分配的大小由其参数决定,默认参数为0,这时候会对string进行非强制性缩减。
还有必要再重复一下C++字符串和C字符串转换的问题,许多人会遇到这样的问题,自己做的程序要调用别人的函数、类什么的(比如数据库连接函数Connect(char*,char*)),但别人的函数参数用的是char*形式的,而我们知道,c_str()、data()返回的字符数组由该字符串拥有,所以是一种const char*,要想作为上面提及的函数的参数,还必须拷贝到一个char*,而我们的原则是能不使用C字符串就不使用。那么,这时候我们的处理方式是:如果此函数对参数(也就是char*)的内容不修改的话,我们可以这样Connect((char*)UserID.c_str(), (char*)PassWD.c_str()),但是这时候是存在危险的,因为这样转换后的字符串其实是可以修改的(有兴趣地可以自己试一试),所以我强调除非函数调用的时候不对参数进行修改,否则必须拷贝到一个char*上去。当然,更稳妥的办法是无论什么情况都拷贝到一个char*上去。同时我们也祈祷现在仍然使用C字符串进行编程的高手们(说他们是高手一点儿也不为过,也许在我们还穿开裆裤的时候他们就开始编程了,哈哈…)写的函数都比较规范,那样我们就不必进行强制转换了。
2.3元素存取
我们可以使用下标操作符[]和函数at()对元素包含的字符进行访问。但是应该注意的是操作符[]并不检查索引是否有效(有效索引0~str.length()),如果索引失效,会引起未定义的行为。而at()会检查,如果使用at()的时候索引无效,会抛出out_of_range异常。
有一个例外不得不说,const string a;的操作符[]对索引值是a.length()仍然有效,其返回值是’\0’.其他的各种情况,a.length()索引都是无效的。举例如下:
const string Cstr("const string");
string Str("string");
Str[3]; //ok
Str.at(3); //ok
Str[100]; //未定义的行为
Str.at(100); //throw out_of_range
Str[Str.length()] //未定义行为
Cstr[Cstr.length()] //返回 ’\0’
Str.at(Str.length());//throw out_of_range
Cstr.at(Cstr.length()) throw out_of_range
我不赞成类似于下面的引用或指针赋值:
char& r=s[2];
char* p= &s[3];
因为一旦发生重新分配,r,p立即失效。避免的方法就是不使用。
2.4比较函数
C++字符串支持常见的比较操作符(>,>=,<,<=,==,!=),甚至支持string与C-string的比较(如 str<"hello")。在使用>,>=,<,<=这些操作符的时候是根据"当前字符特性"将字符按字典顺序进行逐一得比较。字典排序靠前的字符小,比较的顺序是从前向后比较,遇到不相等的字符就按这个位置上的两个字符的比较结果确定两个字符串的大小。同时,string("aaaa") 另一个功能强大的比较函数是成员函数compare()。他支持多参数处理,支持用索引值和长度定位子串来进行比较。他返回一个整数来表示比较结果,返回值意义如下:0-相等 〉0-大于 <0-小于。举例如下:
string s("abcd");
s.compare("abcd"); //返回0
s.compare("dcba"); //返回一个小于0的值
s.compare("ab"); //返回大于0的值
s.compare(s); //相等
s.compare(0,2,s,2,2); //用"ab"和"cd"进行比较 小于零
s.compare(1,2,"bcx",2); //用"bc"和"bc"比较。
怎么样?功能够全的吧!什么?还不能满足你的胃口?好吧,那等着,后面有更个性化的比较算法。先给个提示,使用的是STL的比较算法。什么?对STL一窍不通?靠,你重修吧!
2.5 更改内容
这在字符串的操作中占了很大一部分。
首先讲赋值,第一个赋值方法当然是使用操作符=,新值可以是string(如:s=ns) 、c_string(如:s="gaint")甚至单一字符(如:s=’j’)。还可以使用成员函数assign(),这个成员函数可以使你更灵活的对字符串赋值。还是举例说明吧:
s.assign(str); //不说
s.assign(str,1,3);//如果str是"iamangel" 就是把"ama"赋给字符串
s.assign(str,2,string::npos);//把字符串str从索引值2开始到结尾赋给s
s.assign("gaint"); //不说
s.assign("nico",5);//把’n’ ’I’ ’c’ ’o’ ’\0’赋给字符串
s.assign(5,’x’);//把五个x赋给字符串
把字符串清空的方法有三个:s="";s.clear();s.erase();(我越来越觉得举例比说话让别人容易懂!)。
string提供了很多函数用于插入(insert)、删除(erase)、替换(replace)、增加字符。
先说增加字符(这里说的增加是在尾巴上),函数有 +=、append()、push_back()。举例如下:
s+=str;//加个字符串
s+="my name is jiayp";//加个C字符串
s+=’a’;//加个字符
s.append(str);
s.append(str,1,3);//不解释了 同前面的函数参数assign的解释
s.append(str,2,string::npos)//不解释了
s.append("my name is jiayp");
s.append("nico",5);
s.append(5,’x’);
字符串操作是一个不小的主题,在标准C++中,string字符串类成为一个标准,之所以抛弃char*的字符串而选用C++标准程序库中的string类,是因为他和前者比较起来,不必担心内存是否足够、字符串长度等等,而且作为一个类出现,他集成的操作函数足以完成我们大多数情况下的需要。
下面我们首先从一些示例开始学习下string类的使用。
1)
#include
#include
using namespace std;
void main()
{
string s("hehe");
cout《s《endl;
cin.get();
}
2)
#include
#include
using namespace std;
void main()
{
char chs[] = "hehe";
string s(chs);
cout《s《endl;
cin.get();
}
3)
#include
#include
using namespace std;
void main()
{
char chs[] = "hehe";
string s(chs,1,3); //指定从chs的索引1开始,最后复制3个字节
cout《s《endl;
cin.get();
}
4)
#include
#include
using namespace std;
void main()
{
string s1("hehe");
string s2(s1);
cout《s2《endl;
cin.get();
}
5)
#include
#include
using namespace std;
void main()
{
string s1("hehe",2,3);
string s2(s1);
cout《s2《endl;
cin.get();
}
6)
#include
#include
using namespace std;
void main()
{
char chs[] = "hehe";
string s(chs,3); //将chs前3个字符作为初值构造
cout《s《endl;
cin.get();
}
7)
#include
#include
using namespace std;
void main()
{
string s(10,’k’); //分配10个字符,初值都是’k’
cout《s《endl;
cin.get();
}
//以上是string类实例的构造手段,都很简单。
9)
//赋新值
#include
#include
using namespace std;
void main()
{
string s(10,’k’); //分配10个字符,初值都是’k’
cout《s《endl;
s = "hehehehe";
cout《s《endl;
s.assign("kdje");
cout《s《endl;
s.assign("fkdhfkdfd",5); //重新分配指定字符串的前5的元素内容
cout《s《endl;
cin.get();
}
10)
//swap方法交换
#include
#include
using namespace std;
void main()
{
string s1 = "hehe";
string s2 = "gagaga";
cout《"s1 : "《s1《endl;
cout《"s2 : "《s2《endl;
s1.swap(s2);
cout《"s1 : "《s1《endl;
cout《"s2 : "《s2《endl;
cin.get();
}
11)
//+=,append(),push_back()在尾部添加字符
#include
#include
using namespace std;
void main()
{
string s = "hehe";
s += "gaga";
cout《s《endl;
s.append("嘿嘿"); //append()方法可以添加字符串
cout《s《endl;
s.push_back(’k’); //push_back()方法只能添加一个字符…
cout《s《endl;
cin.get();
}
12)
//insert() 插入字符。其实,insert运用好,与其他的插入操作是一样的。
#include
#include
using namespace std;
void main()
{
string s = "hehe";
s.insert(0,"头部"); //在头部插入
s.insert(s.size(),"尾部"); //在尾部插入
s.insert(s.size()/2,"中间");//在中间插入
cout《s《endl;
cin.get();
}
13)
#include
#include
using namespace std;
void main()
{
string s = "abcdefg";
s.erase(0,1); //从索引0到索引1,即删除掉了’a’
cout《s《endl;
//其实,还可以使用replace方法来执行删除操作
s.replace(2,3,"");//即将指定范围内的字符替换成"",即变相删除了
cout《s《endl;
cin.get();
}
14)
//clear() 删除全部字符
#include
#include
using namespace std;
void main()