C99 有很多和 string 相关的函数,如 strcat , strchr , strcmp , strcpy , strlen , strncat , strncmp , strncpy 等。然而使用 C++ 编程时,所有和 string 相关的操作均可以使用 string 类的相关接口完成, string 提供和原来 C 接口类似的功能和性能,同时提供更高的安全性。
String 类有一个特性: a string of length n must manage a block of memory whose size is at least n + 1 。即长度为 n 的 string 对象,其内存空间至少为 n+1 个字符,且最后一个字符为 ’/0’ 。
不过在进行 string 操作时,有一点必须牢记: C/C++ 语言的 string 是以 ’/0’ 结尾的,对不以 ’/0’ 结尾的 string 进行操作容易引发错误,甚至导致内存溢出等 crash 。
C++ 的 string 类,除了用于处理常规 string 操作 外,其本身也可用于存储各种数据 ,如文件数据,此时并不要求 string 对象必须以 ’/0’ 结尾。使用者采用 string( const char* str, size_type length ); 来封装特定长度的 char* 数据块。 String 类的各种运算符将保证数据传递的完整性,即 string 对象。
示例:
#include <iostream>
using namespace std;
int main()
{
std::string str("test string");
cout<<str<<" "<<str.c_str()<<endl;
cout<<str.size()<<endl;
char* buf = new char[str.size()+1];
memset(buf, 0, sizeof(buf));
string test(buf, str.size()); // 封装非字符数据
cout<<test<<" "<<test.c_str()<<endl;
cout<<test.size()<<endl;
memcpy(buf, str.c_str(), str.size());
test = string(buf, str.size()); // 封装字符数据,并自动加上 ’/0’ 结束符
cout<<test<<" "<<test.c_str()<<endl;
cout<<test.size()<<endl;
return 0;
}
其输出:
test string test string
11
11
test string test string
11
说明:这个例子说明:当使用 string( const char* str, size_type length ); 来构造 string 对象时, string 对象的长度由外部指定,数据则来自 str ,如果 length 大于 str 地址范围,可能引发 crash!
这个例子也说明了 string 可用于封装数据,即使是 ’/0’ 的数据。因此, string 类可以用于存储各种数据,字符串、非字符串 ( 图片、视频 ) 等数据。
注意:将数据拷贝到内存时,不要使用 strcpy, 应该使用 memcpy ,因为 strcpy 、 strncpy 碰到 ’/0’ 将认为拷贝结束。 总之,不要使用和 str*** 相关的函数去操作内存数据,除非数据只能是 string(memcpy 完全可拷贝任何数据 ) 。
附录:
内存初始化函数 memset()
作用:在一段内存中填充某个给定的值,注意填充时是按照字节顺序填充的 ,而不是按照元素填充。
此方法是对较大的结构体和数组进行清零操作的一种有效方法。一般用于初始化大块的内存,此时 memset 远比 for 循环高效。
函数形式: memset(void *buffer, int c, size_t n)
buffer 是需要设置的内存的开始地址; c 是期望填充值; n 是需要填充的字节数。
例 1: 一个 int
a[10] 型变量,则 memset(a,100,sizeof(int)) 此操作后,元素 a[0] 的每个字节的值都是 100 ,即 0x64 ,二进制表示 :
01100100, 所以元素 a[0] 为 0x64646464 ,二进制表示 :01100100 01100100 01100100 01100100
void main()
{ int i,a[20];
memset(a,10,5*sizeof(int));
for(i=0;i<20;i++)
cout< 此函数输出的 10 个元素并非 10 ,而是每个字节都是 00001010 组成的 int 型数。
例 2:
#include
#include
void main( void )
{
char buffer[] = "This is a test of the memset function";
printf( "Before: %s/n", buffer );
memset( buffer, '*', 4 );
printf( "After: %s/n", buffer );
}
Output
Before: This is a test of the memset function
After: **** is a test of the memset function
Memset 用来对一段内存空间全部设置为某个字符,一般用在对定义的字符串进行初始化为 ' ' 或 '/0' ;
例 :char a[100];
memset(a, '/0', sizeof(a));
memset 可以方便地清空一个结构体类型的变量或数组。
如:
struct sample_struct
{
char csName[16];
int iSeq;
int iType;
};
对于变量
struct sample_strcut stTest;
一般情况下,清空 stTest 的方法:
stTest.csName[0]='/0';
stTest.iSeq=0;
stTest.iType=0;
用 memset 就非常方便:
memset(&stTest,0,sizeof(struct sample_struct));
如果是数组:
struct sample_struct TEST[10];
则 memset(TEST,0,sizeof(struct sample_struct)*10);
Memcpy 和 strcpy
原型:
void *memcpy( void *to, const void *from, size_t count );
char *strcpy( char *dest, const char *src );
memcpy 用来做内存拷贝,可拷贝任何数据类型的数据或对象。
例: char a[100],b[50]; memcpy(b, a, sizeof(b));
注意如果用 memcpy(b,a,sizeof(a)) ,很可能会造成 b 的内存地址溢出。
Strcpy 就只能拷贝字符串,它遇到 '/0' 就结束拷贝。
例: char a[100],b[50];strcpy(a,b); 如用 strcpy(b,a) ,要注意 a 中的字符串长度(第一个‘ /0 ’之前)是否超过 50 位,如超过,则会造成 b 的内存地址溢出。
Strcpy 有可指定拷贝个数的版本: char *strncpy( char *to, const char *from, size_t count );
总结:
strcpy
源字串全部拷贝到目标字串中 , 包括 '/0' ,但是程序员必须保证目标串长度足够,且不与源串重叠。
strncpy
如果目标长 >= 指定长 > 源长,则将源串全部拷贝到目标串,连同 '/0'
如果指定长 < 源长,则将截取源串中按指定长度拷贝到目标字符串,不包括 '/0'
如果指定长 > 目标长,错误 !
注意:说明: src 和 dest 所指内存区域不可以重叠且 dest 必须有足够的空间来容纳 src 的字符串。对于 memcpy 也是同样的限制。如果拷贝区域有重叠,请使用 memmove().