题记:本系列学习笔记(C++ Primer学习笔记)主要目的是讨论一些容易被大家忽略或者容易形成错误认识的内容。只适合于有了一定的C++基础的读者(至少学完一本C++教程)。
作者: tyc611, 2007-01-21
本文主要讨论C++标准I/O库,主要内容为控制台输入输出流、文件流、字符串流。
如果文中有错误或遗漏之处,敬请指出,谢谢!
流介绍
标准I/O类的头文件
<iostream> |
包含istream、ostream、iostream这三个类。其中,iostream由istream和ostream派生而来。 |
<fstream> |
包含ifstream、ofstream、fstream这三个类。其中,ifstream由istream派生,ofstream由ostream派生,fstream由iostream派生。 |
<sstream> |
包含istringstream、ostringstream、stringstream这三个类。其中,istringstream由istream派生,ostringstream由ostream派生,stringstream由iostream派生。 |
C++标准库的流类完整关系图如下:(注意:我发现一个问题,下面的图在打开网页时有时显示模糊,显示的图比实际的小,有两种方法:一是多刷新几次就能刷出来;二是另外显示该图片^_^)
其中,typedef basic_ios<char, char_traits<char> > ios;
typedef basic_istream<char, char_traits<char> > istream;
typedef basic_ostream<char, char_traits<char> > ostream;
typedef basic_iostream<char, char_traits<char> > iostream;
typedef basic_istringstream<char> istringstream;
typedef basic_ostringstream<char> ostringstream;
typedef basic_stringstream<char> stringstream;
流状态
ios_base::iostate 机器相关的整型类型名,用于定义流状态。I/O标准库的基类ios中定义了四个为静态成员的该类型的标志位:
ios_base::badbit |
该标志位表示该I/O流发生了严重错误(常指物理破坏,没法修正) |
ios_base::eofbit |
该标志位表示该I/O流已经到达文件尾 |
ios_base::failbit |
该标志位表示该I/O流出现了失败的I/O操作 |
ios_base::goodbit |
该标志位表示该I/O流状态正常 |
注意:各标志位可以用|运算符连接起来;为了方便,可以用ios代替ios_base来使用这些标志位(标志位是ios_base的静态常量成员),后面内容中出现的ios_base也可以这样。
检测流状态:
ios::bad() |
如果流的badbit标志位被设置,则返回true;否则返回false |
ios::eof() |
如果流的eofbit标志位被设置,则返回true;否则返回false。如果eofbit被设置,那么failbit也将被设置。 |
ios::fail() |
如果流的failbit标志位被设置,则返回true;否则返回false |
ios::good() |
如果流的goodbit标志位被设置,则返回true;否则返回false。仅当bad(),eof(),fail()都返回 false时,good()才返回true。 |
除了可以直接调用流的这些成员函数进行流状态检测外,很多时候我们还可以把流对象直接用于布尔表达式中进行测试。例如:
int i;
while (cin >> i)
cout << i << endl;
在这种情况下,流到void*类型的转换operator void*()被隐式调用,然后再隐式转换为bool型。
为什么流类不直接定义一个到bool类型的隐式转换呢?这是因为这样做可能会引起错误。因为bool型可以隐式转换到int型,从而使流类对象可以隐式转换到int型,这样极容易引用错误。例如,原本打算输入“cin >> i”,但实际上却输入了“cin > i”,漏掉了一个“>”,如果有流对象到bool的隐式转换,那么“cin > i”语法上就是正确的,相当于最终两个int型的比较。显然,我们不希望这种情况下发生。另外,由于历史原因,bool型在最先的C++中是不存在的,所以转换到了void*类型。
设置/获取流状态:
ios_base::clear(state) |
将流s标志位设置为state,默认参数为goodbit |
ios_base::setstate(state) |
为流s添加指定的标志位state,原来的标志位仍然存在,相当于调用clear(state | rdstate()) |
ios_base::rdstate() |
返回流s的当前标志位 |
输出缓冲区的管理
下面几种情况将导致输出缓冲区中的内容被刷新到输出设备或文件:
1) 程序正常结束。作为main返回工作的一部分,将清空所有输出缓冲区;
2) 在一些不确定的时候,缓冲区可能已经满了。在这种情况下,缓冲区将会在写下一个值之前刷新;
3) 用操作符(manipulator)显式地刷新缓冲区,例如 endl,flush等;
4) 在每次输出操作执行后,用unitbuf操纵符设置流的内部状态,从而清空缓冲区;
5) 可将输出流与输入流关联(tie) 起来。在这种情况下,在读输入流时将刷新其关联的输出流缓冲区。
下面列举用于刷新缓冲区的操纵符:
endl操纵符 |
输出一个换行符,并刷新缓冲区 |
ends操纵符 |
输出一个空字符null,然后刷新缓冲区 |
flush操纵符 |
直接刷新缓冲区,不添加任何字符 |
unitbuf操纵符 |
它在每次执行完写操作后都刷新缓冲区 |
例如:
cout<<unitbuf<<"first"<<" second"<<nounitbuf;
等价于:
cout<<"first"<<flush<<" second"<<flush;
其中,nounitbuf操纵符将流恢复为使用正常的、由系统管理的缓冲区刷新方式。
将输入和输出关联起来,用tie函数实现:
basic_ostream<E, T> *tie() const;
basic_ostream<E, T> *tie(basic_ostream<E, T> *str);
tie函数可以由istream或ostream对象调用,使用一个指向ostream对象的指针形参。第一个函数返回上次存储的被关联的ostream对象指针,第二个函数设置新的关联对象,并返回上次关联的对象的指针。如果第二个函数的参数为0,则断开两个对象之间的关联。例如:
cin.tie(&cout); // tie cin and cout
ostream* old_tie = cin.tie();
cin.tie(0); // break tie between cin and cout
cin.tie(&err); // a new tie
cin.tie(old_tie); // restablish tie between cin and cout
文件流
如果文件流已经与一个指定的文件相关联,若要把该文件流与另一个文件关联,则必须先关闭(close)现在的文件,再打开(open)另一个文件。open函数会检查是否已经有文件被打开;如果有,则设置failbit标志位,以指示错误,并且此时对文件流的任何读写操作都会失败。此时,可以清除该标志,然后可以继续对前面的文件进行操作。
文件模式
ios_base::in |
读模式 |
ios_base::out |
写模式 |
ios_base::app |
追加模式 |
ios_base::ate |
打开文件后立即定位到文件尾 |
ios_base::trunc |
打开文件时清空文件内容(如果有的话) |
ios_base::binary |
以二进制模式打开文件 |
上面的标志位被声明为类ios_base的静态常量成员。其中,out、truc、app模式只能用于与ofstreamt和fstream对象关联的文件;in模式只能用于与ifstreamt和fstream对象关联的文件;ate和binary模式可以用于所有文件。
如果以binary模式打开文件,则文件流将以字节序列处理文件内容,不会对内容作任何解释;否则,默认用文本模式打开文件,不同的系统可能会对文件内容作一些解释转换。比如,在非UNIX系统如Windows系统中,换行符/n会被解释成回车换行/r/n到文件系统,/r/n会被解释成/n到内存。而在UNIX系统中,二进制模式和文本模式是没有区别的。
默认情况下,与ifstream流对象关联的文件将以in模式打开;与ofstream关联的文件则以out模式打开,并且以out模式打开的文件的内容会被清空(相当于同时也指定了trunc模式);与fstream关联的文件则以in和out模式打开。
如果打开与fstream关联的文件时,只用了out模式,而不指定in模式,则文件内容会被清空;如果指定了trunc模式,不论是否指定in模式,文件内容都会被清空。
文件模式的有效组合
out |
打开文件进行写操作,删除文件中已有数据;如果文件不存在,则创建文件。 |
app |
打开文件进行写操作,在文件尾追加数据;若文件是与ofstream流关联,那么,当文件不存在时创建文件;若是与fstream流关联,那么,当文件不存在时操作失败。
|
out | app |
追加数据;如果文件不存在,则创建文件。 |
out | trunc |
与out模式相同 |
in |
打开文件进行读操作
|
in | out |
打开文件进行读、写操作,并定位于文件形头处 |
in | out | trunc |
打开文件进行读、写操作,并且删除文件中已有数据 |
字符串流
字符串流(sstream)定义了一个以string对象为形参的构造函数。对sstream对象的读写操作实际上是对该对象中的string对象进行操作。
sstream类还定义了一个名为str()的成员,用来读取或设置sstream对象所操纵的string对象。
basic_string<E, T, A> str() const;
void str(basic_string<E, T, A>& x);
字符串流的通常用法
用来实现格式化数据输入输出,相当于C语言中的fscanf和fprintf函数的功能。例如:
int var1 = 5, var2 = 10; stringstream ss; ss<<"Var1: "<<var1<<" Var2: "<<var2; cout<<"SS<<: "<<ss.str()<<endl; var1 = var2 = 0; string dump; ss>>dump>>var1>>dump>>var2; cout<<"SS>>: Var1: "<<var1<<", Var2: "<<var2<<endl; |
流的格式化I/O
操纵符
<iostream>中定义的操纵符(带*号的表示是默认使用的)
boolalpha |
将真和假显示为字符串 |
*noboolalpha |
将真和假显示为1,0 |
showbase |
产生数的基数前缀 |
*noshowbase |
不产生数的基数前缀 |
showpoint |
总是显示小数噗 |
*noshowpoint |
有小数部分才显示小数点 |
showpos |
显示非负数中的+(0也显示+) |
*noshowpos |
不显示非负数中的+ |
uppercase |
在十六进制中打印0X,科学记数法中打印E |
*nouppercase |
在十六进制中打印0x,科学记数法中打印e |
*dec |
用十进制显示 |
hex |
用十六进制显示 |
oct |
用八进制显示 |
left |
在对齐,在值的右边增加填充字符 |
*right |
右对齐,在值的左边增加填充字符 |
internal |
两边对齐,在值和符号之间填充字符 |
fixed |
用小数形式显示浮点数 |
scientific |
用科学记数法显示浮点数 |
flush |
刷新ostream缓冲区 |
ends |
插入空字符,然后刷新ostream缓冲区 |
endl |
插入换行符,然后刷新ostream缓冲区 |
unitbuf |
在每个输出操作之后刷新缓冲区 |
*nounitbuf |
恢复常规缓冲区刷新 |
*skipws |
为输入操作符>>跳过空白字符(空格、制表位、换行) |
noskipws |
不为输入操作符跳过空白 |
ws |
“吃掉”空白 |
默认情况下,用于显示浮点数的记数法取决于数的大小:如果数很大或者很少,将按科学记数法显示;否则,使用固定位数的小数显示。
如果设置了scientific或者fixed,由于不存在相应的操纵符来恢复默认值,只能通过调用unsetf成员来取消scientific或fixed所做的改变:unsetf(ios_base::floatfield);(函数原型:void
unsetf(fmtflags mask);)
<iomanip>中定义的操纵符
setfill(char ch) |
设置ch为空白填充字符 |
setprecision(int n) |
将浮点精度设置为n |
setw(int w) |
读写w个字符的值 |
setbase(int b) |
按基数b输出整数,n取值为8、10、16;若为其它值,则基数为10 |
setiosflags(ios_base::fmtflags n) |
相当于调用setf(n) |
resetiosflags(ios_base::fmtflags n) |
清除由n代表的格式化标志 |
默认情况下,精度指定数字的总位数(小数点之前和之后),默认为6位。使用fixed或者scientific之后,精度指小数点之后的位数。
setw不改变流状态,只对后面的一个数据输出有效。其它操纵符改变流格式状态后,I/O流保留改变后的格式状态。
flag成员函数
ios类提供了flag成员函数用来设置和恢复流的格式状态(所有标志位),函数原型如下:
ios_base::fmtflags flags() const; // 返回流的当前格式状态
ios_base::fmtflags flags( ios_base::fmtflags fmtfl); // 设置流的格式状态
setf和unsetf成员函数
ios类提供了这两个成员函数用来设置或者取消某个标志位,其函数原型如下:
void setf( ios_base::fmtflags mask);
ios_base::fmtflags setf( ios_base::fmtflags fmtfl, fmtflags mask);
void unsetf( ios_base::fmtflags mask); // 清除指定标志位
其中,第一个setf版本适用于开关标志位,这些开关标志位有:
ios_base::boolalpha, ios_base::skipws, ios_base::showbase, ios_base::showpoint, ios_base::uppercase, ios_base::showpos, ios_base::unitbuf
第二个setf版本适用于格式化域标志位,一次只能设置这些标志中的一个。这些格式化域及其标志位如下:
ios_base::basefield: ios_base::dec, ios_base::hex, ios_base::oct
ios_base::floatfield: ios_base::scientific, ios_base::fixed
ios_base::adjustfield: ios_base::left, ios_base::right, ios_base::internal
例如,
s.setf(ios_base::boolalpha); // 设置布尔值显示为字符形式
s.seft(ios_base::scientific, ios_base::floatfield); // 设置小数输出形式为科学记数法
s.unsetf(ios_base::floatfield); // 清除floatfield域的标志位
其它成员函数
ios类还提供了其它几个成员函数来控制输出域格式,其函数原型如下:
int ios_base::width(); // 返回当前宽度,默认为0
int ios_base::width(int n); // 设置宽度
char ios::fill();
char ios::fill(char n);
int ios_base::precision();
int ios_base::precision(int n);
流的未格式化的输入输出操作
单字节操作
is.get(ch) |
将istream is的下一个字节放入字符ch中,返回is |
os.put(ch) |
将字节ch放入ostream os中,返回os |
is.get() |
返回is的下一字节作为一个int值 |
is.putback(ch) |
将字符ch放回is,返回is |
is.unget() |
将is退回一个字节,返回is |
is.peek() |
将下一字节作为int值返回但不移出它(不移动流缓冲区指针) |
一般而言,保证能够在下一次读之前放回最多一个值,也就是说,不保证能够连续调用putback或unget而恢复原来的流状态。
为什么get()和peek()要返回int型,而不是char型呢?原因是为了允许返回一个文件结束符。由于允许给定字符集使用char范围的每一个值来表示实际字符,因此,该范围中没有额外值用来表示文件结束符。相反,这些函数把字符转换为unsigned char,然后将那个值提升为int,因此,即使字符集有映射到负值的字符,从这些操作返回的值也将是一个正值。通过将文件结束符作为负值返回,标准库将保证文件结束符区别于任意合法字符值。
文件结束符EOF定义于<iostream>文件中,为一个为负值的const变量,用它来标志文件是否结束。例如:
int ch; // int, not char!
while ((ch = cin.get()) != EOF)
cout.put(ch);
多字节操作
is.get(buf, size, delim),其函数原型为: basic_istream& get(E *s, streamsize n, E delim = '/n'); |
从is中读入size个字节并将它们存储到buf所指向的空间中,返回is。当读操作遇到delim字符、或者文件结束符、或者已经读入了size个字节,那么读操作结束。如果遇到delim,它将被留在输入流中。 |
is.getline(buf, size, delim),其函数原型为:
basic_istream&
getline(E *s, streamsize n, E delim = '/n');
|
与上面的get行为相似,区别是读取并丢弃delim。 |
is.read(buf, size) |
读取size个字节到buf中,返回is |
is.gcount() |
返回最后一个未格式化读操作从流is中读到的字节数 |
os.write(buf, size) |
将size个字节从数组buf写到os,返回os |
is.ignore(size, delim) |
读并忽略size个字符,直到遇到delim,但不包括delim。size的默认参数为1,delim默认参数为文件结束符。 |
由于将字符放回流中的单字符操作也是未格式化输入操作,如果在调用gcount之前调用了peek、unget或者putback,则返回值是0。
举例:当输入缓冲区发生错误时,需要清空缓冲区时,可以这样做:
if (!cin) {
cin.clear();
cin.ignore(numeric_limits<int>::max(), '/n');
}
另外,需要注意的是使用低级I/O操作容易出错,提倡使用标准库的高级抽象。例如,返回int值的I/O操作就是一个很好的例子。
将get或其它返回int值的函数的返回值赋给char对象而不是int对象,是一个常见的错误。至于这种错误,具体在机器上发生什么行为,取决于机器和输入数据。例如,在将char实现为unsigned char的机器上,这是一个死循环:
char ch;
while ((ch = cin.get()) != EOF)
cou.put(ch);
这是因为,当get返回EOF的时候,那个值将被转换为unsigned char值,转换后的值不再等于EOF的整型值,形成死循环。
流的随机访问
I/O流提供了两个成员函数来实现随机访问:定位函数(seek)和查询函数(tell)。如下表所示:
seekg |
重新定位输入流中的读指针 |
tellg |
返回输入流中读指针的当前位置 |
seekp |
重新定位输出流中的写指针 |
tellp |
返回输出流中写指针的当前位置 |
注意:在每个流中(即使是可同时输入输出的流,如fstream),只有一个读(写)指针,标准库将g位置和p位置都映射到这个指针。所以,在读和写之间切换时,必须进行seek来重新定位标记。
另外,由于istream和ostream类型一般不支持随机访问,所以,流的随机访问只适用于fstream和sstream类型。
seekg和seekp均有两个重载版本,一个使用绝对地址,另一个使用相对偏移。其函数原型如下:
basic_istream& seekg(pos_type pos);
basic_istream& seekg(off_type off, ios_base::seek_dir way);
basic_ostream& seekp(pos_type pos);
basic_ostream& seekp(off_type off, ios_base::seek_dir way);
在上面的函数中,way参数有几个预定义取值:
ios_base::beg 表示流的开头
ios_base::cur 表示流的当前位置
ios_base::end 表示流的末尾
另外,seek_dir、pos_type和off_type均是ios_base类里面的类型。
下面是两个tell的函数原型:
pos_type tellg()
pos_type tellp();
流类和异常
除了手工检查流状态外,还可以利用异常机制来解决流类错误问题。流的成员函数exceptions()接受一个参数,这个参数用于表示程序员希望在哪个流状态标志位出现时抛出异常 。当流遇到这样的状态时,就抛出一个std::ios_base::failure类型的异常,其继承自std::exception。函数原型如下:
iostate exceptions() const;
iostate exceptions(iostate except);
如果文中有错误或遗漏之处,敬请指出,谢谢!
参考文献:
[1] C++ Primer(Edition 4)
[2] Thinking in C++(Volume Two, Edition 2)
[3] International Standard:ISO/IEC 14882:1998