C++ Primer学习笔记——$8 标准I/O库

题记:本系列学习笔记(C++ Primer学习笔记)主要目的是讨论一些容易被大家忽略或者容易形成错误认识的内容。只适合于有了一定的C++基础的读者(至少学完一本C++教程)。

 
作者: tyc611, 2007-01-21
   本文主要讨论C++标准I/O库,主要内容为控制台输入输出流、文件流、字符串流。
   如果文中有错误或遗漏之处,敬请指出,谢谢!
流介绍
标准I/O类的头文件
 
 <iostream>  包含istream、ostream、iostream这三个类。其中,iostream由istream和ostream派生而来。
 <fstream>  包含ifstream、ofstream、fstream这三个类。其中,ifstream由istream派生,ofstream由ostream派生,fstream由iostream派生。
 <sstream>  包含istringstream、ostringstream、stringstream这三个类。其中,istringstream由istream派生,ostringstream由ostream派生,stringstream由iostream派生。

 注意:标准库I/O对象不允许拷贝或赋值。

   C++标准库的流类完整关系图如下:(注意:我发现一个问题,下面的图在打开网页时有时显示模糊,显示的图比实际的小,有两种方法:一是多刷新几次就能刷出来;二是另外显示该图片^_^)

   其中,typedef basic_ios<char, char_traits<char> > ios;
        typedef basic_istream<char, char_traits<char> > istream;
        typedef basic_ostream<char, char_traits<char> > ostream;
        typedef basic_iostream<char, char_traits<char> > iostream;
        typedef basic_istringstream<char> istringstream;
        typedef basic_ostringstream<char> ostringstream;
        typedef basic_stringstream<char> stringstream;

流状态
 
   ios_base::iostate  机器相关的整型类型名,用于定义流状态。I/O标准库的基类ios中定义了四个为静态成员的该类型的标志位:

 ios_base::badbit  该标志位表示该I/O流发生了严重错误(常指物理破坏,没法修正)
 ios_base::eofbit  该标志位表示该I/O流已经到达文件尾
 ios_base::failbit  该标志位表示该I/O流出现了失败的I/O操作
 ios_base::goodbit  该标志位表示该I/O流状态正常
 
注意:各标志位可以用|运算符连接起来;为了方便,可以用ios代替ios_base来使用这些标志位(标志位是ios_base的静态常量成员),后面内容中出现的ios_base也可以这样。

 
检测流状态:

 ios::bad()  如果流的badbit标志位被设置,则返回true;否则返回false
 ios::eof()  如果流的eofbit标志位被设置,则返回true;否则返回false。如果eofbit被设置,那么failbit也将被设置。
 ios::fail()  如果流的failbit标志位被设置,则返回true;否则返回false
 ios::good()  如果流的goodbit标志位被设置,则返回true;否则返回false。仅当bad(),eof(),fail()都返回 false时,good()才返回true。

   除了可以直接调用流的这些成员函数进行流状态检测外,很多时候我们还可以把流对象直接用于布尔表达式中进行测试。例如:
   int i;
   while (cin >> i)
      cout << i << endl;
在这种情况下,流到void*类型的转换operator void*()被隐式调用,然后再隐式转换为bool型。

   为什么流类不直接定义一个到bool类型的隐式转换呢?这是因为这样做可能会引起错误。因为bool型可以隐式转换到int型,从而使流类对象可以隐式转换到int型,这样极容易引用错误。例如,原本打算输入“cin >> i”,但实际上却输入了“cin > i”,漏掉了一个“>”,如果有流对象到bool的隐式转换,那么“cin > i”语法上就是正确的,相当于最终两个int型的比较。显然,我们不希望这种情况下发生。另外,由于历史原因,bool型在最先的C++中是不存在的,所以转换到了void*类型。

设置/获取流状态:
    

 ios_base::clear(state)   将流s标志位设置为state,默认参数为goodbit
 ios_base::setstate(state)  为流s添加指定的标志位state,原来的标志位仍然存在,相当于调用clear(state | rdstate())
 ios_base::rdstate()  返回流s的当前标志位

输出缓冲区的管理
 
   下面几种情况将导致输出缓冲区中的内容被刷新到输出设备或文件:
   1) 程序正常结束。作为main返回工作的一部分,将清空所有输出缓冲区;
   2) 在一些不确定的时候,缓冲区可能已经满了。在这种情况下,缓冲区将会在写下一个值之前刷新;
   3) 用操作符(manipulator)显式地刷新缓冲区,例如 endl,flush等;
   4) 在每次输出操作执行后,用unitbuf操纵符设置流的内部状态,从而清空缓冲区;
   5) 可将输出流与输入流关联(tie) 起来。在这种情况下,在读输入流时将刷新其关联的输出流缓冲区。
 
下面列举用于刷新缓冲区的操纵符:

 endl操纵符  输出一个换行符,并刷新缓冲区
 ends操纵符  输出一个空字符null,然后刷新缓冲区
 flush操纵符  直接刷新缓冲区,不添加任何字符
 unitbuf操纵符  它在每次执行完写操作后都刷新缓冲区

   例如:
      cout<<unitbuf<<"first"<<" second"<<nounitbuf;
   等价于:
      cout<<"first"<<flush<<" second"<<flush;
   其中,nounitbuf操纵符将流恢复为使用正常的、由系统管理的缓冲区刷新方式。
 
   将输入和输出关联起来,用tie函数实现:
      basic_ostream<E, T> *tie() const;
      basic_ostream<E, T> *tie(basic_ostream<E, T> *str);

   tie函数可以由istream或ostream对象调用,使用一个指向ostream对象的指针形参。第一个函数返回上次存储的被关联的ostream对象指针,第二个函数设置新的关联对象,并返回上次关联的对象的指针。如果第二个函数的参数为0,则断开两个对象之间的关联。例如:
   cin.tie(&cout);      // tie cin and cout
   ostream* old_tie = cin.tie();
   cin.tie(0);          // break tie between cin and cout
   cin.tie(&err);       // a new tie
   cin.tie(old_tie);    // restablish tie between cin and cout
 
文件流
 
   如果文件流已经与一个指定的文件相关联,若要把该文件流与另一个文件关联,则必须先关闭(close)现在的文件,再打开(open)另一个文件。open函数会检查是否已经有文件被打开;如果有,则设置failbit标志位,以指示错误,并且此时对文件流的任何读写操作都会失败。此时,可以清除该标志,然后可以继续对前面的文件进行操作。

文件模式

 ios_base::in  读模式
 ios_base::out  写模式
 ios_base::app  追加模式
 ios_base::ate  打开文件后立即定位到文件尾
 ios_base::trunc  打开文件时清空文件内容(如果有的话)
 ios_base::binary  以二进制模式打开文件


   上面的标志位被声明为类ios_base的静态常量成员。其中,out、truc、app模式只能用于与ofstreamt和fstream对象关联的文件;in模式只能用于与ifstreamt和fstream对象关联的文件;ate和binary模式可以用于所有文件。

   如果以binary模式打开文件,则文件流将以字节序列处理文件内容,不会对内容作任何解释;否则,默认用文本模式打开文件,不同的系统可能会对文件内容作一些解释转换。比如,在非UNIX系统如Windows系统中,换行符/n会被解释成回车换行/r/n到文件系统,/r/n会被解释成/n到内存。而在UNIX系统中,二进制模式和文本模式是没有区别的。

   默认情况下,与ifstream流对象关联的文件将以in模式打开;与ofstream关联的文件则以out模式打开,并且以out模式打开的文件的内容会被清空(相当于同时也指定了trunc模式);与fstream关联的文件则以in和out模式打开。
 
   如果打开与fstream关联的文件时,只用了out模式,而不指定in模式,则文件内容会被清空;如果指定了trunc模式,不论是否指定in模式,文件内容都会被清空。
 
文件模式的有效组合

 out  打开文件进行写操作,删除文件中已有数据;如果文件不存在,则创建文件。
 app  打开文件进行写操作,在文件尾追加数据;若文件是与ofstream流关联,那么,当文件不存在时创建文件;若是与fstream流关联,那么,当文件不存在时操作失败。
 out | app  追加数据;如果文件不存在,则创建文件。
 out | trunc  与out模式相同
 in  打开文件进行读操作
 in | out  打开文件进行读、写操作,并定位于文件形头处
 in | out | trunc  打开文件进行读、写操作,并且删除文件中已有数据

字符串流
 
   字符串流(sstream)定义了一个以string对象为形参的构造函数。对sstream对象的读写操作实际上是对该对象中的string对象进行操作。
 
   sstream类还定义了一个名为str()的成员,用来读取或设置sstream对象所操纵的string对象。
      basic_string<E, T, A> str() const;    
      void str(basic_string<E, T, A>& x);
 
字符串流的通常用法

   用来实现格式化数据输入输出,相当于C语言中的fscanf和fprintf函数的功能。例如:
 

int var1 = 5, var2 = 10;
stringstream ss;
ss<<"Var1: "<<var1<<" Var2: "<<var2;
cout<<"SS<<: "<<ss.str()<<endl;
var1 = var2 = 0;
string dump;
ss>>dump>>var1>>dump>>var2;
cout<<"SS>>: Var1: "<<var1<<", Var2: "<<var2<<endl;

 

流的格式化I/O
操纵符
 
<iostream>中定义的操纵符(带*号的表示是默认使用的)

 boolalpha  将真和假显示为字符串
*noboolalpha  将真和假显示为1,0
 showbase  产生数的基数前缀
*noshowbase  不产生数的基数前缀
 showpoint  总是显示小数噗
*noshowpoint   有小数部分才显示小数点
 showpos  显示非负数中的+(0也显示+)
*noshowpos   不显示非负数中的+
 uppercase  在十六进制中打印0X,科学记数法中打印E
*nouppercase   在十六进制中打印0x,科学记数法中打印e
*dec  用十进制显示
 hex  用十六进制显示
 oct  用八进制显示
 left  在对齐,在值的右边增加填充字符
*right  右对齐,在值的左边增加填充字符
 internal  两边对齐,在值和符号之间填充字符
 fixed  用小数形式显示浮点数
 scientific  用科学记数法显示浮点数
 flush  刷新ostream缓冲区
 ends  插入空字符,然后刷新ostream缓冲区
 endl  插入换行符,然后刷新ostream缓冲区
 unitbuf  在每个输出操作之后刷新缓冲区
*nounitbuf  恢复常规缓冲区刷新
*skipws  为输入操作符>>跳过空白字符(空格、制表位、换行)
 noskipws  不为输入操作符跳过空白
 ws  “吃掉”空白

   默认情况下,用于显示浮点数的记数法取决于数的大小:如果数很大或者很少,将按科学记数法显示;否则,使用固定位数的小数显示。
 
   如果设置了scientific或者fixed,由于不存在相应的操纵符来恢复默认值,只能通过调用unsetf成员来取消scientific或fixed所做的改变:unsetf(ios_base::floatfield);(函数原型:void unsetf(fmtflags mask);)
 
<iomanip>中定义的操纵符
 
 setfill(char ch)  设置ch为空白填充字符
 setprecision(int n)  将浮点精度设置为n
 setw(int w)  读写w个字符的值
 setbase(int b)  按基数b输出整数,n取值为8、10、16;若为其它值,则基数为10
 setiosflags(ios_base::fmtflags n)  相当于调用setf(n)
 resetiosflags(ios_base::fmtflags n)  清除由n代表的格式化标志

   默认情况下,精度指定数字的总位数(小数点之前和之后),默认为6位。使用fixed或者scientific之后,精度指小数点之后的位数。

 
   setw不改变流状态,只对后面的一个数据输出有效。其它操纵符改变流格式状态后,I/O流保留改变后的格式状态。
 
flag成员函数
 
   ios类提供了flag成员函数用来设置和恢复流的格式状态(所有标志位),函数原型如下:
      ios_base::fmtflags flags() const;                    // 返回流的当前格式状态
      ios_base::fmtflags flags( ios_base::fmtflags fmtfl);  // 设置流的格式状态
 
setf和unsetf成员函数
 
   ios类提供了这两个成员函数用来设置或者取消某个标志位,其函数原型如下:
      void setf( ios_base::fmtflags mask);
      ios_base::fmtflags setf( ios_base::fmtflags fmtfl, fmtflags mask);
      void unsetf( ios_base::fmtflags mask);    // 清除指定标志位
 
其中,第一个setf版本适用于开关标志位,这些开关标志位有:
   ios_base::boolalpha, ios_base::skipws, ios_base::showbase, ios_base::showpoint, ios_base::uppercase, ios_base::showpos,  ios_base::unitbuf
   第二个setf版本适用于格式化域标志位,一次只能设置这些标志中的一个。这些格式化域及其标志位如下:
   ios_base::basefield:   ios_base::dec, ios_base::hex, ios_base::oct
   ios_base::floatfield:  ios_base::scientific, ios_base::fixed
   ios_base::adjustfield: ios_base::left, ios_base::right, ios_base::internal
 
   例如,
      s.setf(ios_base::boolalpha);                   // 设置布尔值显示为字符形式
      s.seft(ios_base::scientific, ios_base::floatfield); // 设置小数输出形式为科学记数法
      s.unsetf(ios_base::floatfield);                // 清除floatfield域的标志位
 
其它成员函数
  
   ios类还提供了其它几个成员函数来控制输出域格式,其函数原型如下:
      int ios_base::width();              // 返回当前宽度,默认为0
      int ios_base::width(int n);         // 设置宽度
      char ios::fill();
      char ios::fill(char n);
      int ios_base::precision();
      int ios_base::precision(int n);
流的未格式化的输入输出操作
单字节操作
 
 is.get(ch)  将istream is的下一个字节放入字符ch中,返回is
 os.put(ch)  将字节ch放入ostream os中,返回os
 is.get()  返回is的下一字节作为一个int值
 is.putback(ch)  将字符ch放回is,返回is
 is.unget()  将is退回一个字节,返回is
 is.peek()  将下一字节作为int值返回但不移出它(不移动流缓冲区指针)
 
   一般而言,保证能够在下一次读之前放回最多一个值,也就是说,不保证能够连续调用putback或unget而恢复原来的流状态。
 
   为什么get()和peek()要返回int型,而不是char型呢?原因是为了允许返回一个文件结束符。由于允许给定字符集使用char范围的每一个值来表示实际字符,因此,该范围中没有额外值用来表示文件结束符。相反,这些函数把字符转换为unsigned char,然后将那个值提升为int,因此,即使字符集有映射到负值的字符,从这些操作返回的值也将是一个正值。通过将文件结束符作为负值返回,标准库将保证文件结束符区别于任意合法字符值。 文件结束符EOF定义于<iostream>文件中,为一个为负值的const变量,用它来标志文件是否结束。例如:
   int ch;   // int, not char!
   while ((ch = cin.get()) != EOF)
      cout.put(ch);
 
多字节操作
 
 is.get(buf, size, delim),其函数原型为:
 basic_istream& get(E *s, streamsize n, E delim = '/n');
 从is中读入size个字节并将它们存储到buf所指向的空间中,返回is。当读操作遇到delim字符、或者文件结束符、或者已经读入了size个字节,那么读操作结束。如果遇到delim,它将被留在输入流中。
 is.getline(buf, size, delim),其函数原型为:
basic_istream& getline(E *s, streamsize n, E delim = '/n');
 与上面的get行为相似,区别是读取并丢弃delim。
 is.read(buf, size)  读取size个字节到buf中,返回is
 is.gcount()  返回最后一个未格式化读操作从流is中读到的字节数
 os.write(buf, size)  将size个字节从数组buf写到os,返回os
 is.ignore(size, delim)  读并忽略size个字符,直到遇到delim,但不包括delim。size的默认参数为1,delim默认参数为文件结束符。
 
   由于将字符放回流中的单字符操作也是未格式化输入操作,如果在调用gcount之前调用了peek、unget或者putback,则返回值是0。
 
   举例:当输入缓冲区发生错误时,需要清空缓冲区时,可以这样做:
        if (!cin) {
            cin.clear();
            cin.ignore(numeric_limits<int>::max(), '/n');
        }
   另外,需要注意的是使用低级I/O操作容易出错,提倡使用标准库的高级抽象。例如,返回int值的I/O操作就是一个很好的例子。
 
   将get或其它返回int值的函数的返回值赋给char对象而不是int对象,是一个常见的错误。至于这种错误,具体在机器上发生什么行为,取决于机器和输入数据。例如,在将char实现为unsigned char的机器上,这是一个死循环:
   char ch;
   while ((ch = cin.get()) != EOF)
      cou.put(ch);
这是因为,当get返回EOF的时候,那个值将被转换为unsigned char值,转换后的值不再等于EOF的整型值,形成死循环。
流的随机访问
   I/O流提供了两个成员函数来实现随机访问:定位函数(seek)和查询函数(tell)。如下表所示:
  
  
  
  
 seekg  重新定位输入流中的读指针
 tellg  返回输入流中读指针的当前位置
 seekp  重新定位输出流中的写指针
 tellp  返回输出流中写指针的当前位置
注意:在每个流中(即使是可同时输入输出的流,如fstream),只有一个读(写)指针,标准库将g位置和p位置都映射到这个指针。所以,在读和写之间切换时,必须进行seek来重新定位标记。
 
   另外,由于istream和ostream类型一般不支持随机访问,所以,流的随机访问只适用于fstream和sstream类型。
 
   seekg和seekp均有两个重载版本,一个使用绝对地址,另一个使用相对偏移。其函数原型如下:
      basic_istream& seekg(pos_type pos);
      basic_istream& seekg(off_type off, ios_base::seek_dir way);
      basic_ostream& seekp(pos_type pos);
      basic_ostream& seekp(off_type off, ios_base::seek_dir way);
 
   在上面的函数中,way参数有几个预定义取值:
      ios_base::beg    表示流的开头
      ios_base::cur    表示流的当前位置
      ios_base::end    表示流的末尾
   另外,seek_dir、pos_type和off_type均是ios_base类里面的类型。
  
   下面是两个tell的函数原型:
      pos_type tellg()
      pos_type tellp();
 
流类和异常
   除了手工检查流状态外,还可以利用异常机制来解决流类错误问题。流的成员函数exceptions()接受一个参数,这个参数用于表示程序员希望在哪个流状态标志位出现时抛出异常 。当流遇到这样的状态时,就抛出一个std::ios_base::failure类型的异常,其继承自std::exception。函数原型如下:
   iostate exceptions() const;
   iostate exceptions(iostate except);
 
如果文中有错误或遗漏之处,敬请指出,谢谢!
 
参考文献:
[1] C++ Primer(Edition 4)
[2] Thinking in C++(Volume Two, Edition 2)
[3] International Standard:ISO/IEC 14882:1998

你可能感兴趣的:(C++ Primer学习笔记——$8 标准I/O库)