从第一堂C语言课上的那个printf开始,格式化字符串就成了我的梦魇。此后我还在很多地方遇到过它们:fprintf,sscanf以及CString的Format成员函数……。除了能记住%s(String的缩写)代表字符串,%d(Decimal的缩写)代表整数之外,每次用到格式化字符串的地方我都要求助于MSDN。
直到我看到C++的字符串格式化方式后,我决定从此抛弃C的那套格式化字符串的方法。
在C++里格式化字符串,用到的最多的类是:ostringstream以及它的宽字符版本wostringstream。
话不多说,如果要将一个整数n格式化成字符串以便输出之用
CString的方式是这样的:
CStringstr;
str.Format(_T("%d"), n);
ostringstream的方式:
ostringstreamost;
ost<<n;
string str = ost.str();
抛开效率不谈,起码不用再去记%d代表整数,%f代表浮点数,当然还有更复杂的格式控制输出的那些%(此处省略200字……)。
稍微复杂一点,如果要将整数以16进制的格式输出(这个恐怕是整数输出中最常用的功能了)
ostringstreamost;
ost<<hex<<showbase<<255;
把一个字节序列以16进制的方式输出,最常见的情况比如16进制的方式输出MAC地址:
ost<<hex<<setfill('0');
ost<<setw(2)<<(int)x;
一定是输出一个int,否则无效。
如果以16进制大写的格式输出:
ostringstreamost;
ost<<hex<<showbase<<uppercase<<255;
可有时候希望以32位整数的方式来输出的时候,在前面通常要补上多个0,这时可以这样做:
ostringstreamost;
// 也许有更好的写法
ost<<"0X"<<hex<<uppercase<<setw(8)<<setfill('0')<<255;
比起格式化字符串来输入的字母更多,但我觉得这种以人话写出来的方式比较好记:)
对于浮点数,最长用的格式化功能莫过于在小数点后保留X位的做法。
比如在小数点后保留6位:
ostringstreamost;
// 将输出1234.567800
ost<<fixed<<setprecision(6)<<1234.5678;
保留3位
// 将输出1234.568,已经替我们做好了四舍五入
ost<<fixed<<setprecision(3)<<1234.5678;
实现机制
C++使用一种称为操控符的技术来控制格式化的输出。
经典的Hello World的C++版本大概是这样的:
std::cout<<"HelloWorld"<<endl; 这将在标准输出上输出Hello World后附带一个换行,并且刷新cout流。一个简单的endl包含了模板和运算符重载两个C++中极有分量的技术。
对endl的输出将引发下面这个重载了的<<运算符的调用(摘自VS2008的ostream文件):
_Myt& __CLR_OR_THIS_CALLoperator<<(_Myt& (__cdecl *_Pfn)(_Myt&))
...{ // call basic_ostreammanipulator
_DEBUG_POINTER(_Pfn);
return ((*_Pfn)(*this));
} 而endl正好满足了这个重载的运算符的参数的格式:
_CRTIMP2_PURE inline basic_ostream<char,char_traits<char>>&
__CLRCALL_OR_CDECL endl(basic_ostream<char,char_traits<char>>& _Ostr)
...{ // insert newline andflush byte stream
_Ostr.put(' ');
_Ostr.flush();
return (_Ostr);
} 这样:cout<<endl;就解释为在endl函数的内部对它的参数_Ostr,也就是cout输入一个换行符,然后刷新流。有点复杂吧:)
再来看个稍微复杂点的,看看语句ost<<setprecision(3)<<1234.5678;里的setprecision(3)到底是什么一个东东:
在iomanip.cpp里找到setprecision的函数定义:
_MRTIMP2 _Smanip<streamsize> __cdeclsetprecision(streamsizeprec)
...{ // manipulator to setprecision
return (_Smanip<streamsize>(&spfun, prec));
} 发现这个函数返回了一个_Smanip<streamsize>类型的对象。streamsize的类型是int,这里的prec肯定是传过来的3,那构造_Smanip<streamsize>对象时的另一个参数spfun是什么东西?
同样是在iomanip.cpp里,spfun函数定义如下:
static void__cdeclspfun(ios_base&iostr, streamsizeprec)
...{ // set precision
iostr.precision(prec);
} 发现在这个函数的内部,对流iostr调用了precesion函数。
运算符<<有这样一个重载的版本:
template<class _Elem,
class _Traits,
class _Arg> inline
basic_ostream<_Elem, _Traits>&__CLRCALL_OR_CDECL operator<<(
basic_ostream<_Elem, _Traits>&_Ostr, const _Smanip<_Arg>& _Manip)
...{ // insert by callingfunction with output stream and argument
(*_Manip._Pfun)(_Ostr, _Manip._Manarg);
return (_Ostr);
} 这样,第一个参数就是cout,而第二个参数就是setprecision函数返回的一个临时的_Smanip<streamsize>类型的对象。在<<运算符内部,如果(*_Manip._Pfun)(_Ostr,_Manip._Manarg);就是调用spfun函数并将cout和3传过去就好了!
Go on!看看_Manip._Pfun到底是什么东西:
// TEMPLATE STRUCT _Smanip
template<class _Arg>
struct _Smanip
...{ // store function pointerand argument value
_Smanip(void (__cdecl *_Left)(ios_base&, _Arg), _Arg _Val)
: _Pfun(_Left), _Manarg(_Val)
...{ // construct from functionpointer and argument value
}
void (__cdecl *_Pfun)(ios_base&, _Arg); // the function pointer
_Arg _Manarg; // the argumentvalue
}; 既然当初在setprecision函数里,传递的是spfun,那么_Pfun就是spfun函数的指针啦。OK,大功告成!C++的表现力很强大吧!
虽然绕了这么大一个弯子只不过为了调用一下cout.precision(3),那为什么不这样写?
cout.precision(3);
cout<<1234.5678;
显然写成一条语句ost<<fixed<<setprecision(3)<<1234.5678;逻辑上更有意义
ostringstream使用时的一个小技巧:
当用ostringstream格式化完毕后,通过调用它的str成员函数可以得到格式化后的字符串:
ostringstreamost;
// 格式化的工作
……
string str = ost.str();
如果接下来要继续在这个流对象上进行其它的格式化工作,那么要先清空ostringstream的缓存,传递一个空字符串就好。
ost.str("");
这是个GUI盛行的年代,从标准输入显得已经不那么重要了,但是从文件读入依然是个很重要的操作,可我一直都是用WinAPI进行文件的读写的,以后也许会再写一片与格式化输入有关的文章。