printf()详解之终极无惑

1.printf()简介

printf()是C语言标准库函数,用于将格式化后的字符串输出到标准输出。标准输出,即标准输出文件,对应终端的屏幕。printf()申明于头文件stdio.h。

函数原型:

int printf ( const char * format, ... );
  • 1

返回值:
正确返回输出的字符总数,错误返回负值,与此同时,输入输出流错误标志将被置值,可由指示器ferror来检查输入输出流的错误标志。

调用格式:
printf()函数的调用格式为:printf("格式化字符串",输出表列)

格式化字符串包含三种对象,分别为:
(1)字符串常量;
(2)格式控制字符串;
(3)转义字符。
字符串常量原样输出,在显示中起提示作用。输出表列中给出了各个输出项,要求格式控制字符串和各输出项在数量和类型上应该一一对应。其中格式控制字符串是以%开头的字符串,在%后面跟有各种格式控制符,以说明输出数据的类型、宽度、精度等。

注:本文的所有示例代码均在Linux环境下以g++ 4.4.6编译成64位程序的执行。

2.格式控制字符串详解

printf的格式控制字符串组成如下:

%[flags][width][.prec][length]type
  • 1

分别为:

%[标志][最小宽度][.精度][类型长度]类型。
  • 1

2.1类型(type)

首先说明类型,因为类型是格式控制字符串的重中之重,是必不可少的组成部分,其它的选项都是可选的。type用于规定输出数据的类型,含义如下:

字符 对应数据类型 含义 示例
d/i int 输出十进制有符号32bits整数,i是老式写法 printf("%i",123);输出123
o unsigned int 无符号8进制(octal)整数(不输出前缀0) printf("0%o",123);输出0173
u unsigned int 无符号10进制整数 printf("%u",123);输出123
x/X unsigned int 无符号16进制整数,x对应的是abcdef,X对应的是ABCDEF(不输出前缀0x) printf("0x%x 0x%X",123,123);输出0x7b 0x7B
f/lf float(double) 单精度浮点数用f,双精度浮点数用lf(printf可混用,但scanf不能混用) printf("%.9f %.9lf",0.000000123,0.000000123);输出0.000000123 0.000000123。注意指定精度,否则printf默认精确到小数点后六位
e/E float(double) 科学计数法,使用指数(Exponent)表示浮点数,此处”e”的大小写代表在输出时“e”的大小写 printf("%e %E",0.000000123,0.000000123);输出1.230000e-07 1.230000E-07
g float(double) 根据数值的长度,选择以最短的方式输出,%f或%e printf("%g %g",0.000000123,0.123);输出1.23e-07 0.123
G float(double) 根据数值的长度,选择以最短的方式输出,%f或%E printf("%G %G",0.000000123,0.123);输出1.23E-07 0.123
c char 字符型。可以把输入的数字按照ASCII码相应转换为对应的字符 printf("%c\n",64)输出A
s char* 字符串。输出字符串中的字符直至字符串中的空字符(字符串以空字符’\0‘结尾) printf("%s","测试test");输出:测试test
S wchar_t* 宽字符串。输出字符串中的字符直至字符串中的空字符(宽字符串以两个空字符’\0‘结尾) setlocale(LC_ALL,"zh_CN.UTF-8");
wchar_t wtest[]=L"测试Test";
printf("%S\n",wtest);
输出:测试test
p void* 以16进制形式输出指针 printf("%010p","lvlv");输出:0x004007e6
n int* 什么也不输出。%n对应的参数是一个指向signed int的指针,在此之前输出的字符数将存储到指针所指的位置 int num=0;
printf("lvlv%n",&num);
printf("num:%d",num);
输出:lvlvnum:4
% 字符% 输出字符‘%’(百分号)本身 printf("%%");输出:%
m 打印errno值对应的出错内容 printf("%m\n");
a/A float(double) 十六进制p计数法输出浮点数,a为小写,A为大写 printf("%a %A",15.15,15.15);输出:0x1.e4ccccccccccdp+3 0X1.E4CCCCCCCCCCDP+3

注意:
(1)使用printf输出宽字符时,需要使用setlocale指定本地化信息并同时指明当前代码的编码方式。除了使用%S,还可以使用%ls。
(2)%a和%A是C99引入的格式化类型,采用十六进制p计数法输出浮点数。p计数法类似E科学计数法,但不同。数以0x开头,然后是16进制浮点数部分,接着是p后面是以 2为底的阶码。以上面输出的15.15为例,推算输出结果。15.15转换成二进制为1111.00 1001 1001 1001 1001 ...,因为二进制表示数值的离散特点,计算机对于小数有时是不能精确表示的,比如0.5可以精确表示为0.12,而0.15却不能精确表示。将15.15对应的二进制右移三位,为1.1110 0100 1100 1100 1100 ...转换对应的十六进制就是0x1.e4ccccccccccd,注意舍入时向高位进了1位。由于右移三位,所以二进制阶码就是3。最后的结果就是0x1.e4ccccccccccdp+3。

(3)格式控制字符串除了指明输出的数据类型,还可以包含一些其它的可选的格式说明,依序有 flags, width, .precision and length。下面一一讲解。

2.2标志(flags)

flags规定输出样式,取值和含义如下:

字符 名称 说明
- 减号 结果左对齐,右边填空格。默认是右对齐,左边填空格。
+ 加号 输出符号(正号或负号)
space 空格 输出值为正时加上空格,为负时加上负号
# 井号 type是o、x、X时,增加前缀0、0x、0X。
type是a、A、e、E、f、g、G时,一定使用小数点。默认的,如果没有小数部分则不输出小数点。
type是g、G时,尾部的0保留。
0 数字零 将输出的前面补上0,直到占满指定列宽为止(不可以搭配使用“-”)


示例:

printf("%5d\n",1000);           //默认右对齐,左边补空格
printf("%-5d\n",1000); //左对齐,右边补空格 printf("%+d %+d\n",1000,-1000); //输出正负号 printf("% d % d\n",1000,-1000); //正号用空格替代,负号输出 printf("%x %#x\n",1000,1000); //输出0x printf("%.0f %#.0f\n",1000.0,1000.0)//当小数点后没有值时依然输出小数点 printf("%g %#g\n",1000.0,1000.0); //保留小数点后后的0 printf("%05d\n",1000); //前面补0
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

输出结果为:
这里写图片描述

2.3输出最小宽度(width)

用十进制整数来表示输出的最少位数。若实际位数多于指定的宽度,则按实际位数输出,若实际位数少于定义的宽度则补以空格或0。width的可能取值如下:

width 描述 示例
数值 十进制整数 printf("%06d",1000);输出:001000
* 星号。不显示指明输出最小宽度,而是以星号代替,在printf的输出参数列表中给出 printf("%0*d",6,1000);输出:001000

2.4精度(.precision)

精度格式符以“.”开头,后跟十进制整数。可取值如下:

.precision 描述
.数值 十进制整数。
(1)对于整型(d,i,o,u,x,X),precision表示输出的最小的数字个数,不足补前导零,超过不截断。
(2)对于浮点型(a, A, e, E, f ),precision表示小数点后数值位数,默认为六位,不足补后置0,超过则截断。
(3)对于类型说明符g或G,表示可输出的最大有效数字。
(4)对于字符串(s),precision表示最大可输出字符数,不足正常输出,超过则截断。
precision不显示指定,则默认为0
.* 以星号代替数值,类似于width中的*,在输出参数列表中指定精度。


示例:

printf("%.8d\n",1000);  //不足指定宽度补前导0,效果等同于%06d
printf("%.8f\n",1000.123456789); //超过精度,截断 printf("%.8f\n",1000.123456); //不足精度,补后置0 printf("%.8g\n",1000.123456); //最大有效数字为8位 printf("%.8s\n",“abcdefghij”); //超过指定长度截断
  • 1
  • 2
  • 3
  • 4
  • 5

输出结果:

00001000
1000.12345679
1000.12345600
1000.1235
abcdefgh
  • 1
  • 2
  • 3
  • 4
  • 5

注意,在对浮点数和整数截断时,存在四舍五入。

2.5类型长度(length)

类型长度指明待输出数据的长度。因为相同类型可以有不同的长度,比如整型有16bits的short int,32bits的int,也有64bits的long int,浮点型有32bits的单精度float和64bits的双精度double。为了指明同一类型的不同长度,于是乎,类型长度(length)应运而生,成为格式控制字符串的一部分。

因为Markdown表格不支持单元格合并,背景颜色等样式,所以直接引用printf.C++ reference的表格。
这里写图片描述

注意:黄色背景行标识的类型长度说明符和相应的数据类型是C99引入的。

示例代码:

printf("%hhd\n",'A');       //输出有符号char printf("%hhu\n",'A'+128); //输出无符号char printf("%hd\n",32767); //输出有符号短整型short int printf("%hu\n",65535); //输出无符号短整型unsigned short int printf("%ld\n",0x7fffffffffffffff); //输出有符号长整型long int printf("%lu\n",0xffffffffffffffff); //输出有符号长整型unsigned long int

输出结果:

65
193
32767
65535
9223372036854775807
18446744073709551615
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

注意:
long int到底是32bits还是64bits跟生成的程序是32bits还是64bits一一对应,如果使用g++编译程序的话,可通过-m32-m64选项分别生成32bits和64bits的程序。因本人测试代码编译生成的是64bits的程序,所以long int也就是64btis。

3.转义字符

转义字符在字符串中会被自动转换为相应操作命令。printf()使用的常见转义字符如下:

转义字符 意义
\a 警报(响铃)符
\b 回退符
\f 换页符
\n 换行符
\r 回车符
\t 横向制表符
\v 纵向制表符
\\ 反斜杠
\” 双引号

4.关于printf缓冲

在printf的实现中,在调用write之前先写入IO缓冲区,这是一个用户空间的缓冲。系统调用是软中断,频繁调用,需要频繁陷入内核态,这样的效率不是很高,而printf实际是向用户空间的IO缓冲写,在满足条件的情况下才会调用write系统调用,减少IO次数,提高效率。

printf在glibc中默认为行缓冲,遇到一下几种情况会刷新缓冲区,输出内容:
(1)缓冲区填满;
(2)写入的字符中有换行符\n或回车符\r
(3)调用fflush手动刷新缓冲区;
(4)调用scanf要从输入缓冲区中读取数据时,也会将输出缓冲区内的数据刷新。

可使用setbuf(stdout,NULL)关闭行缓冲,或者setbuf(stdout,uBuff)设置新的缓冲区,uBuff为自己指定的缓冲区。也可以使用setvbuf(stdout,NULL,_IOFBF,0);来改变标准输出为全缓冲。全缓冲与行缓冲的区别在于遇到换行符不刷新缓冲区。

printf在VC++中默认关闭缓冲区,且只能设置全缓冲。输出时会及时的输到屏幕[3]。因为微软闭源,所以无法研究printf函数的实现源码。

Linux和Windows下的缓冲区管理可见:C的全缓冲、行缓冲和无缓冲。

5.小结

耗时将近两天,终于完成了此篇看似基础,但却纷繁复杂的printf()用法。由于时间和个人水平有限,文章不足之处在所难免,也请读者批评指正,不甚感激。

关于本文,个人存在两个疑问。第一个是C++ Reference中还提到了一个type:%F,目前还没有发现该type的用处与%f的区别所在,也请知之者留言告知,万分感谢。第二个是在输出宽字符串时,发现将printf和wprintf同时使用时,wprintf无法输出,具体不知原因,这里建议不要同时使用printf和wprintf,以免发生错误。知道为何的读者也请告知,谢谢!

printf和wprintf不能同时输出宽字符串的示例代码如下:

#include 
#include 
#include 

int main(int argc,char* argv[]){ char test[]="测试Test"; setlocale(LC_ALL,"zh_CN.UTF-8"); wchar_t wtest[]=L"0m~K0m~UTest"; printf("printf:%S\n",wtest); //语句1:可正常输出"测试Test" wprintf(L"wprintf:%S\n",wtest); //语句2:无任何内容输出 }

上面的代码中语句1和语句二不能同时存在,否则只能正常输出第一个。原因尚不清楚,估计和wprintf和printf内部实现有关,也不知道在Windows平台是否也存在这种问题,有兴趣的读者可以尝试一下。下一篇博文预估将集结全部火力,探讨解决这个问题,wprintf的具体用法,字符编码等相关问题,敬请期待。


参考文献

[1]浅谈C中的wprintf和宽字符显示
[2]printf.C++ reference
[3]Why does printf not flush after the call unless a newline is in the format string?

你可能感兴趣的:(printf()详解之终极无惑)