ASII码中控制字符CR和LF的含义

CR意思是carriage return,回车,\r,ASCII码为13

LF意思是linefeed,换行,\n,ASCII码为10

 

当你用一个打字机的时候,asdfghjkl;'右边的那个按钮(在计算机键盘上,就对应着那个Enter键)被按下的时候,打字机的纸张卷动一行,而纸张的水平位置并不变化。打字机上另外还有一个手柄,那个手柄是专用来“回车”的,向左搬动那个手柄的时候,装纸的结构被松开,在弹簧的作用下弹回最右边(相当于打印头回到最左边)。

 

所以当我们要换行的时候,实际需要两步操作,回车+换行(或者反过来),所以,在VB(含VBScript)里面有一个字符串常量叫做vbCrLf,意思就是回车+换行。CR+LF也是多种协议规定的标准行结束符(RFC0821-SMTP,RFC1939-POP,RFC2060-IMAP,RFC2616-HTTP),在DOS和Windows中,需要另起一行的时候也需要这两个字符。

 

在Windows的记事本中创建一个文档,直接保存的话你会发现这个文件大小是0字节(保存为ANSI编码),然后,打开这个文件,敲入一个回车符,保存,你会发现这个文件的大小变成了2字节。

 

但是,为什么在C语言里面只用LF(\n)就可以换行呢?因为C语言的出现就是为了写UNIX操作系统,而UNIX操作系统中以LF为行结束符,并且自动加上那个CR,以便节省一个字节的长度(这样做在当时存储容量不大的计算机上确实是有意义的,而为了不断兼容,到现在这个规定也没有改变)。在C语言中,运行库会在显示时把LF自动转换为CR+LF(注意是运行库,而不是编译器,所以即使打开EXE文件,找到对应的位置,只能找到一个0x0A的LF,而没有CR)。

 

现有的Linux仍然保持了只用LF当作行结束符的传统,在Windows记事本中打开这种在Linux下写的文本文件就会发现全部内容都在一行上,而在应该换行的地方有一个小黑块,记事本只能处理Windows/DOS格式的文本文件。

 

在Windows的GUI(图形用户界面)下,对于换行的要求其实并不严格,一般情况下用一个\n都能解决问题,所以在VB中写Msgbox("blah...blah..." & Chr(13) & "blah...blah")或者在C语言中直接用含有\n的字符串来调用一个Windows API(应用程序编程接口),都不会出现问题。

 

在另外一个主流的操作系统MacOS当中,行结束符是LF+CR,恰好和Windows相反,用记事本打开这种文件——记事本当然也无法处理这种行结束符——就不分行了,比Linux文件的显示方式还要恶心一些,因为,没有一个记号告诉你,这里是新的一行的开始。

你可能感兴趣的:(文件编码)