文本与二进制方式打开文件的区别

 文本文件也叫做ASCII码文件,与以‘文本方式’打开文件不是同一个概念!文本文件存储的是ASSCII码字符,即存储在磁盘上只占用二进制的0x20--0x7e。另外,还有回车(0x0d),换行(0x0a),TAB(0x09)等,所以有可压缩的空间。

    换行和回车是不同的,而且在不同的操作系统,解释也不相同。‘/n’一般会操作系统被翻译成"行的结束",即LF(Line-Feed);‘/r’会被翻译成"回?,即CR(Cariage-Return)

    回车(CR)和换行(LF)符都是用来表示“下一行”的。而标准没有规定要使用哪一个。于是产生了三种不同的用法:
(1) Dos和windows采用回车+换行(CR+LG)表示下一行
(2) UNIX采用换行符(LF)表示下一行
(3) MAC机采用回车符(CR)表示下一行。
当在不同的系统间传递文件,就要涉及格式的转换。

    文本方式和二进制方式的最大区别在于文本方式对于'/n'换行符的理解不同
(1)在DOS平台下,该字符会被展开成<CR>< LF>两个控制字符(相当于"/r/n"),在ASCII字符集下是 0DH,0AH
(2)在UNIX平台下,仅仅是<LF>,不会展开。
(3)在二进制方式下,不管是什么平台,'/n'都是精确的<LF>。

   在linux/unix 系统上,只有一种文件类型的系统,带b字母的模式和对应的不带b字母的模式是相同的。(UNIX文本文件通常不包含Ctrl+Z和/r)

关于EOF:
    EOF可以作为文本文件的结束标志,但不能作为二进制文件的结束符.feof函数既可以判断二进制文件,又可以判断文本文件.

    EOF在Windows下是ctrl+z,linux下是ctrl+D.


1, Change the default translation mode directly by setting the global variable _fmode in your program. The initial default setting of _fmode is _O_TEXT, for text mode.

2,_O_TEXT sets text (translated) mode. Carriage return–linefeed (CR-LF) combinations are translated into a single linefeed character on input. Linefeed characters are translated into CR-LF combinations on output. _O_BINARY sets binary (untranslated) mode, in which these translations are suppressed.
 
       MS-DOS文本文件用回车符和换行符的组合/r/n表示行尾。Macintosh文本文件使用只用一个回车符/r来表示行尾。C程序使用/n表示行尾。所以,在C程序以文本方式打开一个MS-DOS文本文件时,会将/r/n转换为/n,在写入文件的时候它会将/n转换为/r/n。(如果以二进制方式打开该文件,则C程序将看到/r和/n两个字符。)而对于Macintosh文本文件的文本视图,在读取文件时它会将/r转换为/n,在写入文件的时候它会将/n转换为/r。
 
 
 
所以在C程序下以文本格式打开一个文件,/n/r会转化为一个字符/n,当写入文本文件的时候,又会重新转换回去,即/n转化为/n/r,但是写入一个二进制文件时,就会直接写入/n。如果在MS-DOS下以二进制格式打开一个文件,读出来就是/n/r,如果写入的是文本文件就会解析为/nr//r,写入二进制格式文件就保持原来。

你可能感兴趣的:(windows,unix,dos,character,translation,combinations)