Java 字符流处理1

字符流

 

      java.io.Reader、java.io.Writer与其子类等是处理字符流(Character Stream)的相关类。简单地说,就是对流数据以一个字符(两个字节)的长度为单位来处理(0~65 535、0x0000~0xffff),并进行适当的字符编码转换处理,即Reader、Writer与其子类可以用于进行所谓纯文本文件的字符读/写

 

1 Reader和Writer

 

    java.io.Reader和java.io.Writer支持Unicode标准字符集(Character Set)(字节流则只支持ISO-Latin-1 8-bit)。在处理流数据时,会根据系统默认的字符编码来进行字符转换,Reader和Writer是抽象类,在进行文本文件的字符读写时真正会使用其子类,子类通常会重新定义相关的方法

 

    使用Reader的子类 java.io.InputStreamReader来转换读入的两个字节为中文字符,并显示在屏幕上

import java.io.ByteArrayInputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PushbackInputStream;

public class ReaderDemo {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub

		try {
			PushbackInputStream pushbackInputStream = new PushbackInputStream(
					new FileInputStream(args[0]));
			byte[] array = new byte[2];

			ByteArrayInputStream byteArrayStream = new ByteArrayInputStream(
					array);
			// reader会从已读的位数组中取出数据
			InputStreamReader reader = new InputStreamReader(byteArrayStream);

			int tmp = 0;
			int count = 0;
			while ((count = pushbackInputStream.read(array)) != -1) {
				// 两个字节转换为整数
				tmp = (short) ((array[0] << 8) | array[1] & 0xFF);
				tmp = tmp & 0xFFFF;
				// 判断是否为BIG5,如果是则显示BIG5中文字
				if (tmp >= 0xA440 && tmp < 0xFFFF) {
					System.out.println("BIG5:" + (char) reader.read());
					// 重置ArrayInputStream的读取光标
					// 下次reader才会重头读取数据
					byteArrayStream.reset();
				} else {
					if (count == 2) {
						pushbackInputStream.unread(array, 1, 1);
					}
					System.out.println("ASSCII:" + (char) array[0]);
				}
			}
			pushbackInputStream.close();

		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

 

     对于范例要注意的是Reader的read()方法,该方法每次会读入一个字符的数据,并以系统默认的编码作字符转换,然后以int类型返回。也可以直接在构建Reader的实例时,自行指定读取时的编码。例如:

InputStreamReader reader =
         new InputStreamReader(byteArrayStream, "BIG5");

 

2、InputStreamReader和OutputStreamWriter

 

     若想对InputStream和OutputStream进行字符处理,可以使用java.io.InputStreamReader和java.io.OutputStreamWriter为其加上字符处理的功能,它们分别为Reader和Writer的子类

 

     举个例子来说,若想要显示纯文本文件的内容,不 用费心地自行判断字符编码(例如范例14.15中要费心地自行判断是ASCII英文字母或BIG5中文字),只要将InputStream、 OutputStream的实例作为构建InputStreamReader、OutputStreamWriter时的变量,就可以操作 InputStreamReader和OutputStreamWriter来进行文本文件的读取,让它们为您做字符判断与转换的动作

 

     范例可以打开一个纯文本文件,显示其中的字符内容。为了示范OutputStreamWriter的功能,范例会将文本文件复制为另一个文本文件“D:\\backup_abc.txt”。

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;

public class StreamReaderWriterDemo {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		try {
			FileInputStream fileInputStream = new FileInputStream(args[0]);
			// 为FileInputStream加上字符串处理功能
			InputStreamReader inputStreamReader = new InputStreamReader(
					fileInputStream);
			FileOutputStream fileOutputStream = new FileOutputStream("D:\\backup_abc.txt");
			// 为FileOutputStream加上字符串处理功能
			OutputStreamWriter outputStreamWriter = new OutputStreamWriter(
					fileOutputStream);

			int ch = 0;
			// 以字符方式显示文件内容

			while ((ch = inputStreamReader.read()) != -1) {
				System.out.println((char) ch);
				outputStreamWriter.write(ch);
			}
			System.out.println();

			inputStreamReader.close();
			outputStreamWriter.close();

		} catch (ArrayIndexOutOfBoundsException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

}

 

      在这里使用FileInputStream、 FileOutputStream,但InputStreamReader、 OutputStreamWriter可以分别以任何InputStream、OutputStream子类的实例作为构建对象时的变量。之前提过, InputStreamReader、OutputStreamWriter在存取时是以系统的默认字符编码来进行字符转换,也可以自行指定字符编码。例 如指定读取文件时的字符编码为BIG5

InputStreamReader inputStreamReader =
         new InputStreamReader(fileInputStream, "BIG5");

 

关于可设置的编码,可以参考支持的编码(Supported Encodings):

http://java.sun.com/javase/6/docs/technotes/guides/intl/encoding.doc.html 

 

3、FileReader和FileWriter

如果想要存取的是一个文本文件,可以直接使用 java.io.FileReader和java.io.FileWriter类,它们分别继承自InputStreamReader与 OutputStreamWriter。可以直接指定文件名称或File对象来打开指定的文本文件,并读入流转换后的字符,字符的转换会根据系统默认的编 码(若要指定编码,则还是使用InputStreamReader与OutputStreamWriter)。

 

FileReader和FileWriter的 使用非常简单,下面举个例子。在Linux下编写的文本文件,其断行字符是\n,而在Windows下编写的文本文件其断行是\r与\n两个连续字符。如 果在Windows下使用记事本打开一个Linux下编写的文本文件,其在显示上并不会有断行的效果,且\n字符会被用一个黑色方块来显示。

 

范例一个简单的程序,可以读入Linux下编写的文本文件,再写入另一个文件。在读取过程中若遇到\n字符,就取代为\r与\n两个连续字符,这样新的文件在Windows的记事本程序中,就可以有断行显示的效果。

import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;

public class FileReaderWriterDemo {

	public static void main(String args[]) {
		try {
			FileReader fileReader = new FileReader(args[0]);

			FileWriter fileWriter = new FileWriter(args[0] + ".txt");

			int in = 0;
			char[] wlnChar = { '\r', '\n' };

			while ((in = fileReader.read()) != -1) {
				if (in == '\n') {
					// 写入"\r\n"
					fileWriter.write(wlnChar);
				} else {
					fileWriter.write(in);
				}
			}

			fileReader.close();
			fileWriter.close();

		} catch (ArrayIndexOutOfBoundsException e) {
			System.out.println("请指定文件");
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

 

 

4、BufferedReader和BufferedWriter

       java.io.BufferedReader 与java.io.BufferedWriter类各拥有8192字符的缓冲区。当BufferedReader在读取文本文件时,会先尽量从文件中读入 字符数据并置入缓冲区,而之后若使用read()方法,会先从缓冲区中进行读取。如果缓冲区数据不足,才会再从文件中读取,使用 BufferedWriter时,写入的数据并不会先输出至目的地,而是先存储至缓冲区中。如果缓冲区中的数据满了,才会一次对目的地进行写出。例如一个 文件,通过缓冲区可减少对硬盘的输入/输出动作,以提高文件存取的效率。

 

       之前在介绍取得用户输入时,就使用过 BufferedReader。从标准输入流System.in中直接读取用户输入时,用户每输入一个字符,System.in就读取一个字符。为了能一 次读取一行用户的输入,使用了BufferedReader来对用户输入的字符进行缓冲。readLine()方法会在读取到用户的换行字符时,再一次将 整行字符串传入

 

       System.in是一个位流,为了转换为字符流,可使用InputStreamReader为其进行字符转换,然后再使用BufferedReader为其增加缓冲功能

BufferedReader reader =
      new BufferedReader(new InputStreamReader(System.in));

 

可以在文字模式下输入字符,程序会将输入的文字存储至指定的文件中,如果要结束程序,输入quit字符串即可。

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;

public class BufferedReaderWriterDemo {

	public static void main(String args[]) {
		try {
			// 缓冲System.in输入流
			BufferedReader bufReader = new BufferedReader(
					new InputStreamReader(System.in));

			// 缓冲FileWriter字符输入流
			BufferedWriter bufwriter = new BufferedWriter(new FileWriter(
					args[0]));
			String input = null;

			// 每读一次进行一次写入动作
			while (!(input = bufReader.readLine()).equals("quit")) {
				bufwriter.write(input);
				// newline()方法写入与操作系统相依的换行字符
				bufwriter.newLine();
			}
			bufwriter.flush();
			bufwriter.close();

		} catch (ArrayIndexOutOfBoundsException e) {
			System.out.println("没有找到指定文件");
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

 

 

由于换行字符依操作系统不同而有所区别,在Windows下是\r\n,在Linux下是\n,在Mac OS下是\r,您可以使用newLine()方法,由执行环境依当时的操作系统决定该输出哪一种换行字符

 

源文件地址:http://hi.baidu.com/mdbing/blog/item/7c532a4e535ed3cfd1c86ac4.html

你可能感兴趣的:(java,linux,windows,OS,sun)