详解字节流和字符流

一、明确字符和字节的概念

字节:1 byte = 8 bit
字符:1 char = 2 byte = 16 bit(java默认)

在计算机硬件层面,1 bit 是数据最小的单位。但是在大多数情况下,1 bit 存储的信息太少,我们通常把 1 字节作为数据最小的基本单位。

而字符实际上也是对字节的一种包装,那为什么还需要引入字符?
对于西方世界,使用英语等语种的国家来说,1字节有 256个符号编码,对于26个英文字母加上常用的标点符号已经够用了。这就是常用的ASCII 码。
但是对于东方国家,中文,日文等文字,数量太多,1个字节根本没有办法表示所有的字符,所以引入了Unicode —— 统一编码,而这种编码的常规字符集就是使用2个字节,所以引入了字符的概念。

但是,从根本而言,一切都是字节流,字符流也是字节流的一种形式。

二、关于 java中字节流和字符流

2.1 字节流,字符流概念

Java中,读取数据时,字节流的数据存储单位是字节,会使用字节类型数组 byte[] 来保存数据,可以操作字节,字节数组。
而 字符流的存储单位是字符,使用字符类数组 char[] 来保存数据,可以操作字符,字符数组或字符串。

2.2 java中的字节流,字符流相关API

Java 的I/O库有两个分支:

  • 面向字节流的InputSteam和OutputStream
  • 面向字符的Reader 和 wirter
InputStream

ByteArrayInputStream:把内存中的一个缓冲区作为 InputStream 使用 .
StringBufferInputStream: 把一个 String 对象作为 InputStream .
FileInputStream:把一个文件作为 InputStream ,实现对文件的读取操作
PipedInputStream :实现了 pipe 的概念,主要在线程中使用 . 管道输入流是指一个通讯管道的接收端。
一个线程通过管道输出流发送数据,而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。
SequenceInputStream :把多个 InputStream 合并为一个 InputStream . “序列输入流”类允许应用程序把几个输入流连续地合并起来,
并且使它们像单个输入流一样出现。每个输入流依次被读取,直到到达该流的末尾。

OutputStream

ByteArrayOutputStream : 把信息存入内存中的一个缓冲区中 . 该类实现一个以字节数组形式写入数据的输出流。
FileOutputStream: 文件输出流是向 File 或 FileDescriptor 输出数据的一个输出流。
PipedOutputStream: 管道输出流是指一个通讯管道的发送端。 一个线程通过管道输出流发送数据,
而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。

Reader

CharArrayReader :与 ByteArrayInputStream 对应此类实现一个可用作字符输入流的字符缓冲区
StringReader : 与 StringBufferInputStream 对应其源为一个字符串的字符流。
FileReader : 与 FileInputStream 对应
PipedReader :与 PipedInputStream 对应

Writer

CharArrayWrite : 与 ByteArrayOutputStream 对应
StringWrite :无与之对应的以字节为导向的 stream
FileWrite : 与 FileOutputStream 对应
PipedWrite :与 PipedOutputStream 对应

2.3 字符流,字节流API的使用

字节流示例

//字节流写文件
public static void writeFile(){
    String str = "采用数据流方式(字节流)写文件!";
    try{
        BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("D://hello.txt",true));
        //需要转化为字节
        byte[] data = str.getBytes();
        bos.write(data);
        bos.close();
    }catch (FileNotFoundException e){
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    }
}
//字节流读文件
public static void readFile(){
    try {
        BufferedInputStream bis = new BufferedInputStream(new FileInputStream("D://hello.txt"));
        byte[] data = new byte[1024];
        int n = -1;
        while((n=bis.read(data,0,data.length))!=-1){
            String str = new String(data,0,n,"UTF-8");
            System.out.println(str);
        }
    } catch (FileNotFoundException e) {
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    }

字符流示例

//字符流写文件
public static void writeFile(){
    File file = new File("D:\\hello.txt");
    String str = " hello, everybody! welcome to the study of Java!";
    try{
        FileWriter fw = new FileWriter(file);
        BufferedWriter bw = new BufferedWriter(fw);
        bw.write(str);
        bw.close();
        fw.close();
    }catch(IOException e){
        e.printStackTrace();
    }
}
//字符流读文件
public static void readerFile(){
    File file = new File("D:\\hello.txt");
    try{
        BufferedReader br = new BufferedReader(new FileReader(file));

        String str = null;
        while( (str = br.readLine()) != null){
            System.out.println(str);
        }
        br.close();
    }catch(FileNotFoundException e){
        e.printStackTrace();
    }catch(IOException e){
        e.printStackTrace();
    }
}

三、字节流和字符流的区别

字节流和字符流的区别:

  • 字节流在操作文件时,本身不会用到缓冲区(内存),是对文件本身直接操作的;而字符流在操作时是使用到缓冲区的。
  • 字节流在操作文件时,即使不关闭资源(close)文件也能输出;字符流如果不是用close方法的话,则不会输出任何内容,说明字符流使用了缓冲区。且可以使用flush方法强制进行刷新缓冲区,此时在不close情况下也能输出内容。
  • Reader类的read()方法返回类型是int,占两个字节,如果到达流的末尾,则返回-1;inputStream的read()方法虽然也返回int,打算面向字节流,占一个字节。因此对于超过一个字节的只能使用字符流来读取,如汉字。
  • 处理方式不同;字节流:处理字节和字节数组成的二进制对象。
    字符流:处理字符,字符数或字符串。

注:缓冲区是什么??
缓冲区可以理解为一段特殊的内存。
在某些情况下,如果程序频繁操作一个资源,则性能会很低,为了提升性能,可以将这部分数据暂时读入内存的一块区域,之后就可以直接从内存中读取数据,提升速度和性能。

四、使用场景判断

4.1 数据格式

  • 二进制格式(不能确定是纯文本):字节流,InputStream、OutputStream及其子类。
  • 纯文本格式(含中英文或其他编码方式):字符流,Reader,Writer及其子类。

4.2 数据来源

  • 文件:字节流 FileInputStream,FileOutputStream;字符流 FileReader,FileWriter
  • byte[]: 字节流 ByteArrayInputStream, ByteArrayOutputStream char[]:字符流
  • CharArrayReader, CharArrayWriter String: 字节
  • StringBufferInputStream, StringBufferOuputStream ;字符流 StringReader,StringWriter
  • 网络数据流:字节流 InputStream, OutputStream;字符流 Reader, Writer

4.3 是否需要格式化输出

需要格式化输出的:PrintStream, PrintWriter

4.4 是否需要缓冲

需要缓冲:字节流 BufferedInputStream, BufferedOutputStream;字符流 BufferedReader, BufferedWriter

4.5 输入还是输出

  • 输入:Reader, InputStream 类型的子类
  • 输出:Writer, OutputStream 类型的子类

4.6 是否有流转化

  • 字节到字符:InputStreamReader
  • 字符到字节:OutputStreamWriter

4.7 特殊需要

  • 对象输入输出:ObjectInputStream, ObjectOutputStream
  • 进程间通信:PipedInputStream, PipedOutputStream, PipedReader, PipedWriter
  • 合并输入: SequenceInputStream

你可能感兴趣的:(详解字节流和字符流)