输入/输出流 - 深入理解Java中的流 (Stream)

基于流的数据读写,太抽象了,什么叫基于流,什么是流? Hadoop 是 Java 语言写的,所以想理解好 Hadoop 的 Streaming Data Access,还得从 Java 流机制入手。流机制也是 JAVA 及 C++ 中的一个重要的机制,通过流使我们能够自由地操作包括文件,内存,IO 设备等等中的数据。

首先,流是什么?

流是个抽象的概念,是对输入输出设备的抽象,Java 程序中,对于数据的输入/输出操作都是以“流”的方式进行。设备可以是文件,网络,内存等。

输入/输出流 - 深入理解Java中的流 (Stream)_第1张图片

流具有方向性,至于是输入流还是输出流则是一个相对的概念,一般以程序为参考,如果数据的流向是程序至设备,我们成为输出流,反之我们称为输入流。

可以将流想象成一个“水流管道”,水流就在这管道中形成了,自然就出现了方向的概念。

输入/输出流 - 深入理解Java中的流 (Stream)_第2张图片

当程序需要从某个数据源读入数据的时候,就会开启一个输入流,数据源可以是文件、内存或网络等等。相反地,需要写出数据到某个数据源目的地的时候,也会开启一个输出流,这个数据源目的地也可以是文件、内存或网络等等。

流有哪些分类?

可以从不同的角度对流进行分类:

  1. 处理的数据单位不同,可分为:字符流,字节流

  2. 数据流方向不同,可分为:输入流,输出流

  3. 功能不同,可分为:节点流,处理流

1 和 2 都比较好理解,对于根据功能分类的,可以这么理解:

节点流:节点流从一个特定的数据源读写数据,即节点流是直接操作文件,网络等的流,例如 FileInputStream 和 FileOutputStream,他们直接从文件中读取或往文件中写入字节流,如下图:

这里写图片描述

处理流:“连接”在已存在的流(节点流或处理流)之上通过对数据的处理为程序提供更为强大的读写功能。过滤流是使用一个已经存在的输入流或输出流连接创建的,过滤流就是对节点流进行一系列的包装。例如 BufferedInputStream 和 BufferedOutputStream,使用已经存在的节点流来构造,提供带缓冲的读写,提高了读写的效率,以及 DataInputStream 和 DataOutputStream,使用已经存在的节点流来构造,提供了读写Java中的基本数据类型的功能,他们都属于过滤流,如下图:

输入/输出流 - 深入理解Java中的流 (Stream)_第3张图片

举个简单的例子:

public static void main(String[] args) throws IOException {
        // 节点流FileOutputStream直接以A.txt作为数据源操作
        FileOutputStream fileOutputStream = new FileOutputStream("A.txt");
        // 过滤流BufferedOutputStream进一步装饰节点流,提供缓冲写
        BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(
                fileOutputStream);
        // 过滤流DataOutputStream进一步装饰过滤流,使其提供基本数据类型的写
        DataOutputStream out = new DataOutputStream(bufferedOutputStream);
        out.writeInt(3);
        out.writeBoolean(true);
        out.flush();
        out.close();
        // 此处输入节点流,过滤流正好跟上边输出对应,读者可举一反三
        DataInputStream in = new DataInputStream(new BufferedInputStream(
                new FileInputStream("A.txt")));
        System.out.println(in.readInt());
        System.out.println(in.readBoolean());
        in.close();
}
 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

流结构介绍:

Java 所有的流类位于 java.io 包中,都分别继承字以下四种抽象流类型。

- 字节流 字符流
输入流 InputStream Reader
输出流 OutputStream Writer


1.继承自 InputStream / OutputStream 的流都是用于向程序中输入/输出数据,且数据的单位都是字节 (byte=8bit),如图,深色的为节点流,浅色的为处理流。

输入/输出流 - 深入理解Java中的流 (Stream)_第4张图片

输入/输出流 - 深入理解Java中的流 (Stream)_第5张图片

2.继承自Reader/Writer的流都是用于向程序中输入/输出数据,且数据的单位都是字符(2byte=16bit),如图,深色的为节点流,浅色的为处理流。

输入/输出流 - 深入理解Java中的流 (Stream)_第6张图片

输入/输出流 - 深入理解Java中的流 (Stream)_第7张图片

常见流类介绍:

节点流类型常见的有:

对文件操作的字符流有 FileReader / FileWriter,字节流有FileInputStream / FileOutputStream。

处理流类型常见的有:

缓冲流:缓冲流要“套接”在相应的节点流之上,对读写的数据提供了缓冲的功能,提高了读写效率,同时增加了一些新的方法。

  • 字节缓冲流有 BufferedInputStream / BufferedOutputStream,字符缓冲流有 BufferedReader / BufferedWriter,字符缓冲流分别提供了读取和写入一行的方法 ReadLine 和 NewLine 方法。

  • 对于输出地缓冲流,写出的数据,会先写入到内存中,再使用 flush 方法将内存中的数据刷到硬盘。所以,在使用字符缓冲流的时候,一定要先 flush,然后再 close,避免数据丢失。

转换流:用于字节数据到字符数据之间的转换。

  • 仅有字符流 InputStreamReader / OutputStreamWriter。其中, InputStreamReade r需要与 InputStream“套接”, OutputStreamWriter 需要与 OutputStream“套接”。

数据流:提供了读写Java中的基本数据类型的功能。

  • DataInputStream 和 DataOutputStream 分别继承自 InputStream 和 OutputStream,需要“套接”在 InputStream 和 OutputStream 类型的节点流之上。

对象流:用于直接将对象写入写出。

  • 流类有 ObjectInputStream 和 ObjectOutputStream,本身这两个方法没什么,但是其要写出的对象有要求,该对象必须实现 Serializable 接口,来声明其是可以序列化的,若不实现 Serializable 接口就不能用对象流读写。

还有一个关键字比较重要,transient,由于修饰实现了Serializable接口的类内的属性,被该修饰符修饰的属性,在以对象流的方式输出的时候,该字段会被忽略。

你可能感兴趣的:(java,输入输出流)