from:廖雪峰IO教程

IO

IO是input&output，以内存为中心：
input就是把数据读到内存，output就是把内存的数据输出

InputStream/OutputStream
IO流以byte为最小单位，因此也称为字节流。例如，我们要从磁盘中读取文件，文件包含六个字节，就相当于读入了六个字节的数据

Reader/Writer
读取的是字符，并且字符不全是单字节表示的ASCII字符，那么就按照char来读取更加方便，这种流称为字符流

File对象

File f = new File("/usr/bin/javac");

File对象三种形式表示的路径

1. getPath() //相对路径
2. getAbsolutePath() //绝对路径
3. getCanonicalPath() //规范路径

文件/目录、权限、大小、创建/删除文件

boolean isFile()
boolean isDirectory()
boolean canRead()
boolean canWrite()
boolean canExecute()
long length()

File f = new File("/usr/bin/javac");
if(file.createNewFile()){
    //创建文件成功
    if(gile.delete()){
        //删除文件成功
    }
}

遍历

File[] fileList  = file.listFiles();

创建目录和路径

boolean mkdir() 创建当前File对象表示的目录
boolean mkdirs() 创建当前File对象表示的目录，并且在必要时把不存在的父目录也创建出来
boolean delete()

在文件路径需要拼接时使用Path会更方便

InputStream

最重要的方法 read()

public abstract int read() throws IOException;

FileInputStream是InputStream的一个子类，下面的代码演示了如何完整的读取一个FileInputStream的所有字节：

public void readFile throw IOException{
    InputStream in = null;
    try{
        in = new FileInputStream("src/readme.txt");
        int n;
        while(n = in.read() != -1){
            System.out.println(n);
        }
    }finally{
        if(in != null){
            input.close();
        }
    }
    
}

java7 try(resource)：
public void readFile throw IOException{
    try(InputStream in = new FileInputStream("src/readme.txt")){
        int n;
        while(n = in.read() != -1){
            System.out.println(n);
        }
    }
}

缓冲

在读取流的时候，一次性读取一个字节并不是高效的方法，使用缓冲区一次性读取多个字节效率往往高很多，InputStream提供了两个重载方法来支持读取多个字节

int read(byte[] b) 读取若干字节到byte[]数组，返回读取的字节数
int read(byte[] b, int off, int len) 指定byte[]数组的偏移量和最大偏移数

使用缓冲区一次性读取多个字节的代码如下：

public void readFile() throw IOException {
    try(InputStream in = new FileInputStream("src/readme.txt")){
        byte[] buffer = new buffer[1000];
        int n;
        while(n = in.read(buffer) != -1){
            System.out.println("read " + n + " bytes.");
        }
    }
}

阻塞

在调用InputStream 的 read() 方法读取数据时，我们说read()是阻塞的，意思是in.read()后面的代码必须等待read()返回之后才能执行

InputStream实现类

ByteArrayInputStream

byte[] data = { 11, 22, 33, 44, 55 };
try(InputStream in = new ByteArrayInputStream(data)){
    ...
}

ByteArrayInputStream 实际是把一个byte[] 在内存中变成一个InputStream

OutputStream

最基本方法

public abstract void write(int b) throw IOException

虽然传入的是int，但是只会写入8个字节，就是int的最低8位

OutputStream的flush()方法，write()会自动把字节写到缓冲区，缓冲区满会自动调用flush()方法，close()也会调用flush()方法

特殊情况就是比如IM的对话，使用OutputStream的write()写入网络流，如果不flush()就会等到缓冲区满才发送，所以需要手动调用flush()方法

public void writeFile() throw IOException {
    byte[] data;
    try(ByteArrayOutputStream out = new ByteArrayOutputStream("out/readme.txt")){
        out.write("Hello".getBytes("UTF-8"));
        data = out.toByteArray();
    }
    System.out.println(data);
}

Filter 模式

Java IO标准库的InputStream根据来源可以包括：

FileInputStream 从文件读取数据源
ServletInputStream 从HTTP请求读取数据源
Socket.getInputStream() 从TCP连接读取数据源
...

如果我们要给FileInputStream增加缓冲功能，则可以从FileInputStream派生一个类

BufferedFileInputStream extends FileInputStream

添加签名计算签名可以DigestFileInputStream，添加加密解密可以CipherFileInputStream

如果要增加功能的组合就需要更多子类

为了解决继承会导致子类太多的问题，JDK将InputStream分为两大类

一类是直接提供数据的基础InputStream，如：

InputStream
FileInputStream
ServletInputStream
另一类是提供额外附加功能的：上面三个
BufferedFileInputStream
DigestFileInputStream
CipherFileInputStream

当我们需要给一个基础的"InputStream"添加功能时，比如数据来自于文件

InputStream in = new FileInputStream("drc/readme.md");

InputStream buffered = new BufferedInputStream(in);

InputStream gzip = new GzipInputStream(buffered);

OutputStream也是这样提供功能

读取classpath资源

String conf = "C:\\conf\\default.properties";
try(InputStream in = new FileInputStream(conf)){

}

直接从File路径中读取文件必须在C盘的conf文件夹下有一个default.properties的文件
从classpath读取文件就可以避免不同环境下文件路径不一致的问题：如果我们把default.properties放在classpath中就不用关心他的实际存放路径
在classpath中的文件，路径总是以/开头

try(InputStream in = getClass().getResourceAsStream("/default.properties")){
    //调用classpath很重要的一点是如果资源文件不存在，它将返回null，因此我们需要检查返回的InputStream是否为null
    if(in != null){

    }
}

序列化

序列化是指把一个Java对象变成二进制内容，本质上就是一个字节数组
为什么要把对象序列化呢？因为序列化之后可以吧byte[]保存到文件之中，或者通过网络传输到远程
有了序列化就又反序列化，即把一个二进制内容（也就是byte数组）变回Java对象。有了反序列化，保存在文件中的byte[]数组就能重新变成Java对象，或者从网上读取byte[]数组然后把他变成Java对象

一个对象要是能序列化，必须实现一个java.io.Serializable接口

Serializable接口没有定义任何方法，我们把这样的接口称为空接口，这样的接口时标记接口，实现标记接口仅仅是给自己贴了个标记，没有增加任何方法

ObjectOutputStream既可以写入基本类型，也可以写入String，也可以写入实现了Serializable接口的Object，因为写入Object时需要大量的类型信息，所以写入的内容很大

ByteArrayOutputStream buffer = new ByteArrayOutputstream();
try(ObjeactOutputStream out = new OutputStream(buffer)){
    out.writeInt(123);
    out.writeUTF("Hello");
    out.writeObject(Double.valueOf(123.456));
}

反序列化

与序列化 ObjectOutputStream相反，ObjectInputStream从一个字节流读取Java对象
除了能读取基本类型和String类型之外，调用readObject()还可以直接返回一个Object对象，要把它变成一个特定类型，必须强制转型

readObject()可能抛出的异常有：
classNotFoundException: 没有找到匹配的class。没有找到匹配的class。常见于一个程序的Person对象在接收程序未定义
InvalidClassException: Class不匹配。常见于发送方的age和接收方的age不是一个类型，一个是int一个是long

为了避免这种class变动导致的不兼容，Java的序列化允许class定义一个特殊的serialVersionUID静态变量，用于标识Java类的序列化版本，通常可以由ide自动生成，如果增加或者修改了字段就可以改变serialVersionUID字段，这样就能避免不匹配的class版本

public class Person implements Serializable {
    private static final long serialVersionUID = 2709425275741743919L;
}

反序列化时，由JVM直接构造出Java对象，不调用构造方法，构造方法内部的代码，在反序列化时根本不可能执行

安全性

由于Java的反序列化机制可以导致一个实例能直接从byte[]数组构建，而不经过构造方法，因此他存在一定的安全问题。一个精心构造的byte[]反序列化之后能够执行特定的Java代码，从而导致严重的Java漏洞

Reader

Reader是JavaIO库提供的另一个输入流接口。是一个字符流，即以char为单位读取

public int read() throw IOException

和InputStream的read()方法的区别在于int返回值的范围，InputStream是0-255，Reader是0-65535

public void readFile() throws IOException{
    try(Reader reader = new FileReader("src/readme.md", StandardCharsets.UTF_8)){

    }
}

Reader还提供了一次性读取若干字符并填充到char[]数组的方法：

public int read(char[] c) throws IOException

利用这个方法我们可以先设置一个缓冲区。然后每次尽力的填充缓冲区：

public void readFile() throws IOException{
    try(Reader reader = new FileReader("src/readme.md", StandardCharsets.UTF_8)){
        char[] c = new char[10000];
        int n;
        while(n = reader.read(buffer) != -1){
            System.out.println("read" + n + "chars.");
        }
    }
}

InputStreamReader

Reader 和 InputStream 有什么关系

除了特殊的CharArrayReader和StringReader，普通的Reader实际上是基于InputStream构造的，因为Reader要从InputStream读取字节流然后在转化为char就形成了字符流。
如果我们查看FileReader的源码，其中持有一个FileInputStream

既然Reader本质上是一个基于InputStream的byte到char的转换器，那么如果我们有一个InputStream，想把它转化为一个Reader，是完全可行的。InputStreamReader本质上就是这样一个转换器，他可以吧任何一个InputStream转换为Reader

try(FileReader reader = new InputStreamReader(new InputStream("src/readme.md"), "UTF_8")){

}

上述代码实际上就是FileReader的一种实现方式

PrintStream

PrintStream扩展了OutputStream接口
PrintStream相比于OutputStream,有两个变化：

增加了一组方法：print()/println()
不会抛出IOException

PrintWriter

PrintWriter扩展了Writer接口，增加了print()/println()方法，最终输出的是char数据

IO

IO