IO

from:廖雪峰IO教程

IO

IO是input&output,以内存为中心:
input就是把数据读到内存,output就是把内存的数据输出

InputStream/OutputStream
IO流以byte为最小单位,因此也称为字节流。例如,我们要从磁盘中读取文件,文件包含六个字节,就相当于读入了六个字节的数据

Reader/Writer
读取的是字符,并且字符不全是单字节表示的ASCII字符,那么就按照char来读取更加方便,这种流称为字符流

File对象

File f = new File("/usr/bin/javac");

File对象三种形式表示的路径

1. getPath() //相对路径
2. getAbsolutePath() //绝对路径
3. getCanonicalPath() //规范路径

文件/目录、权限、大小、创建/删除文件

boolean isFile()
boolean isDirectory()
boolean canRead()
boolean canWrite()
boolean canExecute()
long length()

File f = new File("/usr/bin/javac");
if(file.createNewFile()){
    //创建文件成功
    if(gile.delete()){
        //删除文件成功
    }
}

遍历

File[] fileList  = file.listFiles();

创建目录和路径

boolean mkdir() 创建当前File对象表示的目录
boolean mkdirs() 创建当前File对象表示的目录,并且在必要时把不存在的父目录也创建出来
boolean delete()

在文件路径需要拼接时使用Path会更方便

InputStream

最重要的方法 read()

public abstract int read() throws IOException;

FileInputStream是InputStream的一个子类,下面的代码演示了如何完整的读取一个FileInputStream的所有字节:

public void readFile throw IOException{
    InputStream in = null;
    try{
        in = new FileInputStream("src/readme.txt");
        int n;
        while(n = in.read() != -1){
            System.out.println(n);
        }
    }finally{
        if(in != null){
            input.close();
        }
    }
    
}

java7 try(resource):
public void readFile throw IOException{
    try(InputStream in = new FileInputStream("src/readme.txt")){
        int n;
        while(n = in.read() != -1){
            System.out.println(n);
        }
    }
}

缓冲

在读取流的时候,一次性读取一个字节并不是高效的方法,使用缓冲区一次性读取多个字节效率往往高很多,InputStream提供了两个重载方法来支持读取多个字节

int read(byte[] b) 读取若干字节到byte[]数组,返回读取的字节数
int read(byte[] b, int off, int len) 指定byte[]数组的偏移量和最大偏移数

使用缓冲区一次性读取多个字节的代码如下:

public void readFile() throw IOException {
    try(InputStream in = new FileInputStream("src/readme.txt")){
        byte[] buffer = new buffer[1000];
        int n;
        while(n = in.read(buffer) != -1){
            System.out.println("read " + n + " bytes.");
        }
    }
}


阻塞

在调用InputStream 的 read() 方法读取数据时,我们说read()是阻塞的,意思是in.read()后面的代码必须等待read()返回之后才能执行

InputStream实现类

ByteArrayInputStream

byte[] data = { 11, 22, 33, 44, 55 };
try(InputStream in = new ByteArrayInputStream(data)){
    ...
}

ByteArrayInputStream 实际是把一个byte[] 在内存中变成一个InputStream

OutputStream

最基本方法

public abstract void write(int b) throw IOException

虽然传入的是int,但是只会写入8个字节,就是int的最低8位

OutputStream的flush()方法,write()会自动把字节写到缓冲区,缓冲区满会自动调用flush()方法,close()也会调用flush()方法

特殊情况就是比如IM的对话,使用OutputStream的write()写入网络流,如果不flush()就会等到缓冲区满才发送,所以需要手动调用flush()方法

public void writeFile() throw IOException {
    byte[] data;
    try(ByteArrayOutputStream out = new ByteArrayOutputStream("out/readme.txt")){
        out.write("Hello".getBytes("UTF-8"));
        data = out.toByteArray();
    }
    System.out.println(data);
}

Filter 模式

Java IO标准库的InputStream根据来源可以包括:

FileInputStream 从文件读取数据源
ServletInputStream 从HTTP请求读取数据源
Socket.getInputStream() 从TCP连接读取数据源
...

如果我们要给FileInputStream增加缓冲功能,则可以从FileInputStream派生一个类

BufferedFileInputStream extends FileInputStream 

添加签名计算签名可以DigestFileInputStream,添加加密解密可以CipherFileInputStream

如果要增加功能的组合就需要更多子类

为了解决继承会导致子类太多的问题,JDK将InputStream分为两大类

一类是直接提供数据的基础InputStream,如:

  1. InputStream
  2. FileInputStream
  3. ServletInputStream
    另一类是提供额外附加功能的:上面三个
  4. BufferedFileInputStream
  5. DigestFileInputStream
  6. CipherFileInputStream

当我们需要给一个基础的"InputStream"添加功能时,比如数据来自于文件

InputStream in = new FileInputStream("drc/readme.md");

InputStream buffered = new BufferedInputStream(in);

InputStream gzip = new GzipInputStream(buffered);

OutputStream也是这样提供功能

读取classpath资源

String conf = "C:\\conf\\default.properties";
try(InputStream in = new FileInputStream(conf)){

}

直接从File路径中读取文件必须在C盘的conf文件夹下有一个default.properties的文件
从classpath读取文件就可以避免不同环境下文件路径不一致的问题:如果我们把default.properties放在classpath中就不用关心他的实际存放路径
在classpath中的文件,路径总是以/开头

try(InputStream in = getClass().getResourceAsStream("/default.properties")){
    //调用classpath很重要的一点是如果资源文件不存在,它将返回null,因此我们需要检查返回的InputStream是否为null
    if(in != null){

    }
}

序列化

序列化是指把一个Java对象变成二进制内容,本质上就是一个字节数组
为什么要把对象序列化呢?因为序列化之后可以吧byte[]保存到文件之中,或者通过网络传输到远程
有了序列化就又反序列化,即把一个二进制内容(也就是byte数组)变回Java对象。有了反序列化,保存在文件中的byte[]数组就能重新变成Java对象,或者从网上读取byte[]数组然后把他变成Java对象

一个对象要是能序列化,必须实现一个java.io.Serializable接口

Serializable接口没有定义任何方法,我们把这样的接口称为空接口,这样的接口时标记接口,实现标记接口仅仅是给自己贴了个标记,没有增加任何方法

ObjectOutputStream既可以写入基本类型,也可以写入String,也可以写入实现了Serializable接口的Object,因为写入Object时需要大量的类型信息,所以写入的内容很大

ByteArrayOutputStream buffer = new ByteArrayOutputstream();
try(ObjeactOutputStream out = new OutputStream(buffer)){
    out.writeInt(123);
    out.writeUTF("Hello");
    out.writeObject(Double.valueOf(123.456));
}

反序列化

与序列化 ObjectOutputStream相反,ObjectInputStream从一个字节流读取Java对象
除了能读取基本类型和String类型之外,调用readObject()还可以直接返回一个Object对象,要把它变成一个特定类型,必须强制转型

readObject()可能抛出的异常有:
classNotFoundException: 没有找到匹配的class。没有找到匹配的class。常见于一个程序的Person对象在接收程序未定义
InvalidClassException: Class不匹配。常见于发送方的age和接收方的age不是一个类型,一个是int一个是long

为了避免这种class变动导致的不兼容,Java的序列化允许class定义一个特殊的serialVersionUID静态变量,用于标识Java类的序列化版本,通常可以由ide自动生成,如果增加或者修改了字段就可以改变serialVersionUID字段,这样就能避免不匹配的class版本

public class Person implements Serializable {
    private static final long serialVersionUID = 2709425275741743919L;
}

反序列化时,由JVM直接构造出Java对象,不调用构造方法,构造方法内部的代码,在反序列化时根本不可能执行

安全性

由于Java的反序列化机制可以导致一个实例能直接从byte[]数组构建,而不经过构造方法,因此他存在一定的安全问题。一个精心构造的byte[]反序列化之后能够执行特定的Java代码,从而导致严重的Java漏洞

Reader

Reader是JavaIO库提供的另一个输入流接口。是一个字符流,即以char为单位读取

public int read() throw IOException

和InputStream的read()方法的区别在于int返回值的范围,InputStream是0-255,Reader是0-65535

public void readFile() throws IOException{
    try(Reader reader = new FileReader("src/readme.md", StandardCharsets.UTF_8)){

    }
}

Reader还提供了一次性读取若干字符并填充到char[]数组的方法:

public int read(char[] c) throws IOException

利用这个方法我们可以先设置一个缓冲区。然后每次尽力的填充缓冲区:

public void readFile() throws IOException{
    try(Reader reader = new FileReader("src/readme.md", StandardCharsets.UTF_8)){
        char[] c = new char[10000];
        int n;
        while(n = reader.read(buffer) != -1){
            System.out.println("read" + n + "chars.");
        }
    }
}

InputStreamReader

Reader 和 InputStream 有什么关系

除了特殊的CharArrayReader和StringReader,普通的Reader实际上是基于InputStream构造的,因为Reader要从InputStream读取字节流然后在转化为char就形成了字符流。
如果我们查看FileReader的源码,其中持有一个FileInputStream

既然Reader本质上是一个基于InputStream的byte到char的转换器,那么如果我们有一个InputStream,想把它转化为一个Reader,是完全可行的。InputStreamReader本质上就是这样一个转换器,他可以吧任何一个InputStream转换为Reader

try(FileReader reader = new InputStreamReader(new InputStream("src/readme.md"), "UTF_8")){

}

上述代码实际上就是FileReader的一种实现方式

PrintStream

PrintStream扩展了OutputStream接口
PrintStream相比于OutputStream,有两个变化:

  1. 增加了一组方法:print()/println()
  2. 不会抛出IOException

PrintWriter

PrintWriter扩展了Writer接口,增加了print()/println()方法,最终输出的是char数据

你可能感兴趣的:(IO)