15.IO、文件、NIO【草案一】

(这一个章节将讲到Java里面比较重要的一个章节,这里说一句抱歉,因为最近换工作的原因,一直没有时间继续书写教程,不过接下来我会一直坚持写下去的哈,希望大家能够支持。这个章节主要涉及到常用的文件读写,包括高级的文件IO内容——java.nio,因为这些内容在如今的一些项目里面也属于相当常见的一部分,如果有什么遗漏或者笔误的话,希望读者来Email告知:[email protected],谢谢!这一部分篇幅可能比前边章节长很多,也是为了保证能够将Java里面IO和文件操作部分内能写的都写入,如果有遗漏希望读者来Email,概念上有混淆的地方请告知,里面有些内容参考了一些原文数据进行了翻译以及思考注解。)
本章目录:

1.IO类相关内容
2.文件和目录
3.文件高级操作

1.IO类相关内容
  i.基本概念:
  Java编程里面针对IO的操作主要提供了两个包java.iojava.nio,这两个包都可以用来进行IO编程,实现应用程序所需要的相关IO操作,但是性能上可能存在比较大的区别。在Java API中,读取对象的时候一般都是按照一个有序的字节流进行读取,这种读取方式称为流式读取按照这种方式读取一个对象的字节流称作输入流(Input Stream写入一个对象的字节流称作输出流(Output Stream,至于输入和输出的目标以及源可以是控制台,同样可以是文件网络连接甚至是内存块。Java IO类里面处理这种需求(字节流)的最高抽象类主要是InputStreamOutputStream,这两个类是整个Java处理IO的最高层的抽象类,这两个类直接继承于java.lang.Object
  在Java IO类里面,一般情况将输入输出分为两种,一种就是上边讲到的字节流,还有一种,高层抽象类为ReaderWriter,称为字符流,字符流和字节流不一样。字节流是将对象或者读取以及写入的内容直接序列化成为流式数据进行传输和读写,而字符流是将这些内容直接转换称为Unicode的字符来进行读取或者写入操作
  在Java IO类的层次结构里面,它的整体结构如下:
  字节流部分的类层次结构:
  字符流部分的类层次结构:
  从JDK 1.5过后,这些内容规范化了很多,记忆起来也不是很麻烦,所有以Stream结尾的类都是字节流的IO类,而所有以Writer和Reader结尾的类都是字符流的IO类,而Java IO类里面的接口层次结构如下:
  ii.IO字节流——的输入输出:
  [1]InputStream和OutputStream简介:
  这两个类是字节流的抽象读写类,两个类都为抽象类,类定义如下:
public abstract classInputStreamextendsObjectimplementsCloseable
public abstract classOutputStreamextendsObjectimplementsCloseable,Flushable
  这里引入一点题外话,就是二者实现的两个接口的简单讲解:
  Closeable接口(1.5):Closeable接口是从JDK 1.5才引入的一个新的接口,该接口是可以关闭IO数据源或者目标的,调用close方法可释放对象保存的资源,比如我们常用的打开的文件。该接口里面只有一个方法:
voidclose()throwsIOException
  【个人思考*:这里提供一点点比较新的资料,在JDK 1.7里面开始支持C#里面使用的资源闭包,也就是类似C#里面的using语句的扩展方式,只是Java语言的关键字是try,这种设计刚好为这种实现做了一定层次的铺垫,也就是在JDK 1.7过后所有的资源在读写过程不需要显示调用close()方法,同样类似C#里面的using语句使用try块语句实现在一个代码块里面使得里面的输入输出流自动关闭,该接口的引入也使得所有输入输出流在操作过程更加倾向于规范,因为在JDK 1.5之前,所有的close()操作都是由类本身提供的,这种方式无疑使得整个关闭显得不够正规。而且需要谨记的是,所有的IO资源最好在最终处理的时候使用正常的代码方式关闭,否则会占用系统资源。】
  Flushable接口(1.5):Flushable接口也是JDK 1.5才引入的一个新接口,该接口是可刷新数据的目标接口,调用flush方法将所有已经缓冲输出的数据写入底层流,该接口和Closeable一样,里面仅仅包含了一个输出流的常用方法:
voidflush()throwsIOException
  【*:初学者对flush方法会存在很多困惑,有时候不知道该方法到底是怎么在执行,而在很多输出流中都会使用到flush方法。首先需要理解的是操作系统文件写入的原理,一般情况下,不论是写入的目标源是文件、控制台还是网络,其写入的原理都类似,使用Java语言编程的时候,Java语言本身只会衔接到JVM平台这一层,除非使用JNI(其实JNI也没有直接使用Java语言调用操作系统的API),否则Java语言很难直接操作操作系统底层的一些数据以及相关内容交互。而IO输出的时候,往往是将数据写入缓冲区,一般情况下缓冲区存在于操作系统的内存,针对文件系统的操作有四个:打开、关闭、读、写,JVM在执行命令过后,会将底层的操作递交给操作系统本身来完成。flush的操作就负责发送请求,请求操作系统将缓冲区的内容写入到磁盘上的物理文件,如果不定义缓冲区的大小,就根据JVM本身的配置和操作系统的本身性质由操作系统决定什么时候写入,一般情况下不进行该操作的话会实时写入,如果定义了缓冲区情况可能就不一样了。】
  [2]字节流类结构详解:
  InputStream和OutputStream都是抽象类,在实例化的时候,一般情况下是使用它子类进行实例化,它们本身不存在实例
  InputStream字节流输入的类结构:
[A]InputStream(1.0)
|—[C]javax.sound.sampled.AudioInputStream(1.3)
|—[C]ByteArrayInputStream(1.0)
|—[C]FileInputStream(1.0)
|—[C]FilterInputStream(1.0)
  |—[C]BufferedInputStream(1.0)
  |—[C]java.util.zip.CheckedInputStream(1.6)
  |—[C]javax.crypto.CipherInputStream(1.4)
  |—[C]DataInputStream(1.0)
  |—[C]java.util.zip.DeflaterInputStream(1.6)
  |—[C]java.security.DigestInputStream(1.6)
  |—[C]java.util.zip.InflaterInputStream(1.6)
    |—[C]java.util.zip.GZIPInputStream(1.6)
    |—[C]java.util.zip.ZipInputStream(1.6)
      |—[C]java.util.jar.JarInputStream(1.2)
  |—[C]LineNumberInputStream(1.0)【已过时】
  |—[C]javax.swing.ProgressMonitorInputStream
  |—[C]PushbackInputStream(1.0)
|—[A]org.omg.CORBA.portable.InputStream(1.2)
  |—[A]org.omg.CORBA_2_3.portable.InputStream(1.2)
|—[C]ObjectInputStream(1.1)
|—[C]PipedInputStream(1.0)
|—[C]SequenceInputStream(1.0)
|—[C]StringBufferInputStream(1.0)【已过时】
  InputStream是表示字节流输入的所有类的超类,它的几个子类的介绍如下:
——AutioInputStream(1.3)类javax.sound.sampled.AudioInputStream):该类是音频输入流,具有指定音频格式和长度的输入流,长度用实例帧表示而不使用字节。该类提供了几种方法,用于从流读取一定数量的字节,或未指定数量的字节,音频输入流跟踪所读取的最后一个字节,可以跳过任意数量的字节以达到稍候的读取位置。该输入流可支持标记,设置标记的时候,会记住当前的位置,以便可以稍候返回该位置。
  Java的AudioSystem类包括了许多操作AudioInputStream对象的方法,这些方法可以做以下的事情:
  • 从外部音频文件、流或URL获得音频输入流
  • 从音频输入流写入外部文件
  • 将音频输入流转换为不同的音频格式
  该类不是属于java.io的包,所以这个地方针对该类就不做过多的讨论。
——ByteArrayInputStream(1.0)类:该类包含了Java定义的一个内部的缓冲区,该缓冲区包含从流中读取的字节,内部计数器跟踪read方法要提供的下一个字节,若该输入流被关闭就无效,但是此类中的方法在关闭此流过后仍然可以被调用,而且不会产生IOException
——FileInputStream(1.0)类:该类从文件系统中的某个文件中获得输入字节,哪些文件可以取决于定义的主机环境,该类也可以用于读取图像数据之类的原始字节流
——FilterInputStream(1.0)类:该类包含了其他一些输入流,它将这些流作用其基本数据源,它可以直接传输数据或提供一些额外的功能,FilterInputStream类本身只是简单地重写那些将所有请求传递给所包含输入流的InputStream的所有方法,FilterInputStream的子类可进一步重写这些方法中的一些方法,并且还可以提供一些额外的方法和字段。
——BufferedInputStream(1.0)类:该类为另一个输入流添加一些功能,即缓冲输入以及支持mark和reset方法的能力,在创建BufferedInputStream时,会创建一个内部缓冲区数组,在读取或跳过流中的字节时,可根据需要从包含的输入流再次填充该内部缓冲区,一次填充多个字节。mark操作记录输入流中的某个点,reset操作使得在从包含的输入流中获取新字节之前,再次读取自最后一次mark操作后读取的所有字节。
——java.util.zip.CheckedInputStream(1.6)类:该类是读取一个压缩包里面的类,是一个需要维护所读取数据校验和的输入流,校验和用来验证输入数据的完整性。
——javax.crypto.CipherInputStream(1.4)类:该类由一个InputStream和一个Cipher组成,这样read()方法才能返回从底层InputStream读入但已经由该Cipher另外处理过的数据,在由CipherInputStream使用之前,该Cipher必须充分初始化。如果Cipher初始化为解密,在返回解密的数据之前,CipherInputStream将尝试读入数据并且将其解密。该类严格遵守此语义,尤其是其祖先类FilterInputStream和InputStream的语义。此类具有其祖先类中指定的所有方法,并且对所有的这些方法进行了重写,除此之外,此类还对其祖先类未抛出的所有异常进行捕获。
——DataInputStream(1.0)类:数据输入流允许应用程序以与机器无关的方式从底层输入流中读取基本Java数据类型,应用程序可以使用数据输出流写入由数据输入流读取的数据,DataInputStream有一点需要注意,对于多线程访问不一定是安全的,线程安全是可以通过方法设置,它由此方法的使用者负责。
——java.util.zip.DeflaterInputStream(1.6)类:该类为使用“deflate”压缩格式压缩数据实现输入流过滤器。
——java.security.DigestInputStream(1.6)类:使用通过流的位更新关联消息摘要的透明流,要完成消息摘要计算,先要调用此摘要输入流的一个read方法,之后在关联的信息摘要上调用一个digest方法。开启或关闭此流都是可能的,开启的时候,调用read方法之一将导致消息摘要的更新,但是关闭的时候,不更新消息摘要,该流在默认情况下是开启的。
——java.util.zip.InflaterInputStream(1.6)类:此类为解压缩“deflate”压缩格式的数据实现流过滤器,它还用做其他解压过滤器的基础。
——java.util.zip.GZIPInputStream(1.6)类:此类为读取GZIP文件格式的压缩数据实现流过滤器
——java.util.zip.ZipInputStream(1.6)类:该类为读取ZIP文件格式的文件输入流过滤器。包括对已知和未压缩条目的支持。
——java.util.jar.JarInputStream(1.2)类:JarInputStream类用于从任何输入流读取JAR文件内容,它扩展了java.util.zip.ZipInputStream类,使之支持读取可选的Manifest条目,Manifest可用于存储有关JAR文件及其条目的元信息
——LineNumberInputStream(1.0)类【已过时】该类已经过时这里不做讨论
——javax.swing.ProgressMonitorInputStream类:监视读取某些InputStream的进度,这可以创建一个进度监视器,以监视读取输入流的进度,如果需要一段时间,将会弹出ProgressDialog,以通知用户,该类一般在Java Swing的开发中更加常见。
——PushbackInputStream(1.0)类:该类为另一个输入流添加性能,即“推回(push back)”“取消读取(unread)”一个字节的能力,在代码片段可以很方便地读取由特定字节值分割的不定数据的数据字节时,这很有用;在读取终止字节后,代码片段可以“取消读取”该字节,这样,输入流上的下一个读取操作将会重新读取被推回的字节。
【*:org.omg的子包里面的两个类这里不做说明,IO部分暂时不涉及这一块内容,而且我自己平时用得也很少】
——ObjectInputStream(1.1)类:【该类在序列化和反序列化章节进行介绍】
——PipedInputStream(1.0)类:管道输入流应该连接到通道输出流,管道输入流提供要写入管道输出流的所有数据字节,通常数据由某个线程从PipedInputStream对象读取,并由其他线程将其写入到相应的PipedOutputStream。不建议对这两个对象尝试使用单个线程,因为这样可能死锁线程。管道输入流包含一个缓冲区,可以在缓冲区限定的范围内将读和写操作分离开,如果向连接管道输出流提供数据字节的线程不再存在,则认为该管道已损坏。
——SequenceInputStream(1.0)类:该类表示其他输入流的逻辑串联,它从输入流的有序集合开始,并且从第一个输入流开始读取,直到文件末尾,接着从第二个输入流读取,依次类推,直到到达包含的最后一个输入流的文件末尾为止。
  OutputStream字节流输出的类结构:
[A]OutputStream(1.0)
|—[C]ByteArrayOutputStream(1.0)
|—[C]FileOutputStream(1.0)
|—[C]FilterOutputStream(1.0)
  |—[C]BufferedOutputStream(1.0)
  |—[C]java.util.zip.CheckedOutputStream(1.6)
  |—[C]javax.crypto.CipherOutputStream(1.4)
  |—[C]DataOutputStream(1.0)
  |—[C]java.util.zip.DeflaterOutputStream(1.6)
    |—[C]java.util.zip.GZIPOutputStream(1.6)
    |—[C]java.util.zip.ZipOutputStream(1.6)
      |—[C]java.util.jar.JarOutputStream(1.6)
  |—[C]java.security.DigestOutputStream
  |—[C]java.util.zip.InflaterOutputStream(1.6)
  |—[C]PrintStream(1.0)
    |—[C]java.rmi.server.LogStream(1.1)【已过时】
|—[C]ObjectOutputStream(1.1)
|—[A]org.omg.CORBA.portable.OutputStream(1.2)
  |—[A]org.omg.CORBA_2_3.portable.OutputStream(1.2)
|—[C]PipedOutputStream(1.0)
  OutputStream类是表示字节流输出的所有类的超类,它的子类如下:
——ByteArrayOutputStream(1.0)类:此类实现了一个输出流,其中的数据被写入一个byte数组,缓冲区会随着数据的不断写入而自动增长,可使用toByteArray()toString()方法获取数据。
——FileOutputStream(1.0)类:文件输出流是用于将数据写入File或FileDescriptor的输出流,文件是否可用或能否可以被创建取决于基础平台,特别是某些平台一次只允许一个FileOutputStream打开文件进行写入,在这种情况下,如果所涉及的文件已经打开,则此类的构造方法将会失败。
——FilterOutputStream(1.0)类:此类是过滤输出流的所有类的超类,这些流位于已存在的输出流之上,它们将已存在的输出流作为基本数据接收器,但可能直接传输数据或提供一些额外的功能。FilterOutputStream类本身只是简单地重写那些将所有请求传递给所包含输出的OutputStream的所有方法。FilterOutputStream的子类可进一步地重写这些方法中的一些方法,并且还可以提供一些额外的方法和字段。
——BufferedOutputStream(1.0)类:该类实现缓冲的输出流,通过设置这种输出流,应用程序就可以将各个字节写入底层输出流中,而不必针对每次字节写入调用底层系统。
——java.util.zip.CheckedOutputStream(1.6)类:需要维护写入压缩包的输出流,主要用来维护校验和,校验和可以用于验证输出数据的完整性
——javax.crypto.CipherOutputStream(1.4)类:该类由一个OutputStream一个Cipher组成,这样writer()方法才能在将数据写出到底层OutputStream之前对数据进行处理,在由CipherOutputStream使用之前,密码必须充分进行初始化。比如密码初始化加密,CipherOutputStream将在写出该加密数据之前尝试加密该数据,该类和CipherInputStream相对应
——DataOutputStream(1.0)类:数据输出流允许应用程序以适当的方式将基本Java数据类型写入输出流中,然后,该应用程序可以使用数据输入流将数据读入。
——java.util.zip.DeflaterOutputStream(1.6)类:此类为使用“deflate”压缩格式压缩数据实现输出流过滤器,它还用作其他类型的压缩过滤器的基础
——java.util.zip.GZIPOutputStream(1.6)类:此类为使用GZIP文件格式写入压缩数据实现流过滤器
——java.util.zip.ZipOutputStream(1.6)类:该类为以ZIP文件格式写入文件实现输出流过滤器,包括对已压缩和未压缩的条目的支持
——java.util.zip.JarOutputStream(1.4)类:该类用于向任何输出流写入JAR文件内容,它扩展了ZipOutputStream类,使之支持编写可选的Manifest条目,Manifest可用于指定有关JAR文件以及条目的元信息。
——java.security.DigestOutputStream类:使用通过流的位更新关联消息摘要的透明流,要完成消息摘要的计算,先要调用此摘要输出流的一个write方法,之后在关联的消息摘要上调用digest方法之一。开启或关闭此流都是可能见的,开启时,调用write方法之一将导致消息摘要的更新,但是关闭的时候不需要消息更新,流在默认情况下是开启的。
——java.util.zip.InflaterOutputStream(1.6)类:为解压缩“deflate”压缩格式存储的数据实现输出流过滤器
——PrintStream(1.0)类:该类为其他输出流添加了功能,使它们能够方便地答应各种数据值表示形式,它还提供其他两项功能,与其他输出流不同,PrintStream永远不会抛出IOException;而是,异常情况仅设置可通过checkError方法测试的内部标志,另外,为了自动刷新,可以创建一个PrintStream;这意味着可在写入byte数组之后自动调用flush方法,不需要手动调用,可以调用其中一个println方法,该方法末尾会写入一个“\n”符
——java.rmi.server.LogStream(1.1)类:【已过时】,该方法提供一种记录错误的机制,这一机制专门用来监视系统运行情况
——ObjectOutputStream(1.1)类:【该类在序列化和反序列化章节进行介绍】
【*:org.omg的子包里面的两个类这里不做说明,IO部分暂时不涉及,而且我自己平时用得也很少】
——PipedOutputStream(1.0)类:可以将管道输出流连接到管道输入流来创建通信管道,管道输出流是管道的发送端,通常,数据由某个线程写入PipedOutputStream对象,并由其他线程从连接的PipedInputStream读取,不建议对这两个对象尝试使用单个线程,因为这样有可能造成使用线程死锁,如果某个线程正从连接的管道输入流中读取数据字节,但该线程不再处于活动状态,则该管道损毁。
  [3]字节流IO类的操作:
  InputStream抽象类中的操作:
abstract intread():
该方法用来读取字节,并且返回读取到的字节,如果这个字节流结束的时候,这个方法会返回-1
intread(byte[] b):
该方法将读取到的字节存储在传入的一个字节缓冲区也就是一个字节数组里面,而且每一次按照该数组的长度(b.length)读取字节,和上边方法一样,如果读取到字节流的末尾该方法会返回-1
intread(byte[] b,intoff,intlen):
和上边方法一模一样,唯一不同的是三个参数:
  • b:将数据读入的缓冲区字节数组
  • off:将字节放入的数组的第一个位置
  • len:需要读取的字节的最大长度
【*:这两个方法都是使用一个自定义的字节数组作为读取过程的读取缓冲区,只是操作方法不一样,具体操作可以根据当时的需求来选择。】
longskip(longn):
在输入流里面跳过n个字节,该方法返回跳过的字节数(前提条件是跳过的字节长度比流数据的总长度要小)
intavailable():
返回数据流里面合法数据的流数据块的数据流的字节长度
voidclose():
关闭输入流
voidmark(intreadlimit):
在输入流的某个地方放入一个标记,如果超过readlimit的字节数需要读取,则该字节流会自动忽略该标记
voidreset():
返回输入流的最后一个标记,一般情况用来重置该输入流
booleanmarkSupported():
判断一个输入流是否支持标记功能,如果不支持标记功能就直接返回false,反之返回true
  OutputStream抽象类中的操作:
abstract voidwrite(intn):
写入n个字节的数据
voidwrite(color: #3d8
分享到:
评论
shangjava
  • 浏览: 297855 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

你可能感兴趣的:(java,数据结构,C++,c,C#)