Java I/O 相关面试题

1、I/O 流的分类
按照读写的单位大小来分:
字符流:以字符为单位,每次次读入或读出是 16 位数据。其只能读取字符类型数据。
(Java 代码接收数据为一般为 char 数组,也可以是别的)
字节流:以字节为单位,每次次读入或读出是 8 位数据。可以读任何类型数据,图片、文
件、音乐视频等。 (Java 代码接收数据只能为 byte 数组)
按照实际 IO 操作来分:
输出流:从内存读出到文件。只能进行写操作。
输入流:从文件读入到内存。只能进行读操作。
注意 :输出流可以帮助我们创建文件,而输入流不会。
按照读写时是否直接与硬盘,内存等节点连接分:
节点流:直接与数据源相连,读入或读出。
处理流:也叫包装流,是对一个对于已存在的流的连接进行封装,通过所封装的流的功能
调用实现数据读写。如添加个 Buffering 缓冲区。(意思就是有个缓存区,等于软件和
mysql 中的 redis)
注意 :为什么要有处理流?主要作用是在读入或写出时,对数据进行缓存,以减少 I/O 的
次数,以便下次更好更快的读写文件,才有了处理流。
2、字节流如何转为字符流?
字节输入流转字符输入流通过 InputStreamReader 实现,该类的构造函数可以传入
InputStream 对象。
字节输出流转字符输出流通过 OutputStreamWriter 实现,该类的构造函数可以传入
OutputStream 对象。
3、字节流和字符流,你更喜欢使用哪一个?
个人来说, 更喜欢使用字符流,因为他们更新一些。许多在字符流中存在的特性,字节流
中不存在。比如使用 BufferedReder 而不是 BufferedInputStreams 或 DataInputStream,
使用 newLine()方法来读取下 一行,但是在字节流中我们需要做额外的操作。
4、System.out.println 是什么?
println 是 PrintStream 的一个方法。out 是一个静态 PrintStream 类型的成员变量,
System 是一个 java.lang 包中的类,用于和底层的操作系统进行交互。
5、什么是 Filter 流?
Filter Stream 是一种 IO 流主要作用是用来对存在的流增加一些额外的功能,像给目标文
件增加源文件中不存在的行数,或者增加拷贝的性能。
5、有哪些可用的 Filter 流?
在 java.io 包中主要由 4 个可用的 filter Stream。两个字节 filter stream,两个字符 filter
stream. 分别是 FilterInputStream, FilterOutputStream, FilterReader and FilterWriter.这
些类是抽象类,不能被实例化的。
6、有哪些 Filter 流的子类?
LineNumberInputStream 给目标文件增加行号
DataInputStream 有些特殊的方法如 readInt(), readDouble()和 readLine() 等可以读取
一个 int, double 和一个 string 一次性的,
BufferedInputStream 增加性能
PushbackInputStream 推送要求的字节到系统中
7、NIO 和 I/O 的主要区别
面向流与面向缓冲
Java IO 和 NIO 之间第一个最大的区别是,IO 是面向流的,NIO 是面向缓冲区的。 Java
IO 面向流意味着每次从流中读一个或多个字节,直至读取所有字节,它们没有被缓存在任何
地方。此外,它不能前后移动流中的数据。如果需要前后移动从流中读取的数据,需要先将它
缓存到一个缓冲区。 Java NIO 的缓冲导向方法略有不同。数据读取到一个它稍后处理的缓冲
区,需要时可在缓冲区中前后移动。这就增加了处理过程中的灵活性。但是,还需要检查是否
该缓冲区中包含所有您需要处理的数据。而且,需确保当更多的数据读入缓冲区时,不要覆盖
缓冲区里尚未处理的数据。
阻塞与非阻塞 IO
Java IO 的各种流是阻塞的。这意味着,当一个线程调用 read() 或 write()时,该线程被
阻塞,直到有一些数据被读取,或数据完全写入。该线程在此期间不能再干任何事情了。Java
NIO 的非阻塞模式,使一个线程从某通道发送请求读取数据,但是它仅能得到目前可用的数
据,如果目前没有数据可用时,就什么都不会获取,而不是保持线程阻塞,所以直至数据变的
可以读取之前,该线程可以继续做其他的事情。 非阻塞写也是如此。一个线程请求写入一些
数据到某通道,但不需要等待它完全写入,这个线程同时可以去做别的事情。 线程通常将非
阻塞 IO 的空闲时间用于在其它通道上执行 IO 操作,所以一个单独的线程现在可以管理多个
输入和输出通道(channel)。
选择器(Selectors)
Java NIO 的选择器允许一个单独的线程来监视多个输入通道,你可以注册多个通道使用
一个选择器,然后使用一个单独的线程来“选择”通道:这些通道里已经有可以处理的输入,
或者选择已准备写入的通道。这种选择机制,使得一个单独的线程很容易来管理多个通道。
NIO 提供了与标准 IO 不同的 IO 工作方式:
Channels and Buffers(通道和缓冲区):标准的 IO 基于字节流和字符流进行操作的,
而 NIO 是基于通道(Channel)和缓冲区(Buffer)进行操作,数据总是从通道读取到缓冲
区中,或者从缓冲区写入到通道中。
Asynchronous IO(异步 IO):Java NIO 可以让你异步的使用 IO,例如:当线程从通
道读取数据到缓冲区时,线程还是可以进行其他事情。当数据被写入到缓冲区时,线程可以继
续处理它。从缓冲区写入通道也类似。
Selectors(选择器):Java NIO 引入了选择器的概念,选择器用于监听多个通道的事件
(比如:连接打开,数据到达)。因此,单个的线程可以监听多个数据通道。
8、BIO、NIO、AIO 有什么区别?
BIO (Blocking I/O) :同步阻塞 I/O 模式,数据的读取写入必须阻塞在一个线程内等待
其完成。在活动连接数不是特别高(小于单机 1000)的情况下,这种模型是比较不错的,可
以让每一个连接专注于自己的 I/O 并且编程模型简单,也不用过多考虑系统的过载、限流等
问题。线程池本身就是一个天然的漏斗,可以缓冲一些系统处理不了的连接或请求。但是,当
面对十万甚至百万级连接的时候,传统的 BIO 模型是无能为力的。因此,我们需要一种更高
效的 I/O 处理模型来应对更高的并发量。
NIO (New I/O) : NIO 是一种同步非阻塞的 I/O 模型,在 Java 1.4 中引入了 NIO 框
架,对应 java.nio 包,提供了 Channel , Selector,Buffer 等抽象。NIO 中的 N 可以理解为
Non-blocking,不单纯是 New。它支持面向缓冲的,基于通道的 I/O 操作方法。NIO 提供
了与传统 BIO 模型中的 Socket 和 ServerSocket 相对应 de 的 SocketChannel 和
ServerSocketChannel 两种不同的套接字通道实现,两种通道都支持阻塞和非阻塞两种模式。
阻塞模式使用就像传统中的支持一样,比较简单,但是性能和可靠性都不好;非阻塞模式正好
与之相反。对于低负载、低并发的应用程序,可以使用同步阻塞 I/O 来提升开发速率和更好的
维护性;对于高负载、高并发的(网络)应用,应使用 NIO 的非阻塞模式来开发。
AIO (Asynchronous I/O) : AIO 也就是 NIO 2。在 Java 7 中引入了 NIO 的改进版
NIO 2,它是异步非阻塞的 IO 模型。异步 IO 是基于事件和回调机制实现的,也就是应用操作
之后会直接返回,不会堵塞在那里,当后台处理完成,操作系统会通知相应的线程进行后续的
操作。AIO 是异步 IO 的缩写,虽然 NIO 在网络操作中,提供了非阻塞的方法,但是 NIO 的
IO 行为还是同步的。对于 NIO 来说,我们的业务线程是在 IO 操作准备好时,得到通知,接
着就由这个线程自行进行 IO 操作,IO 操作本身是同步的。查阅网上相关资料,我发现就目前
来说 AIO 的应用还不是很广泛,Netty 之前也尝试使用过 AIO,不过又放弃了。
9、NIO 有哪些核心组件?
Channel Buffer Selector
Channel 和流有点类似。通过 Channel,我们即可以从 Channel 把数据写到 Buffer 中,
也可以把数据冲 Buffer 写入到 Channel,每个 Channel 对应一个 Buffer 缓冲区,Channel
会注册到 Selector。Selector 根据 Channel 上发生的读写事件,将请求交由某个空闲的线程
处理,Selector 对应一个或多个线程,Channnel 和 Buffer 是可读可写的。
10、select、poll 和 epoll 什么区别
它们是 NIO 多路复用的三种实现机制,是有 Linux 系统提供。
select:无差别轮询所有流,找出能读出数据,或者写入数据的流,对他们进行操作,会
维护一个文件描述符 FD 的集合 fd_set,将 fd_set 从用户空间复制到内核空间。x86
fd_set 是数组结构
poll:与 select 机制相似,fd_set 结构进行优化,突破操作系统限制,pollfd 代替
fd_set,链表结构
epoll:不再扫描所以 fd,只将用户关心的事件放在内核的一个事件表中,减少用户空间
和内核空间的数据拷贝。epoll 可以理解为 event poll,不同于忙轮询和无差别轮询,
epoll 会把哪个流发生了怎样的 I/O 事件通知我们。
11、什么是 Java 序列化,如何实现 Java 序列化?
序列化就是一种用来处理对象流的机制,将对象的内容进行流化。可以对流化后的对象进
行读写操作,可以将流化后的对象传输于网络之间。
序列化是为了解决在对象流读写操作时所引发的问题 序列化的实现:将需要被序列化的类
实现 Serialize 接口,没有需要实现的方法,此接口只是为了标注对象可被序列化的,然后使
用一个输出流(如:FileOutputStream)来构造一个 ObjectOutputStream(对象流)对象,
再使用 ObjectOutputStream 对象的 write(Object obj)方法就可以将参数 obj 的对象写出。
12、如何实现对象克隆?
有两种方式:
1. 实现 Cloneable 接口并重写 Object 类中的 clone()方法;
2. 实现 Serializable 接口,通过对象的序列化和反序列化实现克隆,可以实现真正的深度克
隆。
13、什么是缓冲区?有什么作用?
缓冲区就是一段特殊的内存区域,很多情况下当程序需要频繁地操作一个资源(如文件或
数据库)则性能会很低,所以为了提升性能就可以将一部分数据暂时读写到缓存区,以后直接
从此区域中读写数据即可,这样就可以显著的提升性能。
对于 Java 字符流的操作都是在缓冲区操作的,所以如果我们想在字符流操作中主动将缓
冲区刷新到文件则可以使用 flush() 方法操作。
14、什么是阻塞 IO?什么是非阻塞 IO?
IO 操作包括:对硬盘的读写、对 socket 的读写以及外设的读写。
当用户线程发起一个 IO 请求操作(本文以读请求操作为例),内核会去查看要读取的数
据是否就绪,对于阻塞 IO 来说,如果数据没有就绪,则会一直在那等待,直到数据就绪;对
于非阻塞 IO 来说,如果数据没有就绪,则会返回一个标志信息告知用户线程当前要读的数据
没有就绪。当数据就绪之后,便将数据拷贝到用户线程,这样才完成了一个完整的 IO 读请求
操作,也就是说一个完整的 IO 读请求操作包括两个阶段:
1.查看数据是否就绪;
2.进行数据拷贝(内核将数据拷贝到用户线程)
那么阻塞(blocking IO)和非阻塞(non-blocking IO)的区别就在于第一个阶段,如果
数据没有就绪,在查看数据是否就绪的过程中是一直等待,还是直接返回一个标志信息。
Java 中传统的 IO 都是阻塞 IO,比如通过 socket 来读数据,调用 read()方法之后,如果
数据没有就绪,当前线程就会一直阻塞在 read 方法调用那里,直到有数据才返回;而如果是
非阻塞 IO 的话,当数据没有就绪,read()方法应该返回一个标志信息,告知当前线程数据没
有就绪,而不是一直在那里等待。
15、请说一下 PrintStream BufferedWriter PrintWriter 有什么不同?
PrintStream 类的输出功能非常强大,通常如果需要输出文本内容,都应该将输出流包装
成 PrintStream 后进行输出。它还提供其他两项功能。与其他输出流不同,PrintStream 永远
不会抛出 IOException;而是,异常情况仅设置可通过 checkError 方法测试的内部标志。另
外,为了自动刷新,可以创建一个 PrintStream
BufferedWriter:将文本写入字符输出流,缓冲各个字符从而提供单个字符,数组和字符串
的高效写入。通过 write()方法可以将获取到的字符输出,然后通过 newLine()进行换行操
作。BufferedWriter 中的字符流必须通过调用 flush 方法才能将其刷出去。并且
BufferedWriter 只能对字符流进行操作。如果要对字节流操作,则使用
BufferedInputStream。
PrintWriter 的 println 方法自动添加换行,不会抛异常,若关心异常,需要调用
checkError 方法看是否有异常发生,PrintWriter 构造方法可指定参数,实现自动刷新缓存
(autoflush)。

你可能感兴趣的:(java,jvm,面试)