知识即信仰

Java IO流原理之常用字节流和字符流详解以及Buffered高效的原理

JavaIO流原理之常用字节流和字符流详解以及Buffered高效的原理

转载地址：http://www.cnblogs.com/ygj0930/p/5827509.html

Java的流体系十分庞大，我们来看看体系图：

这么庞大的体系里面，常用的就那么几个，我们把它们抽取出来，如下图：

一：字节流

1：字节输入流

字节输入流的抽象基类是InputStream，常用的子类是 FileInputStream和BufferedInputStream。

1）FileInputStream

文件字节输入流：一切文件在系统中都是以字节的形式保存的，无论你是文档文件、视频文件、音频文件...，需要读取这些文件都可以用FileInputStream去读取其保存在存储介质（磁盘等）上的字节序列。

FileInputStream在创建时通过把文件名作为构造参数连接到该文件的字节内容，建立起字节流传输通道。

然后通过 read()、read(byte[])、read(byte[],int begin,int len) 三种方法从字节流中读取一个字节、一组字节。

2）BufferedInputStream

带缓冲的字节输入流：上面我们知道文件字节输入流的读取时，是直接同字节流中读取的。由于字节流是与硬件（存储介质）进行的读取，所以速度较慢。而CPU需要使用数据时通过read()、read(byte[])读取数据时就要受到硬件IO的慢速度限制。我们又知道，CPU与内存发生的读写速度比硬件IO快10倍不止，所以优化读写的思路就有了：在内存中建立缓存区，先把存储介质中的字节读取到缓存区中。CPU需要数据时直接从缓冲区读就行了，缓冲区要足够大，在被读完后又触发fill()函数自动从存储介质的文件字节内容中读取字节存储到缓冲区数组。

BufferedInputStream 内部有一个缓冲区，默认大小为8M，每次调用read方法的时候，它首先尝试从缓冲区里读取数据，若读取失败（缓冲区无可读数据），则选择从物理数据源（譬如文件）读取新数据（这里会尝试尽可能读取多的字节）放入到缓冲区中，最后再将缓冲区中的内容返回给用户.由于从缓冲区里读取数据远比直接从存储介质读取速度快，所以BufferedInputStream的效率很高。

public synchronized int read() throws IOException {  
    if (pos >= count) {         // 检查是否有可读缓冲数据  
        fill();                 // 没有缓冲数据可读，则从物理数据源读取数据并填充缓冲区  
        if (pos >= count)       // 若物理数据源也没有多于可读数据，则返回-1，标示EOF  
        return -1;  
    }  
  
   // 从缓冲区读取buffer[pos]并返回（由于这里读取的是一个字节，而返回的是整型，所以需要把高位置0。如果是读取一组字节，则返回读取长度的字节数组）  
    return getBufIfOpen()[pos++] & 0xff;     
}

2：字节输出流

字节输出流的抽象基类是OutputStream，其具体使用的子类是FileOutputStream和BufferedOutputStream。

1)FileOutputStream

文件字节输出流：作为文件字节输入流的逆过程，其实就是在创建时通过文件名创建输出流连接到要写入的文件处，然后通过 write(int)/write(byte[]) 方法把输出内容写到输出流中。

2）BufferedOutputStream

带缓冲的字节输出流：其优化输出速度的思路也是通过在内存中建立缓冲区，CPU直接把内容写到内存中的缓冲区，这样比较快。之后CPU继续干自己的事，后台并行地进行耗时慢速度的真正输出操作——把缓冲区的数据输出到输出流，写入文件的存储介质中。

在创建BufferedOutputStream时，通过一个outputStream参数（在创建outputStream时通过文件名建立起输出流）把已经建立的输出流包装成带缓冲的输出流，在内存中创建一个默认大小是8M的缓冲数组；

在程序运行过程中，通过write(int)/write(byte[])方法向缓冲数组写入数据，如果某时刻缓冲数组满了，则自动触发压入操作——把数组内容写到真正的输出流去，传输到文件中。

如果你想在某些write操作后确保内容能及时输出而不等到数组满时自动输出，则可以调用 flush() 方法强行刷新数组，把缓冲数组的内容全部写入输出流。

二：字符流

字符流是专门用来读写文档文件的高速输入输出流。

为何要有字符流：上面我们说到了文件字节流是可以读写一切文件的，包括文档文件，那为何还要多创造一个字符流呢？

首先我们要知道，文档文件在系统中的呈现原理：文件在系统中是以字节形式存在的，那么它在系统中如何表示成字符？因为它从系统中读取出来呈现时经过了系统的某种编码格式进行编码，从而显示成了字符。比如：我们知道的UTF-8或者汉语系统中的GBK编码形式，就可以把中文文档的字节序列读取出来解码成中文呈现。

然后我们需要知道：Java程序是运行在Java虚拟机上面的，Java虚拟机也是一个系统，但是它和文件直接保存的所在系统不一样，有可能双方对文档文件的字节序列的解码格式不一样。所以，如果直接读取字节序列，然后让Java虚拟机来解码呈现的话有可能因为编码格式不一致而导致乱码显示。要解决这个问题，就有了字符流。

字符流的原理：它可以在创建时，指定流的编码形式，使得读取到的字节序列根据其在系统中保存时采用的编码格式进行解码，然后把解析好的字符交给Java虚拟机使用，这样就避免了文件所在的系统与Java虚拟机解码不一致导致乱码。

1：字符输入流

字符输入流的抽象基类是Reader，其常用子类有 InputStreamReader和BufferedReader。

1）InputSreamReader

最基本的字符输入流。

在创建时，通过包装一个连接到文档文件的字节输入流，并指定编码格式（不指定则采用默认字符集）对字节输入流进行解码（底层是通过创建一个相应编码格式的流解码器StreamDecoder实现的，这里就不展开了）。

InputStreamReader(InputStream in) 
          创建一个使用默认字符集的 InputStreamReader。 
InputStreamReader(InputStream in, Charset cs) 
          创建使用给定字符集的 InputStreamReader。 
InputStreamReader(InputStream in, CharsetDecoder dec) 
          创建使用给定字符集解码器的 InputStreamReader。 
InputStreamReader(InputStream in, String charsetName) 
          创建使用指定字符集的 InputStreamReader。

然后通过

 int read() 
          读取单个字符。 
 int read(char[] cbuf, int offset, int length) 
          将字符读入数组中的某一部分。

方法读取字符：因为在读取过程中已经经过解码，所以获得的结果是字符char而不是字节byte。

2）BufferedReader

带缓冲的字符输入流：原理与BufferedInputStream一样，都是在内存中维护一个足够大的缓冲区。每次读时从缓冲区读取数据并解码，缓冲区空了则自动调用fill()填充缓冲区。

唯一区别在于：BufferedRead除了read()、read(char[])两个方法外，多了一个 readLine() 方法：读取一个文本行，通过下列字符之一认为某行已终止：换行 ('\n')、回车 ('\r') 或回车后直接跟着换行。

2：字符输出流

字符输出流的抽象基类是 Writer，其具体子类是OutputStreamWriter和BufferedWriter。

1）OutputStreamWriter

OutputStreamWriter不是简单地从FileOutputStream进行了编码包装，它是有缓冲的，但缓冲不是它自己实现的，而是依赖其组合的流编码类自带的。OutputStreamWriter源码分析如下：

public class OutputStreamWriter extends Writer {

// 流编码类，所有操作都交给它完成。

private final StreamEncoder se;


// 创建使用指定字符的OutputStreamWriter。

public OutputStreamWriter(OutputStream out, String charsetName)


throws UnsupportedEncodingException

{


super(out);


if (charsetName == null)



throw new NullPointerException("charsetName");


se = StreamEncoder.forOutputStreamWriter(out, this, charsetName);

}


// 创建使用默认字符的OutputStreamWriter。

public OutputStreamWriter(OutputStream out) {


super(out);


try {



se = StreamEncoder.forOutputStreamWriter(out, this, (String)null);


} catch (UnsupportedEncodingException e) {



throw new Error(e);


}

}


// 创建使用指定字符集的OutputStreamWriter。

public OutputStreamWriter(OutputStream out, Charset cs) {


super(out);


if (cs == null)



throw new NullPointerException("charset");


se = StreamEncoder.forOutputStreamWriter(out, this, cs);

}


// 创建使用指定字符集编码器的OutputStreamWriter。

public OutputStreamWriter(OutputStream out, CharsetEncoder enc) {


super(out);


if (enc == null)



throw new NullPointerException("charset encoder");


se = StreamEncoder.forOutputStreamWriter(out, this, enc);

}


// 返回该流使用的字符编码名。如果流已经关闭，则此方法可能返回 null。

public String getEncoding() {


return se.getEncoding();

}


// 刷新输出缓冲区到底层字节流，而不刷新字节流本身。该方法可以被PrintStream调用。

void flushBuffer() throws IOException {


se.flushBuffer();

}


// 写入单个字符

public void write(int c) throws IOException {


se.write(c);

}


// 写入字符数组的一部分

public void write(char cbuf[], int off, int len) throws IOException {


se.write(cbuf, off, len);

}


// 写入字符串的一部分

public void write(String str, int off, int len) throws IOException {


se.write(str, off, len);

}


// 刷新该流。可以发现，刷新缓冲区其实是通过流编码类的flush()实现的，故可以看出，缓冲区是流编码类自带的而不是OutputStreamWriter实现的。

public void flush() throws IOException {


se.flush();

}


// 关闭该流。

public void close() throws IOException {


se.close();

}
}

每次调用 write() 方法都会导致在给定字符（或字符集）上调用编码转换器。在写入底层输出流之前，得到的这些字节将在缓冲区中累积（传递给 write() 方法的字符没有缓冲，输出数组才有缓冲）。为了获得最高效率，可考虑将 OutputStreamWriter 包装到 BufferedWriter 中，以避免频繁调用转换器。

2）BufferedWriter

带缓冲的字符输出流：与OutputStreamWriter的缓冲不同，BufferedWriter的缓冲是真正由自己创建的缓冲数组来实现的。故此：不需要频繁调用编码转换器进行缓冲，而且，它可以提供单个字符、数组和字符串的缓冲（编码转换器只能缓冲字符数组和字符串）。

BufferedWriter可以在创建时把一个OutputStreamWriter进行包装，为输出流建立缓冲；

然后，通过

void write(char[] cbuf, int off, int len) 
          写入字符数组的某一部分。 
 void write(int c) 
          写入单个字符。 
 void write(String s, int off, int len) 
          写入字符串的某一部分。

向缓冲区写入数据。

还可以通过

 void newLine()

写入一个行分隔符。

最后，可以手动控制缓冲区的数据刷新：

void flush() 刷新该流的缓冲。

你可能感兴趣的:(历史归类)

读《泛广告时代的幻象》3：功利主义之美张雷杰
每个人从上学、生活、工作会不断填写各种档案登记表，人人将自己化整为零，分类填写，然后再分类归档。除了心理层面一些隐秘的世界，个人的生理归类、历史归类、政治归类、社会归类等几乎一切都无所遁形了。洞察消费者正如那一张张的档案登记表，除了要知晓消费者阶层等外在物理属性的特性，更要探寻消费者心理层面“人性弱点”。没错，这是一个贴标签的时代，在新的消费主义盛行下，这是一个技术复制时代、娱乐至死时代、媒介爆棚
MYSQL数据回流 mysql
一般的网站应用中，总会有部分二次数据（处理过的原始数据）展现给前台，比如，拿购物网站来说，购买进口奶粉最多的用户群体；哪类产品消费增长趋势最旺盛；用户的消费历史归类等都是二次数据。由于这部分数据通常是分析后的数据，而且实时性不强，因此这个过程通常是通过离线计算得到。为了展现给前台，需要将这部分数据回流到关系型数据库【离线计算集群一般都是KV存储，不支持SQL
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h