我们在 Java 中经常会碰到如何把 InputStream 转换成 String 的情形,比如从文件或网络得到一个 InputStream,需要转换成字符串输出或赋给别的变量。
未真正关注这个问题之前我常用的办法就是按字节一次次读到缓冲区,或是建立 BufferedReader 逐行读取。其实大可不必费此周折,我们可以用 Apache commons IOUtils,或者是 JDK 1.5 后的 Scanner,还可用 Google Guava 库的 CharStreams。到了 JDK7,若要从文件中直接得到字符串还能用 java.nio.file.Files#readAllLines 和 java.nio.file.Files#readAllBytes 方法。
下面看各个例子,为能够实际用运,例子写在 main 方法里,并从文件获得一个 InputStream,代码中把可能要捕获的异常抛出来。再就是注意处理输入输出流时有涉及到字符集,字符集乱了就乱码了,默认字符集是 System.getProperty("file.encoding"),通常我们都用 UTF-8,异常 UnsupportedEncodingException 继承自 IOException。
下面的 6 个方法中应该有一个你能看得上的吧,用 Groovy,Scala 的除外,若未找到一个遂意的,告诉我,你有好办法更应该告诉我。
1. 使用 JDK 5 的 Scanner
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
package
cc.unmi.test;
import
java.io.FileInputStream;
import
java.io.FileNotFoundException;
import
java.io.InputStream;
import
java.util.Scanner;
/**
*
* @author Unmi
* @Creation date: 2013-02-01
*/
public
class
Test {
/**
* @param args
* @throws FileNotFoundException
*/
public
static
void
main(String[] args)
throws
FileNotFoundException {
InputStream inputStream =
new
FileInputStream(
"d:/sample.txt"
);
Scanner scanner =
new
Scanner(inputStream,
"UTF-8"
);
String text = scanner.useDelimiter(
"\\A"
).next();
System.out.println(text);
scanner.close();
}
}
|
2. JDK1.4 及之前的 BufferedReader 法
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
package
cc.unmi.test;
import
java.io.BufferedReader;
import
java.io.FileInputStream;
import
java.io.IOException;
import
java.io.InputStream;
import
java.io.InputStreamReader;
/**
*
* @author Unmi
* @Creation date: 2013-02-01
*/
public
class
Test {
/**
* @param args
* @throws IOException
*/
public
static
void
main(String[] args)
throws
IOException {
InputStream inputStream =
new
FileInputStream(
"d:/sample.txt"
);
StringBuilder stringBuilder =
new
StringBuilder();
BufferedReader bufferedReader =
new
BufferedReader(
new
InputStreamReader(inputStream));
boolean
firstLine =
true
;
String line =
null
; ;
while
((line = bufferedReader.readLine()) !=
null
){
if
(!firstLine){
stringBuilder.append(System.getProperty(
"line.separator"
));
}
else
{
firstLine =
false
;
}
stringBuilder.append(line);
}
System.out.println(stringBuilder.toString());
}
}
|
中间那些判断是不是第一行来决定是否加换行符是些杂音。
3. JDK1.4 及之前的 readBytes 法
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
package
cc.unmi.test;
import
java.io.FileInputStream;
import
java.io.IOException;
import
java.io.InputStream;
/**
*
* @author Unmi
* @Creation date: 2013-02-01
*/
public
class
Test {
/**
* @throws IOException
*/
public
static
void
main(String[] args)
throws
IOException {
InputStream inputStream =
new
FileInputStream(
"d:/sample.txt"
);
byte
[] buffer =
new
byte
[
2048
];
int
readBytes =
0
;
StringBuilder stringBuilder =
new
StringBuilder();
while
((readBytes = inputStream.read(buffer)) >
0
){
stringBuilder.append(
new
String(buffer,
0
, readBytes));
}
System.out.println(stringBuilder.toString());
}
}
|
缓冲区的大小自己根据实际来调,比 BufferedReader 还简洁些,不需管换行符的事情。