Java IO操作之字符编码

说明

在 Java 开发中,最常见的编码类型有 ISO8859-1,GBK/GB2312,Unicode,UTF-8 等编码格式。

  • ISO8859-1:属于单字节编码,只能表示0 ~ 255 的字符范围,主要应用于英文。
  • GBK/GB2312:属于中文编码,专门用来表示汉字,是双字节编码。GBK 可以表示简体中文和繁体中文;GB2312 只能表示简体中文,GBK兼容GB2312。
  • Unicode:Java 中使用此编码,是最标准的一种编码,使用十六进制编码,但是不兼容 ISO8859-1。
  • UTF:UTF 兼容 ISO8859-1,同事可以用来表示所有的语言字符,UTF 编码是不定长度的,每个一个字符为 1 ~ 6个字节不等。一般在中文网页中使用此编码,可以节省空间。

获取本机的编码显示

通过 System 类,可以获取到系统的相关信息。

public class Demo {
	public static void main(String[] args) {
		
		// 输出系统相关的信息
		System.getProperties().list(System.out);
		
		// 获取系统默认编码
		System.out.println( System.getProperty("file.encoding") );	// GBK
	}
}

控制台输出:

由于控制台输出太多,截取一部分

-- listing properties --
java.runtime.name=Java(TM) SE Runtime Environment
sun.boot.library.path=D:\JDK\jdk1.8.0_91\jre\bin
java.vm.version=25.91-b15
java.vm.vendor=Oracle Corporation
java.vendor.url=http://java.oracle.com/
path.separator=;
java.vm.name=Java HotSpot(TM) 64-Bit Server VM
file.encoding.pkg=sun.io
user.script=
user.country=CN
sun.java.launcher=SUN_STANDARD
sun.os.patch.level=
java.vm.specification.name=Java Virtual Machine Specification
user.dir=E:\WorkspaceEclipse\java8Study
java.runtime.version=1.8.0_91-b15
java.awt.graphicsenv=sun.awt.Win32GraphicsEnvironment
java.endorsed.dirs=D:\JDK\jdk1.8.0_91\jre\lib\endorsed
os.arch=amd64
java.io.tmpdir=C:\Users\Wayfreem\AppData\Local\Temp\
line.separator=

通过流进行编码

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
 
public class Demo {
	public static void main(String[] args) throws Exception {// 此处直接抛出错误
		File file = new File("e:" + File.separator + "demo" + File.separator + "my.txt");
		if (!file.getParentFile().exists()) {
			file.getParentFile().mkdirs();
		}
		OutputStream out = new FileOutputStream(file);
		// 不使用编码 out.write("使用流转换编码格式".getBytes());// 没有进行编码

		out.write("使用流转换编码格式".getBytes("ISO8859-1"));// 进行编码
		out.close();
	}
 
}

你可能感兴趣的:(Java,IO)