byte[] 转换成String,再getBytes()之后byte[]内容与原数组不同

这里写图片描述
#问题代码

 byte[] bytes = new byte[]{40, -37, -96, 46, -75, -10};
 byte[] myBytes = new String(bytes).getBytes();
 System.out.println(Arrays.toString(bytes));
 System.out.println(Arrays.toString(myBytes));

#输出结果
输出结果

#问题原因

new String( byte[] )和 getBytes() 默认使用的编码都是通过这条语句获取的编码

String csn = Charset.defaultCharset().name();

byte[] 转换成String,再getBytes()之后byte[]内容与原数组不同_第1张图片

byte[] 转换成String,再getBytes()之后byte[]内容与原数组不同_第2张图片

而我当前环境的编码为UTF-8
这里写图片描述

所以在我的环境下,下面两句代码实际上是等效的

byte[] bytes1 = new String(bytes).getBytes();
byte[] bytes2 = new String(bytes, CharEncoding.UTF_8).getBytes(CharEncoding.UTF_8);

解决原理

由于 UTF-8 是多字节编码,需要用多个字节来表示一个字符的编码,所以也就出现了在转换之后 byte[] 数组长度、内容不一致的情况。

而 ISO-8859-1 编码是单字节编码,所以使用该编码就不会出现上面的问题

byte[] bytes3 = new String(bytes, CharEncoding.ISO_8859_1).getBytes(CharEncoding.ISO_8859_1);

你可能感兴趣的:(byte[] 转换成String,再getBytes()之后byte[]内容与原数组不同)