Java中将String转换为字节数组的3种方式

今天,我将讨论程序员的常见任务之一,将String转换为字节数组。这样做可能有多种原因(将内容保存到文件,通过网络发送或其他原因)。假设你有一个字符串“abcd”,并且你想把它转换成字节数组,你会怎样做?记住,String是由char数组构成的,所以它涉及到字符到字节的转换。值得庆幸的是,Java提供了一种方便的getBytes()方法来将String转换为Java中的字节数组,但不幸的是,许多开发人员使用方式不正确。大概近70%使用getBytes()方法没有指定字符编码,而是使用平台默认字符编码。这样做大多数可以工作,但是容易出错,如果平台的字符编码与预期的编码不匹配,则会产生错误的结果。

String to byte array using getBytes()

// converts String to bytes using platform's default character encoding, 
// in Eclipse it's Cp1252 
// in Linux it could be something else 

byte[] ascii = "abcdefgh".getBytes(); 
System.out.println("platform's default character encoding : " + System.getProperty("file.encoding")); 
System.out.println("length of byte array in default encoding : " + ascii.length); 
System.out.println("contents of byte array in default encoding: " + Arrays.toString(ascii)); 

Output : 
platform's default character encoding : Cp1252 
length of byte array in default encoding : 8 contents of byte array in default encoding: [97, 98, 99, 100, 101, 102, 103, 104]

备注:
1)如果不指定任何字符编码,则使用平台默认编码将字符转换为字节。

2)您可以使用System.getProperty(“file.encoding”)查看平台的默认字符编码;这将返回JVM运行的机器的默认字符编码。

3)当心,您的代码可能在一个环境中运行没有问题,但不能保证在其它环境下同样可以运行。这就是为什么你不应该依赖默认字符编码。

4)字节数组的长度可能与String的长度不一致,这取决于字符编码。

String to byte array using getBytes(“encoding)

// convert String to bytes of specified character encoding but
// also throw checked UnsupportedEncodingException, which pollutes the code 
try { 
    byte[] utf16 = "abcdefgh".getBytes("UTF-16"); 
    System.out.println("contents of byte array in UTF-16 encoding: " + Arrays.toString(utf16)); 
} catch (UnsupportedEncodingException e) { 
    e.printStackTrace(); 
} 

Output : 
length of byte array in UTF-16 charater encoding : 18 
contents of byte array in UTF-16 encoding: [-2, -1, 0, 97, 0, 98, 0, 99, 0, 100, 0, 101, 0, 102, 0, 103, 0, 104]

备注:
1)这种方式比上面例子更好,但是抛出一个检查的异常 java.io.UnsupportedEncodingException,防止字符编码字符串有错,或者指定不支持Java的字符编码。

2)返回指定的字符编码的字节数组

3)您可以看到字节数组的长度与String中的字符数不同,就像上一个例子中的那样,因为UTF-16编码占用至少2字节来编码字符。

String to byte array using getBytes(Charset)

// return bytes in UTF-8 character encoding 
// pros - no need to handle UnsupportedEncodingException 
// pros - bytes in specified encoding scheme 

byte[] utf8 = "abcdefgh".getBytes(StandardCharsets.UTF_8); 
System.out.println("length of byte array in UTF-8 : " + utf8.length); 
System.out.println("contents of byte array in UTF-8: " + Arrays.toString(utf8)); 

Output : length of byte array in UTF-8 : 8 
contents of byte array in UTF-8: [97, 98, 99, 100, 101, 102, 103, 104]

备注:
1)这是将String转换为Java中的字节数组的最佳方法。

2)这不会引发java.io.UnsupportedEncodingException异常

3)牢记,StandarhardCasets类只能从Java 7起开始提供。

原文:http://www.java67.com/2017/10/3-ways-to-convert-string-to-byte-array-in-java.html

你可能感兴趣的:(java)