java字符串编码和解码

java字符串编码和解码

记录原因:因为Windows和Linux操作系统默认编码的不同( Windows的默认编码为GBK,Linux的默认编码为UTF-8),导致项目中出现了乱码问题,故此记录一下。

万变不离其宗,只要保证编码方式和解码方式统一,你就不可能出现乱码。
java字符串编码和解码_第1张图片
(代码中getBytes()默认系统编码获得是"utf-8"原因是我开发环境中设置的默认系统编码是“utf-8”!)

getBytes() 编码 new String(byte[], decode) 解码

与getBytes()相对的,通过new String(byte[], decode)的方式来还原。

但发现ISO8859-1编码再组合之后,无法还原“好”字呢,其实原因很简单,因为ISO8859-1编码的编码表中,根本就没有包含汉字字符,所以解码还原就无从谈起。


注意:

但有时候,为了让中文字符适应某些特殊要求(如httpheader要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如:

String s_iso88591 = newString(“好”.getBytes(“UTF-8”),“ISO8859-1”)

String s_utf8 = newString(s_iso88591.getBytes(“ISO8859-1”),“UTF-8”)


String s_iso88591 = newString("好".getBytes("UTF-8"),"ISO8859-1")     
第一步: "好".getBytes("UTF-8"):把"好"用utf-8编码取得字节
第二步: new String(xxx字节,""ISO8859-1""):以"ISO8859-1"的编码生成字符串


String s_utf8 = newString(s_iso88591.getBytes("ISO8859-1"),"UTF-8")
第一步:s_iso88591.getBytes("UTF-8"):把s_iso88591用"ISO8859-1"编码取得字节
第二步:new String(xxx字节,"UTF-8"):以”UTF-8”的编码生成字符串
 

这样就既保证了遵守协议规定使用ISO8859-1、也支持了中文。
java字符串编码和解码_第2张图片

你可能感兴趣的:(java,String)