为什么UTF-8字节序列用ISO-8859-1这种单字节字符集解码成乱码后,可通过new String(wrongStr.getBytes(“ISO-8859-1“), “UTF-8“)恢复
这是因为ISO-8859-1的编码特性与UTF-8的字节结构之间存在一种“可逆映射”关系,使得错误解码后的字符串在特定操作下能还原原始字节。以下是详细解释:1.核心原理:ISO-8859-1的“字节透明性”ISO-8859-1(Latin-1)是一种单字节编码,其编码规则为:字符的Unicode码点值=对应的字节值(0x00~0xFF)。例如:字符A的Unicode是U+0041→编码为字节0x4