JAVA IO流中字符串编码不一致问题

问题:在读一个txt文件中的日期数据"2020-06-18"存入数据库时,发现读出的string怎么转都不能转为sql.Date类型。

初步诊断:System.out.println()输出的从流中读的字符串和预期字符串一样,但是length属性一个是21,一个是10。(因为字符间填充了"u0000",而且是空字符)

空字符输出:System.out.println("aa"+"u0000"+"bb")输出为aabb。不同版本jvm可能输出不一样,有的是空格。

症状:通过debug发现存放string的char[]填充了大量的"u0000"存在,这个是unicode编码中Character的最小值。
(文件字符流编码默认为GBK,JVM默认编码是UNICODE)

问题截图如下:
图片.png


解决方法:

可分为两类:设置编码格式;删除所有"u0000"。
设置编码
又分为设置流的编码,以及设置String的编码。
设置流编码

new BufferedReader(new InputStreamReader(inputStream,"unicode"));

设置String编码

str = new String(str.getBytes("GBK"),"unicode");

删除所有u0000

str = str.replace("\u0000", "");

结果展示:
图片.png

你可能感兴趣的:(java,io)