字符集中文乱码转换为UTF8,如:å\u0085¬è¯\u0081ä¸\u009Aå\u008A¡ç±»å\u0088«æ\u009C\u0089误ï¼\u0081

背景:AvroParquetReader对象读取hdfs上的parquet文件,列内容中文乱码,如:å\u0085¬è¯\u0081ä¸\u009Aå\u008A¡ç±»å\u0088«æ\u009C\u0089误ï¼\u0081

字符集中文乱码

Way 1:new String(bytes[],charset)进行转换

String value = "å\u0085¬è¯\u0081ä¸\u009Aå\u008A¡ç±»å\u0088«æ\u009C\u0089误ï¼\u0081";
value = new String(value .getBytes("iso-8859-1"),"utf-8");
System.out.println("value : " + value );

Way 2:URLEncoder、URLDecoder进行解码编码

String value= "æ­¤å\u0085¬è¯\u0081书ä¸\u008Då­\u0098å\u009C¨";
    value= URLEncoder.encode(value, "ISO-8859-1");
    value= URLDecoder.decode(value, "UTF-8");
    System.out.println("value : " + value);

你可能感兴趣的:(java)