java写hdfs文件有乱码

java写到hdfs文件中,用hadoop命令查看没有问题,spark程序读取再println也没问题,用spark-shell collect的时候出现乱码。回到代码中发现用writeChars()这个函数写入文件,解决办法:用write(str.getBytes())就好了。

String resultStr = guid + "\t" + StringUtils.join("#", recVideoIds) + "\n";
fsDataOutputStream.write(resultStr.getBytes()); //防止乱码
fsDataOutputStream.flush();


你可能感兴趣的:(java,hadoop)