java download csv (utf-8)文件用excell打开乱码的问题,我在网上搜了很久,一直没有找到解决方案,曾经在javaeye 上看到过一篇文章关于加上BOM标记的文章
http://yvonxiao.iteye.com/blog/564461 试验下来根本不解决问题。
首先来看一下问题:
我的测试环境使用的是excell 2003 经过测试 阅读csv文件根本不认识UTF-8编码,测试过程是这样的:
【1】excell编辑保存一份csv文件
【2】用notepad开打,可以看到他的是ANSI编码格式保存的.
【3】用IE打开可以看到他的编码是GB2312.
以上说明至少在我的xp的机器上excell能认出GB2312编码方式存放的csv文件。
【4】用notepad把这份文件另存为UTF-8格式(注意windows自带的notepad存为utf-8是带有bom),然后用excell打开,结果是乱码
以上说明至少在我的机器上excell不认识UTF-8带BOM的csv文件
【5】用notepad++去掉bom标示保存后 excell打开依然是乱码
以上说明至少在我的机器上excell不认识UTF-8不带BOM的csv文件
那么如果才能保存让excell2003认识的csv文件呢,最简单的方式就是保存和步骤【3】一样的文件格式!
【1】在c://temp 目录下建立utf-8编码的文件:
我爱,中国
【2】运行如下程序
public static void main(String[] args) throws IOException {
Properties properties = System.getProperties();;
System.out.println(properties.getProperty("file.encoding"));
String in =FileUtils.readFileToString(new File("C:\\temp\\test.txt"), "UTF-8");
byte[] aa=in.getBytes();
byte[] bb ;
//EF BB BF
if (Bytes2HexString(aa,0,2).equals("EFBBBF")){
System.out.println("BOM");
bb=Arrays.copyOfRange(aa, 3, aa.length);
}else{
bb=aa;
}
//FileUtils.writeByteArrayToFile(new File("C:\\temp\\test2312.txt"), new String (bb,"GB2312");)
FileUtils.writeStringToFile(new File("C:\\temp\\test2312.csv"), new String (bb,"UTF-8"),"GB2312");
}
public static String Bytes2HexString(byte[] b,int start ,int end) {
String ret = "";
if (end >=b.length) end=b.length;
for (int i = start; i <= end; i++) {
String hex = Integer.toHexString(b[i] & 0xFF);
if (hex.length() == 1) {
hex = '0' + hex;
}
ret += hex.toUpperCase();
}
return ret;
}
最后用excell开打test2312文件 一切正常。
分析:
无论是用struts还是数据库取出的数据,首先要了解数据来源的编码,这个例子数据来源的编码是utf-8格式的。
最后写文件文件的时候excell认csv文件的时候之人ansi编码的,中文可以用GB2312,日文和韩文的话你要自己查一下别人机器上支持的编码。
附上一篇讲解编码的非常好的好文章:
http://www.regexlab.com/zh/encoding.htm