转big5码的问题

网上很多人问,GBK字符串怎么转BIG5码。

有的人说,用个对照表来翻译。

�r(�s3�t)�q 你让java的开发人员情何以堪呀

其实很简单,用java的getBytes就行。

String str = "新建文本文档.txt";
  System.out.println(str);
  byte[] bs = null;
  try {
   String tempStr ="";

   bs = str.getBytes("Big5");
   tempStr = new String(bs);
   System.out.println( "tempStr="+ tempStr );

   bs = str.getBytes("Big5-HKSCS");
   tempStr = new String(bs);
   System.out.println( "tempStr="+ tempStr );


  } catch (UnsupportedEncodingException e1) {
   e1.printStackTrace();
  }

在转码的过程中,发现大陆有的汉字,在香港或台湾没有这些字。

比如下面的“件”字就没有,被翻译成了问号。

这是在BIG控制台打印出来的结果。

第一行的UTF-8码打印的字符串是乱码。

第二行是台湾BIG5,

第三行是香港BIG5。

郁闷,他们都没有“件”这个字。

好像记得他们都是:“文�n” 表达“文件”的。

所以说,把GBK转BIG5是很不实际的,你根本没有考虑别人的语言习惯。

翻译个小说全是?号,谁看得懂呀!

又比如有个人叫:何舰 用BIG5打印出来成了“何?”

难到翻译成 jian ,那就真“贱”了。

而且台湾的拼音根本就不是用英文写的。

以后谁再问这么愚蠢的问题,我……我去年也买了个表。

 

你可能感兴趣的:(java,转big5)