为什么会产生乱码

什�N是Unicode(�y一�a/��嗜f���a)及它的好�
 

�F在台�匙钔ㄐ械木��a方式叫「大五�a (Big5)」,大�最通行的��a是「���舜a (GB)」。日本、�n��也使用�h字,他��有各自不同的��a。世界上有�S�S多多��家,有�S�S多多��a方式,彼此互不�f�{,造成�y�a,�乐氐胤恋K了人��藉由��X相互�贤āS需b於此,美��有��名叫「Unicode」的�C��提出了�y一世界各��文字��a的方法,�@��新的��a方式就叫「Unicode」,中文�g名是「�f���a」、「�y一�a」等等。使用「Unicode」最大的好�是消除�y�a。它�⑹澜绺��的文字井然有序地�x予��,彼此不相重�B,所以你能看到一份文件上,阿拉伯文和日本假名同�r出�F的奇景。再加上 Unicode 收字量�H巨,�s收�70000���h字,台�超F流行的 Big5 收字量也不�^ 13000 ���h字,相形之下 Big5 字缺的利害。有了 Unicode 後,�拇恕竿踅�?」不再是「王建火宣」,「游�a?」也不用再打成「游�a方方土」了。 

在都使用Unicode��a的��X上,文字的呈�F不��造成�y�a。上述的「你好」二字,走到了大�、日本、沙�醯匕⒗�伯,都�是「你好」二字,不��改�。而您能在此�W�一睹「王建?」、「游�a?」�晌幌壬�的真��姓名,不陷於Big5缺字的窘境,也是拜 Unicode技�g所�n。 

Unicode是如此好用,又是世界��荩�日後自然大行其道。只是他推出的�r�g�^晚,世界上有�o�档碾��X�Y料和程式都是�f形式,一�r半刻也改�不了,所以大多�档碾��X系�y (Windows Base)都是�S持 Unicode 和��地�^域��a共存的作�I方式。例如�P者�F在使用的 Windows XP作�I系�y,系�y�炔渴褂玫恼�是 Unicode 。因�樗�是繁�w中文版,所以 Big5 �a是它的第二官方�Z言。若是我交代了 XP 作�I系�y�理一些文字�Y料,而�@些文字��a不是 Unicode,又未�d明是何�N��a,那�N XP 作�I系�y��把它��作是 Big5 �a�砜创�。Windows 作�I系�y��拿出一份 Big5 和 Unicode 的�φ毡�(�Q�� Codepage,�� 950),逐字��Big5��a�D���Unicode��a,以利系�y�炔孔�I。
�F在 Windows 上�^大部分的��X程式�K不支援 Unicode,���@些程式�氖乱恍┥婕暗轿淖值倪\作�r (例如��文字、剪�N簿�幼鳌⒁约伴_�n�n名路�降闹概傻�) ,Windows 作�I系�y就��自�拥馗���上述的 Codepage��� Unicode �D�Q成 Big5 �a。��於�h字而言,�@�N�D�Q有�r是�利的,有�r是失�〉摹�榱苏f明�@�c我���碜饕韵���:如果您�F在使用的是繁�w版 Windows,把�W�上的「�h字」二字 Copy下�恚�再�N到不支援Unicode的程式�e,你��看到「�h字」�勺诛@示�o�`,故 Unicode → Big5 �D�Q成功。接下���「?字」二字�N上去,�s�l�F到「?字」�成「?字」,故 Unicode → Big5 �D�Q~~失� � 

你的程式「不知有?」,��在不用�w咎於�O���。追其病因,乃是 Big5�a收字太少了。��Windows依表�� Unicode���到 Big5�a�r,�l�F Big5�a�]有�@��「?」字,�o法�D�Q。所以只好�G一������o你自己去想�k法解�Q。同����}出�F在所有��w字上。由於 Big5 �a�]收���w字,所有��w Unicode �h字�D成 Big5 後最後都���成���。例如:「?」→「��」,依�f是一�����。Windows �K不���嵝牡��「?」���到「��」。所以究竟是「一?�勺帧梗��是「一�一��」?Microsoft �f�@�����}���由�砂度嗣褡约汉推浇�Q,他��不插手干�A。 

此外,若是�n案的�n名包含��w字或其他Big5�a�]有收�的�h字�r (例如:"?字.txt"),就���a生���}。您可以用鼠�它c它�上�黹_��,�@是因�� Windows �雀降挠�事本支援 Unicode�n名。若是您用 WinRar ��嚎s它的�,立刻���l生程式�e�`的�息,同�拥厥且�� Unicode → Big5�D�Q失� � 

�@����r在中文��w版的Windows上就�酚^多了。��w版的 Windows 第二官方�Z言是GBK。它的收字量涵括了 GB 2312、GB 12345、日�n�h字、Big5�a。所以每一��Big5�a能呈�F的字,在GBK中都能找到���的�h字。所以就算是��w版的Windows,它��能�@示的繁�w字�是比 Big5 �a版的 Windows多。

 

up

 

�槭颤Nemail���a生�y�a�@�N�F象?
 
�@不是因�樽x信者的�O定不�Γ�而是�l信者�]有在�]件程式中做正�_的�O定。以Outlook express�槔�,�A�O的�]件�祟}格式只能接受七位元的字元,�@�拥脑O定�τ⑽恼Z系�碚f是�]有���}的; 但是中文字�s是由八位元的位元�M所�M成,因此如果不把�祟}�O定成「可以接受八位元字元」的�,中文�祟}就�]�k法正�_的�魉停�以致於有些使用者看到的就是一堆�祟}�y�a。

 

�]件�任牡腻e�`
 
�l信者把他���l出的信件用一�N�Q��QP的��a方式��a�^。�@�N��a方式�K不�m用在中文信的�h境,因此使得信件�热萃耆��o法辨�R。使用outlook express的使用者,不��看到�@�煞N�y�a。 �@�K不意味著 outlook express就是好的�]件程式,只是它��自�优�e�@�煞N情形,自�幼鼋忾_��a的�幼鳎�所以使用者不��知道自己的�O定是�e的。

up

 

我��常��碰到�l生�y�a的�M合:
  ★在中文繁�wWindows 作�I系�y下,字�a�@示及字�a交�Q���}:
   
  1. 中文��wGB字�a(SD)�o法直接�@示或�}�u於繁�wBig 5��w�龋�其�Y果是: 它��呈�F一大堆看不懂的�y�a。
  2. 中文��wGB字�a(SD)�}�u到Unicode��w�r,��wGB字�a��呈�F�y�a。
  3. 中文��wUnicode字�a(SU)�o法直接�@示在不支援Unicode字�a作�I系�y下。
  4. 中文��wUnicode(SU)�}�u到非Unicode��w�r,其中文Unicode字�a�楹��w Unicode(SU)字�a��呈�F?(���)。
   
  ★在中文��wWindows 作�I系�y下,字�a�@示及字�a交�Q���}:
   
  1. 中文繁�wBig 5 字�a(TD)�o法直接�@示或�}�u於��wGB��w�龋�其�Y果是:它��呈�F一大堆看不懂的�y�a。
  2. 中文��wBig 5字�a(TD)�}�u到Unicode��w�r,繁�wBig 5字�a��呈�F�y�a。
  3. 中文繁�wUnicode字�a(TU)�o法直接�@示在不支援Unicode字�a作�I系�y下。
  4. 中文繁�wUnicode(TU)�}�u到非Unicode��w�r,其中文Unicode字�a�榉斌w Unicode(TU)字�a��呈�F?(���)。
   

up

�繁�w的差�e (以outlook express�槔�)
��w正常�@示
��w�y�a�@示

使用utf- 8�碜�����w信件,收件者可以正常的�@示信件�祟^及�任�
(使用的作�I�h境是繁�w中文,outlook express�h境是utf-8)

使用繁�w中文�碜�����w信件,收件者���@示�y�a�祟^ (使用的作�I�h境是繁�w中文,outlook express�h境是繁�w中文)

 

 

�O定 Outlook 2003
  步�E1. 於Outlook 2003主��面的下拉式�x�沃悬c�x「工具」中的「�x�」。
  步�E2. �@�r��出�F一���窗,�e�^有很多活��嘶`。
 
   
 

步�E3. ��c�x 「�]件格式」�@��活��嘶`,在「使用�@���]件格式撰��」中�x�瘛�HTML】。 
               �{色部份不用打勾勾(若你的�A�O值是有打勾的,也�你拿掉)否�t你�魉统鋈サ淖��套用到Word撰��格式,��造成�D寄或 
               回覆的信件�热�o法修改的情�r、或是字 型固定在原本格式而�o法�x取修改。

  步�E4. 另外�c�x在下方的「���H�x�」,��a�x�中,想使用的外寄�]件��a方式中,�x�瘛�Unicode UTF-8】。如步�E5所示。
 
 

up

 

�O定Outlook 2000
  打�_你的Outlook 2000在主��面的下拉式�x�沃悬c�x「工具」中的「�x�」。
  步�E1. �@�r��出�F一���窗,�e�^有很多活��嘶`,�x�瘛膏]件格式」。
  步�E2. �c�x「���H�x�(I)」。
  步�E3. 在「外寄�]件使用�@�N��a方式」中�x��Unicode (UTF-8)「未�耸镜氖盏洁]件使用�@�N��a方式」也�x��Unicode (UTF-8)
  步�E4. �c�x「�O定(E)」。
  步�E5. �把�祟}容�S8位元(W)打勾勾。
 

up  

 

�O定Outlook Express 6
  步�E1. 於Outlook Express主��面的下拉式�x�沃悬c�x「工具」中的「�x�」。
  步�E2. �@�r��出�F一���窗,�e�^有很多活��嘶`。 �x�瘛缸x取」的��`。
  步�E3. 因�槲��要��ψx取�]件�碜鲈O定,�摹缸中汀�碜���H��a的�O定。
  步�E4. 在字型�O定中�x��Unicode。
  步�E5. 在��a中要�x��UTF-8而不是UTF-7。
 
   
  ���繁�w或��w中文�]件�r,建�h使用 UTF-8 ��a,由於 Big-5 ��a只�m用繁�w中文,所以除非完全只���繁�w中文�c英文,否�t建�h使用 UTF-8 ��a (�O定方式)。 撰��/��x�]件�r,可在 Outlook Express 的 「格式」「��a」 中���又付ǖ恼Z系��a方式。
   
  步�E6. 再�砦���x�瘛�魉汀沟捻��`,��於�]件�魉偷母袷接蟹�2�N,一�N是HTML,一�N是�文字。
  步�E7. �c�xHTML�O定。
  步�E8. 在MIME�]件格式中 「文字��a方式」�x�瘛�o」或「Base64」,且勾�x「�祟}允�S 8 位元的字元」。
  步�E9. �c�x�文字�O定。
  步�E10. �]件格式�x��Uniocode。
 
   
  步�E11. �c�x「���e�O定」。
  步�E12. �A�O��a�x��Unicode (UTF-8),「回��r�祟}永�h使用英文」不要打勾
 

up  

你可能感兴趣的:(乱码)