鍦ㄦ垜浠繘琛屾枃鏈寲鎺樻垨澶勭悊鏂囨。鏃讹紝閮借闈复涓�涓渶鏈�鍩烘湰鐨勯棶棰�->灏辨槸瑙e喅涔辩爜闂銆傚湪姝わ紝浠嬬粛鏈�鏈川鐨勫瓧绗︾紪鐮併��
鎴戜滑鐔熸倝鐨勬湁涓夌锛欰SCII瀛楃闆嗭紝涓枃瀛楃闆�(GBK)锛孶nicode瀛楃闆�
ASCII瀛楃闆�
鏁呬簨锛�
聽 聽 缇庡浗淇℃伅浜ゆ崲鏍囧噯浠g爜锛岃繖鏄绠楁満涓婃渶鏃╀娇鐢ㄧ殑閫氱敤鐨勭紪鐮佹柟妗堛�傞偅涓椂鍊欒绠楁満杩樺彧鏄媺涓佹枃瀛楃殑涓撳埄锛屾牴鏈病鏈夋兂鍒扮幇鍦ㄨ绠楁満鐨勫彂灞曞娍澶达紝濡傛灉鎯冲埌浜嗭紝鍙兘涓�寮�濮嬪氨浼氫娇鐢╱nicode浜嗐�傚綋鏃剁粷澶ч儴鍒嗕笓瀹堕兘璁や负锛岃鐢ㄨ绠楁満锛屽繀椤荤啛缁冩帉鎻¤嫳鏂囥�傝繖绉嶇紪鐮佸崰鐢�7涓狟it锛屽湪璁$畻鏈轰腑鍗犵敤涓�涓瓧鑺傦紝8浣嶏紝鏈�楂樹綅娌$敤锛岄�氳鐨勬椂鍊欐湁鏃剁敤浣滃鍋舵牎楠屼綅銆傚洜姝SCII缂栫爜鐨勫彇鍊艰寖鍥村疄闄呬笂鏄細0x00-0x7f,鍙兘琛ㄧず128涓瓧绗︺�傚悗鏉ュ彂鐜�128涓笉澶鐢紝鍋氫簡鎵╁睍锛屽彨鍋欰SCII鎵╁睍缂栫爜锛岀敤瓒冲叓浣嶏紝鍙栧�艰寖鍥村彉鎴愶細0x00-0xff,鑳借〃绀�256涓瓧绗︺�傚叾瀹炶繖绉嶆墿灞曟剰涔変笉澶э紝鍥犱负256涓瓧绗﹁〃绀轰竴浜涢潪鎷変竵鏂囧瓧杩滆繙涓嶅锛屼絾鏄〃绀烘媺涓佹枃瀛楋紝鍙堢敤涓嶅畬銆傛墍浠ユ墿灞曠殑鎰忎箟杩樻槸涓轰簡涓嬮潰鐨凙NSI缂栫爜鏈嶅姟銆�
- 鍗曞瓧鑺傚瓨鍌�
鐢ㄤ竴涓瓧鑺傦紙8浣嶏級鏉ヨ〃绀哄瓧绗�
鍏�27=128涓瓧绗�
瀛楃闆嗭細瑙勫垯鐨勯泦鍚�
聽 聽 聽 聽 聽 聽 瀛楃 聽-> 瀛楃瀵瑰簲鐨勪簩杩涘埗鏁板瓧
瀛樺偍鏂瑰紡锛氬瓧绗﹀搴旂殑浜岃繘鍒舵暟瀛� 聽-> 瀹為檯瀛樺偍鏁板��
涓枃瀛楃闆�
GBK鍏ㄧО銆婃眽瀛楀唴鐮佹墿灞曡鑼冦�嬶紙GBK鍗斥�滃浗鏍団�濄�佲�滄墿灞曗�濇眽璇嫾闊崇殑绗竴涓瓧姣嶏紝鑻辨枃鍚嶇О锛欳hinese Internal Code Specification锛� 锛屼腑鍗庝汉姘戝叡鍜屽浗鍏ㄥ浗淇℃伅鎶�鏈爣鍑嗗寲鎶�鏈鍛樹細1995骞�12鏈�1鏃ュ埗璁紝鍥藉鎶�鏈洃鐫e眬鏍囧噯鍖栧徃銆佺數瀛愬伐涓氶儴绉戞妧涓庤川閲忕洃鐫e徃1995骞�12鏈�15鏃ヨ仈鍚堜互鎶�鐩戞爣鍑�1995 229鍙锋枃浠剁殑褰㈠紡锛屽皢瀹冪‘瀹氫负鎶�鏈鑼冩寚瀵兼�ф枃浠躲�傝繖涓�鐗堢殑GBK瑙勮寖涓�1.0鐗堛��
ASCII 瀛楃闆嗘棤娉曡〃绀轰腑鏂�
GBK绛夛細
聽 聽 聽 聽 聽 澶氬瓧鑺傚瓨鍌紝鍏煎ASCII锛� 瀛樺偍鏂瑰紡锛欵UC4-CN
聽 聽 聽 聽 聽 楂樹綅涓�1鐨勫瓧鑺傦紝琛ㄧず鍏舵槸涓�涓弻瀛楄妭浜岃繘鍒剁爜
Unicode
聽 聽 聽 Unicode锛堢粺涓�鐮併�佷竾鍥界爜銆佸崟涓�鐮侊級鏄绠楁満绉戝棰嗗煙閲岀殑涓�椤逛笟鐣屾爣鍑�,鍖呮嫭瀛楃闆嗐�佺紪鐮佹柟妗堢瓑銆俇nicode 鏄负浜嗚В鍐充紶缁熺殑瀛楃缂栫爜鏂规鐨勫眬闄愯�屼骇鐢熺殑锛屽畠涓烘瘡绉嶈瑷�涓殑姣忎釜瀛楃璁惧畾浜嗙粺涓�骞朵笖鍞竴鐨勪簩杩涘埗缂栫爜锛屼互婊¤冻璺ㄨ瑷�銆佽法骞冲彴杩涜鏂囨湰杞崲銆佸鐞嗙殑瑕佹眰銆�1990骞村紑濮嬬爺鍙戯紝1994骞存寮忓叕甯冦��
鏀寔涓栫晫涓婂嚑涔庢墍鏈夊瓧绗︾殑瀛楃闆�
琛ㄧず鑼冨洿锛�0000 ~ 10FFFF銆� 100澶氫竾涓鍙�
瀛樺偍鏂瑰紡锛歎TF-8, UTF-16, UTF-32
UTF-8:
聽 聽 聽 UTF-8锛�8-bit Unicode Transformation Format锛夋槸涓�绉嶉拡瀵筓nicode鐨勫彲鍙橀暱搴﹀瓧绗︾紪鐮侊紝鍙堢О涓囧浗鐮併�傜敱Ken Thompson浜�1992骞村垱寤恒�傜幇鍦ㄥ凡缁忔爣鍑嗗寲涓篟FC 3629銆俇TF-8鐢�1鍒�4涓瓧鑺傜紪鐮乁nicode瀛楃銆傜敤鍦ㄧ綉椤典笂鍙互鍚屼竴椤甸潰鏄剧ず涓枃绠�浣撶箒浣撳強鍏跺畠璇█锛堝鑻辨枃锛屾棩鏂囷紝闊╂枃锛夈��
鍙橀暱瀛樺偍锛� 浣跨敤1~4涓瓧鑺傘��
瀵逛簬鍗曞瓧鑺傜殑绗﹀彿锛屽瓧鑺傜殑绗竴浣嶈涓�0锛屽悗闈�7浣嶄负杩欎釜绗﹀彿鐨剈nicode鐮併�傚洜姝ゅ浜庤嫳璇瓧姣嶏紝UTF-8缂栫爜鍜孉SCII鐮佹槸鐩稿悓鐨勩��
瀵逛簬n瀛楄妭鐨勭鍙凤紙n>1锛夛紝绗竴涓瓧鑺傜殑鍓峮浣嶉兘璁句负1锛岀n+1浣嶈涓�0锛屽悗闈㈠瓧鑺傜殑鍓嶄袱浣嶄竴寰嬭涓�10銆傚墿涓嬬殑娌℃湁鎻愬強鐨勪簩杩涘埗浣嶏紝鍏ㄩ儴涓鸿繖涓鍙风殑unicode鐮併��
Unicode绗﹀彿鑼冨洿 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 | 聽 聽UTF-8瀛樺偍鏂瑰紡
(鍗佸叚杩涘埗) 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽 聽| 锛堜簩杩涘埗锛�
-----------------------------------------------------------------------------
0000 0000-0000 007F 聽 聽 聽 聽 聽 聽 | 0xxxxxxx
0000 0080-0000 07FF 聽 聽 聽 聽 聽 聽 聽| 110xxxxx 10xxxxxx
0000 0800-0000 FFFF 聽 聽 聽 聽 聽 聽 聽| 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF 聽 聽 聽 聽 聽 聽 聽| 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
寰堟槑鏄撅紝鍦–++涓负浜嗚В鍐虫槸姹夊瓧杩樻槸瀛楁瘝鐨勯棶棰樹笂锛屽垽鏂叾浜岃繘鍒堕浣嶅嵆鍙�傝�宩ava鍒欎笉鐢紝鏈夌洿鎺ユ壂鎻忓瓧绗︾殑鍑芥暟銆傦紙杩樻湁鍚屽闂簡锛岄偅涓哄暐瑕佺敤C++...a simple reason 鍢涳紝C++蹇煒婏級
鍐嶄妇涓疄渚嬶細
OK锛屽洖褰掍富棰橈細涔辩爜锛�
UTF-8瀛樺偍鏂瑰紡鐨勬枃浠讹紝鐢℅BK鏂瑰紡璇诲彇聽 or聽 GBK瀛樺偍鏂瑰紡鐨勬枃浠讹紝鐢║TF-8鏂瑰紡璇诲彇 聽 灏变細浜х敓涔辩爜
ANSI - Windows涓粯璁ょ殑瀛楃闆�
杩欎釜杩樺緱浜嗚В锛�
鍦ㄤ綘鍦╳indows 涓嬩繚瀛樹竴涓枃鏈椂锛岄粯璁ょ殑绗竴涓繚瀛樻柟寮忓氨鏄繖涓笢涓溿��
鍦ㄤ腑鏂嘩indows鎿嶄綔绯荤粺涓細
聽 瀵逛簬鑻辨枃鏂囦欢鏄疉SCII瀛楃闆嗐��
聽 瀵逛簬绠�浣撲腑鏂囨枃浠舵槸GB2312瀛楃闆嗐��
聽 绻佷綋涓枃鐗堜細閲囩敤Big5瀛楃闆嗐��
鍦ㄦ棩鏂嘩indows鎿嶄綔绯荤粺涓細
聽 瀵逛簬鑻辨枃瀛楃鏄疉SCII瀛楃闆嗐��
聽 瀵逛簬鏃ユ枃瀛楃鏄疭hift_JIS銆�
涓嶅悓 ANSI 缂栫爜涔嬮棿浜掍笉鍏煎锛屽綋淇℃伅鍦ㄥ浗闄呴棿浜ゆ祦鏃讹紝鏃犳硶灏嗗睘浜庝袱绉嶈瑷�鐨勬枃瀛楋紝瀛樺偍鍦ㄥ悓涓�娈� ANSI 缂栫爜鐨勬枃鏈腑銆�
娆㈣繋鍏虫敞娣卞害瀛︿範鑷劧璇█澶勭悊鍏紬鍙�