Unicode和编码文章收集

fmddlmyy的csdn博客中的几篇文章非常详细易懂的介绍了Unicode和编码方面的知识。
相关的词汇有:编码Encoding、字符集Charset、代码页Codepage、Unicode、GB、GBK、UCS、UTF、BMP、BOM。

http://blog.csdn.net/fmddlmyy/category/279030.aspx

GB18030编码研究以及GBK、GB18030与Unicode的映射

无论是Windows XP还是Vista,中文(中国)区域对应的默认代码页还是GBK。我们只能设置区域,并不能设置区域对应的默认代码页。所以在Windows世界,只要微软不愿意,GB18030就只是一张普通的代码页。目前的简体中文文档使用的编码主要是Unicode和GBK,应该没有什么文档会用GB18030保存。本文只是出于程序员的好奇而对GB18030编码所作的一些研究,希望能对同样好奇的读者有所助益。阅读全文>

Unicode、GB2312、GBK和GB18030中的汉字

数一数GB18030中的汉字阅读全文>

浅谈文字编码和Unicode(下)

上篇我们讨论了文字显示的原理、Windows的代码页、互联网的字符集,下篇我们再谈谈Unicode。在此之前,我们先研究一个很深奥的概念:字符编码的四层模型...阅读全文>

浅谈文字编码和Unicode(上)

本文探讨《谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词》中未介绍或介绍较少的代码页、Surrogates等问题,补充一些Unicode资料,顺带介绍一下我最近编写的一个Unicode工具:UniToy。本文虽然是前文的补充,但在写作上尽量做到独立成篇。阅读全文>

谈谈Windows程序中的字符编码

写这篇文章的起因是这么一个问题:我们在使用和安装Windows程序时,有时会看到以“2052”、“1033”这些数字为名的文件夹,这些数字似乎和字符集有关,但它们究竟是什么意思呢? 研究这个问题的同时,又会遇到其它问题。我们会谈到Windows的内部架构、Win32 API的A/W函数、Locale、ANSI代码页、与字符编码有关的编译参数、MBCS和Unicode程序、资源和乱码等,一起经历这段琐碎细节为主,间或乐趣点缀的旅程。 阅读全文>

谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词

开始只是想解释一下UCS2和UTF-16有什么区别,后来...阅读全文>


你可能感兴趣的:(unicode)