Unicode

Unicode_第1张图片
cdbf6c81800a19d8b7972e2131fa828ba61e4679.jpg

定义

统一码/国际通用码(Unicode)为文字系统数字编码之业界标准,由统一码/国际通用码联盟(Unicode Consortium),全球网页有一半以上是用Unicode编码。Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。


重要性:

  • 统一码/国际通用码(Unicode),让数字及万维网的文本得以全球化,是万维网网页标准的基础。
  • Unicode码的最大好处就是对於每一个字元提供了一个跨平台丶语言与程式的统一数码,
  • 2007年以来因全球网页采用Unicode编码的网站及网页愈来愈多,以及应用程序愈来愈多采用此标准,原来不 同语言文字符号无法在同一文件中出现,和用户遇到乱码的问题获得基本解决。
  • 制定Unicode的是统一码/国际通用码联盟(Unicode Consortium),是负责创建数字字符和数字通用标准的非营利组织。

Unicode标准与世界语言

Unicode标准所支援的世界书写语言详列於官方网站之Supported Scripts页面,中日韩共用的汉字(Han)早在1993年第1.1版已纳入。
由於字符数及编码的特性,由Mark Davis所做的统计来看,Unicode标准中字符数占最多的是中国,占了7成以上,韩国次之占1成多。

CJK

中日韩统一表意文字(CJK Unified Ideographs),目的是要把分别来自中文、日文、韩文、越文中,本质、意义相同、形状一样或稍异的表意文字(主要为汉字,但也有仿汉字如日本国字、韩国独有汉字、越南的喃字)于ISO 10646及Unicode标准内赋予相同编码。CJK 是中文(Chinese)、日文(Japanese)、韩文(Korean)三国文字的缩写。顾名思义,它能够支持这三种文字。实际上,CJK 能够支持在 LaTeX 中使用包括中文、日文、韩文在内的多种亚洲双字节文字。

简介

与国内较为普遍使用的中文 LaTeX 扩展 CCT 相比较,CJK 与 LaTeX 结合得更为紧密。LaTeX 输出的 DVI 文件就是标准的 DVI 文件,可以直接浏览而无须象 CCT 那样要先用 patchdvi 进行预处理。(CCT 是在 emTeX 上开发的,和 emTeX 结合的较好,但由于 emTeX 版本较老,无法使用一些 TeX 和 LaTeX 的新功能,如用 pdfTeX、pdfLaTeX 生成 PDF 文件,以及用 LaTeX2Html 将中文 LaTeX 文件转换为 HTML 文件)

CJK 作为一个 LaTeX2e 宏包,其对字体的定义遵照 NFSS(新字体选择框架)。这样就无须对 DVI 文件做特殊的处理就可以直接在任何 DVI Viewer 中预览和打印,也可直接用 dvips 等工具进行转换。CJK 可以自定义多种字体,可以使用多种字库,包括 TrueType 字库、Type1 字库等。由于使用的是轮廓字库,因而 CJK 生成的 PS 文件和 PDF 文件效果要好于 CCT。

Unicode 与 Emoji

适用于Android 和 IOS的unicode:


Unicode_第2张图片
.PNG

性别政治

为了促进性别平等,2016年Unicode 的Emoji委员会同意加入11个表情符号,可以搭配不同的姓别及肤色,排列组合可以产出百多馀的表情符号(Bleuel, 2016)

Unicode_第3张图片
多肤色.jpg

你可能感兴趣的:(Unicode)