(该图就是字库软件主页面,ENCODE 编码选择UNICODE ,size 可以选择小一点的16x16的这样字库空间大概是1.3M多一点,FileType 选择BIN就好)
1. 转换字库,操作步骤如下:
1). 选择一个您要转换的矢量字体文件(*.ttf)。
先将c:\windows\fonts 目录下的字体文件拷贝(ctrl+c)出来,然后本软件即可选择。
建议去网上找一个ArialUni.ttf字库(可找本人提供),目前linux系统用的就是这个,字符非常全面。
2). 选择编码类型(MBCS or Unicode),根据需求而定。
3). 选择字体大小,根据需求而定,目前只支持16,24,32,40,48,56,本软件可根据需求而改成大字体 ( > 56 )。
4). 选择需要转换的字符集(支持多选),根据需求而定。比如:我要用到简体中文,则必须选简体中文,同时还可选其它。
5). 选择输出文件。(BIN 文件始终默认输出,其它可选)
6). 选择输出目录,即将您生成的文件存放到您选择的这个目录中。
7). 点击 build 按钮,稍等片刻,即可生成您所想要的字库文件。
注意: 如果您选择的是MBCS 编码方式,又有选择多个字符集,则会输出多份上述文件。
如果您选择的是NICODE编码方式,不论你选多少个字符集,都只会输出一份上述文件。
如果生成字库失败,则有可能你选择的字体文件(*.TTF)原本就不包含该字符集的字符信息。 比如:宋体中不存在韩文字符,即用宋体生成的字库无法支持韩文显示。
参考办法: 对照系统自带的字符映射表,里面就可以选择不同的字体,字符集(打开“高级查看”)进行参照。
开启字符映射表的方法:
1. 以命令方式运行开启,直接键入 "charmap"即可。
2. 程序-->附件-->系统工具--->字符映射表
2. 字库预览,操作步骤如下:
1). 选择一个您要预览的字库文件(*.bin)。将会自动打开分析出其编码类型,点阵大小,包含的字符集。
2). 在 goto code:后面的编辑框中,输入您要查看字符的编码(如果当前选择的字库*.BIN 是unicode编码,则输入unicode码,否则输入mbcs 编码),回车后即可看到其显示效果,还可得知其字符实际显示宽度。
CP932, 日文Shift-JIS, 如:日语
CP936, 简体中文GBK, 如:中文(中华人民共和国), 中文(香港特别行政区), 中文(新加坡)
CP949, 韩文, 如:朝鲜语
CP950, 繁体中文Big5, 如;中文(台湾), 中文(澳门特别行政区)
CP874, 泰文, 如:泰语
CP1250, 中欧, 如:捷克语,匈牙利语,波兰语,罗马尼亚语,克罗地亚语,斯洛伐克语,阿尔巴尼亚语,斯洛文尼亚语,塞尔维亚语(拉丁文)
CP1251, 西里尔文, 如:保加利亚语,俄语,乌克兰语,比利时语,马其顿语(FYROM),哈萨克语,吉尔吉斯语,鞑靼语,蒙古语,阿塞拜疆语,乌兹别克语,塞尔维亚语
CP1252, 西欧(拉丁文I), 如:加泰隆语,丹麦语,德语,英语,西班牙语,芬兰语,法语,冰岛语,意大利语,荷兰语,挪威语,葡萄牙语,印度尼西亚语,巴士克语,南非语,法罗语,马来语,斯瓦希里语,加里西亚语,瑞典语
CP1253, 希腊文, 如:希腊语
CP1254, 土耳其文, 如:土耳其语,阿塞拜疆语,乌兹别克语
CP1255, 希伯来文, 如:希伯来语
CP1256, 阿拉伯文, 如:乌都语,波斯语,阿拉伯语(伊拉克,埃及,利比亚,阿尔及利亚,摩洛哥,突尼斯,阿曼,也门,叙利亚,约旦,黎巴嫩,科威特,阿联酋,巴林,卡塔尔)
CP1257, 波罗的海文, 如:爱沙尼亚语,拉脱维亚语,立陶宛语,
CP1258, 越南, 如:越南语
unicode 可以由上述字符集根据需求自由合成。
A. BIN 文件,即字库文件(必生成):存储的是我们最终需要用到的点阵字库信息。其文件结构由四大部分组成:文件头、段信息、检索表、点阵信息。
1). 文件头,指的是文件的前十六个字节(BYTE),描述信息如下结构:
typedef struct tagFontLibHeader{
BYTE magic[4]; //'U'(or 'M'), 'F', 'L', X 'U'(or 'M')---Unicode(or MBCS) Font Library, X: 表示版本号. 分高低4位。如 0x12表示 Ver 1.2
DWORD Size; /* File total size */
BYTE nSection; //MBCS:是否包含检索表。 Unicode:共分几段数据
BYTE YSize; /* height of font */
WORD wCpFlag; // codepageflag: bit0~bit13 每个bit分别代表一个CodePage 标志,如果是1,则表示当前CodePage 被选定,否则为非选定。
char reserved[4]; // 预留字节
} FL_Header;
2). 段信息,只针对 UNICODE 编码有效,占字节数:nSection*sizeof(FL_SECTION_INF)。结构如下:
typedef struct tagFlSectionInfo{
WORD First; /* first character */
WORD Last; /* last character */
DWORD OffAddr; /* 指向的是当前SECTION包含的 UFL_CHAR_INFO第一个字符信息的起始地址 */
} FL_SECTION_INF, *PFL_SECTION_INF;
3). 检索表,只针对非等宽的MBCS(不包含简中、繁中、日文、韩文,因这些都将等宽处理,故无需检索表)和 UNICODE 字库有效。
typedef struct tagUflCharInfo{
#ifdef SUPPORT_MAX_FONT // 如采用大字体结构,最大可支持248点阵
DWORD OffAddr; // 当前字符点阵数据的起始地址
BYTE Width; // 字符点阵的像素的宽度
#else
DWORD OffAddr : 26; // 当前字符点阵数据的起始地址
DWORD Width : 6; // 字符点阵的像素的宽度( 目前最大支持 56 点阵)
#endif
} UFL_CHAR_INDEX;
如果是非等宽的MBCS字库,则占字节数为:0xff * sizeof(UFL_CHAR_INDEX);
如果是Unicode字库,则占字节数为:((xxx[0].Last - xxx[0].First + 1)+...+(xxx[nSection-1].Last - xxx[nSection-1].First + 1)) * sizeof(UFL_CHAR_INDEX);
4). 点阵信息,即当前所有包含字符集中字符的点阵信息集合。数据存储方式为:横向高到底位存储。如: 10110011 00011010 即为 B3. 1A
例如:显示编码 code = xxxx 的字符。分为以下三种情况,分别操作步骤如下:
(1). 非等宽的MBCS字库
a. 先读出FL_Header信息;
b. 根据这个sizeof(FL_Header) + code * 2找到code的 UFL_CHAR_INDEX信息;
c. 根据UFL_CHAR_INDEX的OffAddr再找到当前code的点阵信息;
d. 最后根据FL_Header.Ysize、UFL_CHAR_INDEX.Width、以及点阵信息即可show出当前字符。
(2). 等宽的 MBCS字库 (包括简中、繁中、日文、韩文)
a. 先读出FL_Header信息;
b. 计算出code在当前字符集中的索引值(index),然后根据这个sizeof(FL_Header) + index * (FL_Header.Ysize/8*FL_Header.Ysize)找到code的点阵信息;
c. 然后根据FL_Header.Ysize与点阵信息即可show当前字符。
计算出当前code在你当前字符集(codepage)中位置,即索引值。此函数主要针对MBCS编码中的简中,繁中,日文,韩文,
static long GetPosWithMbcs(UINT code, UINT codepage) { long lIdx = -1; BYTE R = (code >> 8) & 0xFF; //区码 BYTE C = code & 0xFF; //位码 switch(codepage) { case CP932: // 日文 if(R >= 0x81 && R <= 0x9F) { if(C >= 0x40 && C <= 0x7E) lIdx = (R-0x81)*188 + (C-0x40); //188 = (0x7E-0x40+1)+(0xFC-0x80+1); else if(C >= 0x80 && C <= 0xFC) lIdx = (R-0x81)*188 + (C-0x80)+63; // 63 = 0x7E-0x40+1; } else if(R >= 0xE0 && R <= 0xFC) { if(C >= 0x40 && C <= 0x7E) lIdx = 5828 + (R-0xE0)*188 + (C-0x40); // 5828 = 188 * (0x9F-0x81+1); else if(C >= 0x80 && C <= 0xFC) lIdx = 5828 + (R-0xE0)*188 + (C-0x80)+63; } break; case CP936: // 简中 if((R >= 0xA1 && R <= 0xFE) && (C >= 0xA1 && C <= 0xFE)) lIdx = (R-0xa1)*94 + (C-0xa1); //94 = (0xFE-0xA1+1); break; case CP949: // 韩文 if(R >= 0x81) { if(C >= 0x41 && C <= 0x7E) lIdx = ((R-0x81) * 188 + (C - 0x41)); // 188 = (0x7E-0x41+1)+(0xFE-0x81+1); else if(C >= 0x81 && C <= 0xFE) lIdx = ((R-0x81) * 188 + (C - 0x81) + 62); // 62 = (0x7E-0x41+1); } break; case CP950: // 繁中 if(R >= 0xA1 && R <= 0xFE) { if(C >= 0x40 && C <= 0x7E) lIdx = ((R-0xa1)*157+(C-0x40)); // 157 = (0x7E-0x40+1)+(0xFE-0xA1+1); else if(C >= 0xA1 && C <= 0xFE) lIdx = ((R-0xa1)*157+(C-0xa1)+63); // 63 = (0x7E-0x40+1); } break; default: break; } return lIdx; }
(3). Unicode字库 (可以包括所有字符集)
a. 先读出FL_Header信息;
b. 分析当前字符在第几段,比如在第n段,就可根据这个xxx[n].OffAddr+(code - xxx[n].First)* sizeof(UFL_CHAR_INDEX)找到字符索引信息(UFL_CHAR_INDEX);
c. 根据UFL_CHAR_INDEX的OffAddr再找到当前code的点阵信息;
d. 最后根据FL_Header.Ysize、UFL_CHAR_INDEX.Width、以及点阵信息即可show出当前字符。
B. TXT 文件(可选择生成): 存储的是当前字库包含字符的字模显示效果。详见转换后结果。
由于选择的编码类型(MBCS 或 Unicode)以及字符集不同,则输出的字库文件所包含的数据段也会不同。如下例表:
数据段 MBCS-CJK MBCS-非等宽 Unicode
-------------------------------------------------------------------
文件头 Y Y Y
段信息 N N Y
检索表 N Y Y
点阵信息 Y Y Y
Y: 包含
N: 不包含
注释:
MBCS: MultiByteCharset,即多字节字符集(本地字符集)。
CJK: China,Japan,Korea,即中(简体,繁体)日韩字符集。
非等宽: 每个字符的显示宽度不等。 如字符'i','M'。 除了 CJK 外,其它都默认为非等宽字符集。
Unicode: 即统一编码(宽字节字符集)
具体举例解析如下:
注意:
a. 数据都是低位在前,高位在后;
b. 宽高都以像素为单位;
c. 字符集从低到高顺序分别为:日文,简中,韩文,繁中,泰文,中欧,西里尔,西欧,希腊,土耳其文,希伯来文,阿拉伯文,波罗的海文,越南文;
A. MBCS-CJK (等宽)
00000000h: 4D 46 4C 10 50 FE 03 00 00 10 02 00 00 00 00 00
00000010h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000020h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000030h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000040h: 00 00 00 00 30 00 18 00 0C 00 04 00 00 00 00 00
...
解析如下:
1). 文件头 ( 前 16 Byte )
4D 46 4C 10 -- 标识头,判断是否为合法的字库文件。
4D = 'M', 表示该文件为 MBCS 编码格式的字库文件。
46 = 'F', 4C = 'L'
10 表示该字库文件版本信息为: Version 1.0
50 FE 03 00 -- 文件总长度
00 -- 是否包含检索表。 0-标识无检索表
10 -- 字体高度 (宽高都以像素为单位) 0x10 == 16
02 00 -- 选择的字符集标志位。 1-标识选择, 0-标识未选择. 故得出当前选择为: 简中字符集。
00 00 00 00 -- 预留字节
2). 点阵信息
因为GB2312 的首个字符:0xA1A1, 它的点阵数据起始地址为 0x10,数据长度为:((字体高度+7)/8)* 字体高度 = ((16+7)/8)*16 = 32.
故取如下 16 字节,即为字符0xA1A1的点阵信息。
00000010h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000020h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
同理如下即为字符0xA1A2的点阵信息。
00000030h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000040h: 00 00 00 00 30 00 18 00 0C 00 04 00 00 00 00 00
由于等宽,所以所有字符的点阵数据长度都为:((字体高度+7)/8)* 字体高度 = ?
B. MBCS-非等宽
Sample 子目录下的文件arialuni16_CP1252.bin, 文件内容如下:
00000000h: 4D 46 4C 10 90 1A 00 00 01 10 80 00 00 00 00 00
00000010h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000020h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000030h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000040h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000050h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000060h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000070h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000080h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000090h: 10 04 00 10 20 04 00 10 30 04 00 18 40 04 00 24
...
00000410h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00000420h: 00 00 40 40 40 40 40 40 40 40 00 40 40 00 00 00
....
解析如下:
1). 文件头 ( 前 16 Byte )
4D 46 4C 10 -- 标识头,判断是否为合法的字库文件。
4D = 'M', 表示该文件为 MBCS 编码格式的字库文件。
46 = 'F', 4C = 'L'
10 表示该字库文件版本信息为: Version 1.0
90 1A 00 00 -- 文件总长度
01 -- 是否包含检索表。 1-标识有检索表
10 -- 字体高度 0x10 == 16
80 00 -- 选择的字符集标志位。 1-标识选择, 0-标识未选择. 故得出当前选择为: 西欧字符集。
00 00 00 00 -- 预留字节
2). 检索表
从 00000010h 开始,每 4 个字节表示一个字符的检索信息, 且从字符 0x0 开始。故空格字符(' ')的检索信息(00000090h)为:10 04 00 10
即得出一个 32 位数为: 0x10000410(十六进制) --- (00010000 00000000 00000100 00010000).
高 6 位,表示当前字符的宽度。 故得出 000100 -- 4 (字库宽度为 4 )
低 26 位, 表示当期字符的点阵信息的偏移地址。故得出 00 00000000 00000100 00010000 -- 0x410 (点阵信息的起始地址为 0x410)
3). 点阵信息
由于空格字符的起始地址为 0x410,且数据长度为:((字体宽度+7)/8)* 字体高度 = ((4+7)/8)*16 = 16.
故取如下 16 字节,即为空格字符的点阵信息。
00000410h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
同理如下即为字符'!' 的点阵信息。
00000420h: 00 00 40 40 40 40 40 40 40 40 00 40 40 00 00 00
C. Unicode (具体请参阅文件 .\Demo\ReadUnicode.c)
00000000h: 55 46 4C 10 28 AB 07 00 01 10 81 00 00 00 00 00
00000010h: 20 00 FF FF 18 00 00 00 98 FF 03 10 A8 FF 03 10
...
0003ff90h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0003ffa0h: 00 00 00 00 00 00 00 00 00 00 40 40 40 40 40 40
0003ffb0h: 40 40 00 40 40 00 00 00 00 00 48 48 48 48 00 00
...
解析如下:
1). 文件头 ( 前 16 Byte )
55 46 4C 10 -- 标识头,判断是否为合法的字库文件。
55 = 'U', 表示该文件为 UNICODE 编码格式的字库文件。
46 = 'F', 4C = 'L'
10 表示该字库文件版本信息为: Version 1.0
28 AB 07 00 -- 文件总长度
01 -- 包含几个Section。 1- 1 Section ( 在不包括CJK时,会分成3 Section)
10 -- 字体高度 0x10 == 16
81 00 -- 选择的字符集标志位。 1-标识选择, 0-标识未选择. 故得出当前选择为: 日文+西欧字符集。
00 00 00 00 -- 预留字节
2). 段信息 (n section * sizeof(FL_SECTION_INF) = 1 * 8 = 8))
20 00 -- First character
FF FF -- Last character
18 00 00 00 -- OffAddr; /* 指向的是当前SECTION中First character对应的 UFL_CHAR_INDEX信息的起始地址 */
3). 检索表 ((Section[0].Last - Section[0].First + 1) * 4 + (Section[n-1].Last - Section[n-1].First + 1) * 4)
每 4 个字节表示一个字符的检索信息, 且从字符Section[0].First 开始。故字符0x20的检索信息(起始地址 =
(字符的unicode码 - Section[x].First) × 4 + Section[x].OffAddr, x 为当前字符处在的section索引值,可判断得出。)为:98 FF 03 10
即得出一个 32 位数为: 0x1003FF98(十六进制) --- (00010000 00000011 11111111 10011000).
高 6 位,表示当前字符的宽度。 故得出 000100 -- 4 (字库宽度为 4 )
低 26 位, 表示当期字符的点阵信息的偏移地址。故得出 00 00000011 11111111 10011000 -- 0x3FF98 (点阵信息的起始地址为 0x3FF98)
3). 点阵信息
由于空格字符的起始地址为 0x3FF98,且数据长度为:((字体宽度+7)/8)* 字体高度 = ((4+7)/8)*16 = 16.
故取如下 16 字节,即为空格字符的点阵信息。
0003ff98h: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
同理如下即为字符0x21 的点阵信息。
0003ffA8h: 00 00 40 40 40 40 40 40 40 40 00 40 40 00 00 00
字库制作软件下载地址:http://download.csdn.net/detail/duola_rain/8067953