汉字转拼音原理

    android源码有汉字转拼音的文件,路径:android_source/packages/providers/ContactsProvider/src/com/android/providers/contacts/HanziToPinyin.java,有兴趣的朋可以研究下,不过通过转换的拼音很多不对。

    汉字转拼音很多地方要用到,比如联系人按姓氏首字母排序,拨号盘的模糊匹配,其他检索等都要用到汉字转拼音。 由于汉字在系统中的存储与它对应的拼音没有什么关系,目前汉字转拼音是通过一个汉字和拼音的对照库进行转换的。

   ASCII表中 数字 '0' 对应 0x30,'1' 对应 0x31...'a'对应 0x61.

   utf-8和unicode的区别是utf-8一个字符占一个字节(8位),而unicode是定长编码,每个字符都是2 字节(16位)。

    Java的class文件采用utf8的编码方式,JVM运行时采用utf16。Java的字符串是unicode编码的。Java采用了unicode字符集,使之易于国际化。比如,中文 '啊' 对应 0x554A.

   目前汉字转拼音是通过汉字和拼音的对照表进行查询的,比如:554A (A)(前面提到在 '啊' 在unicode 对应的index是 0x554A),即 '啊' (A)('啊' 的拼音 a),再如548C (He,Huo,Hu) (0x548C 对应 '和',据说是汉字多音字中多音最多的一个字)。

  【 和 5个音
1 he(二声) ---日本和服
2 he(四声) ---曲高和寡
3 hu(二声) ---打麻将和牌
4 huo(二声)---和面
5 huo(四声)---衣服已经洗了三和 】
    知道这个原理,就明白汉字怎么转拼音的了啦。

    下面自己在前辈的基础上,写了个demo的效果图。

 汉字转拼音原理_第1张图片

 汉字转拼音原理_第2张图片

你可能感兴趣的:(汉字转拼音原理)