开发自己的jar包 pinyin4j

今天开发了自己的第二个开源工具 jar包
名称:pinyin4j.jar
功能: 将汉语拼音转换为汉语拼音

算法:
从对应的资源文件中(文件中包含了常用汉字的unicode编码-拼音)
文件格式如下:
3007 (ling2)
4E00 (yi1)
4E01 (ding1,zheng1)
4E02 (kao3)
4E03 (qi1)
4E04 (shang4,shang3)
.
.
.
用数据流的方式读取 然后将unicode码以key,pinyin为value存入一个HashMap中

接口:
    传入:汉语拼音的字符串
    返回:拼音的字符串数组(即每个汉语拼音对应相应的拼音)


源码:
package com.anduo.pinyin4j;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.HashMap;

public class PinYinHelper {
	private static HashMap<String, String> hashMap = new HashMap<String, String>();

	/**
	 * 将unicode-to-hanyu-pinyin.txt文件 以unicode为key pinyin为value 加到hashmap中
	 */
	private static void myReader() {
		InputStream is = PinYinHelper.class.getClass().getResourceAsStream(
				"/resource/unicode_to_hanyu_pinyin.txt");
		BufferedReader breader = new BufferedReader(new InputStreamReader(is));
		String s;
		String unicode;
		String pinyin;
		try {
			while ((s = breader.readLine()) != null) {
				// 提取文件流每行中的unicode码以及 pinyin字符串
				unicode = s.substring(0, 4);
				pinyin = s.substring(6, s.length() - 1);
				hashMap.put(unicode.toLowerCase(), pinyin);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	/**
	 * 将汉语转换为汉语拼音
	 * 
	 * @param value
	 * @return pinyin[]
	 */
	public static String[] toHanYuPinYin(String value) {

		myReader();

		String[] result = new String[value.length()];
		String unicode;
		String pinyin;
		for (int i = 0; i < value.length(); i++) {
			Character c = value.charAt(i);
			unicode = Integer.toHexString(c);// 得到汉字的unicode编码
			pinyin = hashMap.get(unicode);// 从hashMap中找到汉子的拼音
			result[i] = pinyin;
		}

		return result;
	}
}



然后导出为jar包

测试一下:
新建一个java工程,然后将刚做好的jar包导入的工程中
新建一个test类
package com.anduo;

import com.anduo.pinyin4j.PinYinHelper;

public class test {
	public static void main(String[] args) {

		String s[] = PinYinHelper.toHanYuPinYin("大但是关键的是概多少了攻击多少");
		for (String string : s) {
			System.out.println(string);
		}

	}
}



测试效果:
da4,dai4
dan4
shi4
guan1
jian4
de5,di4,di2
shi4
gai4
duo1
shao3,shao4
le5,liao3,liao4
gong1
ji1
duo1
shao3,shao4


遇到的问题,在导出jar包的时候出了很多错误
主要问题出在: 如何读取jar包中的资源文件 这个可以参考我收藏的一篇文章

你可能感兴趣的:(java,C++,c,算法,C#)