怎样获取中文字串的首字母?

  1. public class ChineseLetter {   
  2.     // 国标码和区位码转换常量   
  3.     private static final int GB_SP_DIFF = 160;   
  4.     // 存放国标一级汉字不同读音的起始区位码   
  5.     private static final int[] secPosValueList = { 1601163718332078,   
  6.             22742302243325942787310632123472363537223730,   
  7.             385840274086439045584684492552495600 };   
  8.   
  9.     // 存放国标一级汉字不同读音的起始区位码对应读音   
  10.     private static final char[] firstLetter = { 'a''b''c''d''e''f',   
  11.             'g''h''j''k''l''m''n''o''p''q''r''s''t',   
  12.             'w''x''y''z' };   
  13.   
  14.     // 获取一个字符串的拼音码   
  15.     public static String getFirstLetter(String oriStr) {   
  16.         String str = oriStr.toLowerCase();   
  17.         StringBuffer buffer = new StringBuffer();   
  18.         char ch;   
  19.         char[] temp;   
  20.         for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符   
  21.             ch = str.charAt(i);   
  22.             temp = new char[] { ch };   
  23.             byte[] uniCode = new String(temp).getBytes();   
  24.             if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字   
  25.                 buffer.append(temp);   
  26.             } else {   
  27.                 buffer.append(convert(uniCode));   
  28.             }   
  29.         }   
  30.         return buffer.toString();   
  31.     }   
  32.   
  33.     // 获取一个汉字的首字母   
  34.     public static char convert(byte[] bytes) {   
  35.         char result = '-';   
  36.         int secPosValue = 0;   
  37.         int i;   
  38.         for (i = 0; i < bytes.length; i++) {   
  39.             bytes[i] -= GB_SP_DIFF;   
  40.         }   
  41.         secPosValue = bytes[0] * 100 + bytes[1];   
  42.         for (i = 0; i < 23; i++) {   
  43.             if (secPosValue >= secPosValueList[i]   
  44.                     && secPosValue < secPosValueList[i + 1]) {   
  45.                 result = firstLetter[i];   
  46.                 break;   
  47.             }   
  48.         }   
  49.         return result;   
  50.     }   
  51.   
  52.     public static void main(String[] args) {   
  53.         System.out.println(ChineseLetter.getFirstLetter("我是中国人"));   
  54.     }   
  55. }  
public class ChineseLetter {
	// 国标码和区位码转换常量
	private static final int GB_SP_DIFF = 160;
	// 存放国标一级汉字不同读音的起始区位码
	private static final int[] secPosValueList = { 1601, 1637, 1833, 2078,
			2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730,
			3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5600 };

	// 存放国标一级汉字不同读音的起始区位码对应读音
	private static final char[] firstLetter = { 'a', 'b', 'c', 'd', 'e', 'f',
			'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't',
			'w', 'x', 'y', 'z' };

	// 获取一个字符串的拼音码
	public static String getFirstLetter(String oriStr) {
		String str = oriStr.toLowerCase();
		StringBuffer buffer = new StringBuffer();
		char ch;
		char[] temp;
		for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符
			ch = str.charAt(i);
			temp = new char[] { ch };
			byte[] uniCode = new String(temp).getBytes();
			if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字
				buffer.append(temp);
			} else {
				buffer.append(convert(uniCode));
			}
		}
		return buffer.toString();
	}

	// 获取一个汉字的首字母
	public static char convert(byte[] bytes) {
		char result = '-';
		int secPosValue = 0;
		int i;
		for (i = 0; i < bytes.length; i++) {
			bytes[i] -= GB_SP_DIFF;
		}
		secPosValue = bytes[0] * 100 + bytes[1];
		for (i = 0; i < 23; i++) {
			if (secPosValue >= secPosValueList[i]
					&& secPosValue < secPosValueList[i + 1]) {
				result = firstLetter[i];
				break;
			}
		}
		return result;
	}

	public static void main(String[] args) {
		System.out.println(ChineseLetter.getFirstLetter("我是中国人"));
	}
}




输出结果:
wszgr

你可能感兴趣的:(C++,c,C#,F#,J#)