还是在看公司项目源码,在做通讯录的时候,看到汉字转拼音的部分,觉得公司这部分做的很好,顺便也查找了一下实现这个需求的比较好的方法
第一种
- (NSString *)transformToPinyin {
NSMutableString *mutableString = [NSMutableString stringWithString:self];
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformToLatin, false);
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformStripDiacritics, false);
return mutableString;
}
CFStringTransform
Boolean CFStringTransform(CFMutableStringRef string, CFRange *range, CFStringRef transform, Boolean reverse);
string
参数是要转换的string。
range
是要转换的范围,同时输出转换后改变的范围,如果为NULL,视为全部转换。
transform
可以指定要进行什么样的转换,这里可以指定多种语言的拼写转换。
reverse
指定该转换是否必须是可逆向转换的。
返回值为转换的成功与否
如果要进行汉字到拼音的转换,我们只需要将transform
设定为kCFStringTransformMandarinLatin或者kCFStringTransformToLatin(kCFStringTransformToLatin
也可适用于非汉字字符串):
CFMutableStringRef string = CFStringCreateMutableCopy(NULL, 0, CFSTR("中国"));
CFStringTransform(string, NULL, kCFStringTransformMandarinLatin, NO);
NSLog(@"%@", string);
这段代码将输出:zhōng guó
如果不需要音标,苹果官方提供了将音标字母转换为普通字母的方法kCFStringTransformStripDiacritics
。我们在上面的代码基础上再加上这个:
CFStringTransform(string, NULL, kCFStringTransformStripDiacritics, NO);NSLog(@"%@", string);
那么最终将输出:zhong guo
进一步优化
- (NSString *)transformToPinyin {
NSMutableString *mutableString = [NSMutableString stringWithString:self];
//在这里使用正则匹配,提高效率
BOOL isNeedTransform = ![self isAllEngNumAndSpecialSign];
if (isNeedTransform) {
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformToLatin, false);
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformStripDiacritics, false);
}
return mutableString;
}
- (BOOL)isAllEngNumAndSpecialSign {
NSString *regularString = @"^[A-Za-z0-9\\p{Z}\\p{P}]+$";
NSPredicate *predicate = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regularString];
return [predicate evaluateWithObject:self];
}
结合CFStringTransform
- (NSString *)transformToPinyin {
NSMutableString *mutableString = [NSMutableString stringWithString:self];
BOOL isNeedTransform = ![self isAllEngNumAndSpecialSign];
if (isNeedTransform) {
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformToLatin, false);
//kCFStringTransformStripCombiningMarks 可以变换来去除变音符和重音
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformStripCombiningMarks, false);
}
return mutableString;
}
- (BOOL)isAllEngNumAndSpecialSign {
NSString *regularString = @"^[A-Za-z0-9\\p{Z}\\p{P}]+$";
NSPredicate *predicate = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regularString];
return [predicate evaluateWithObject:self];
}
项目开发,网上推荐的最快的方式
- (NSString *)transformToPinyin {
NSMutableString *mutableString = [NSMutableString stringWithString:self];
CFStringTransform((CFMutableStringRef)mutableString, NULL, kCFStringTransformToLatin, false);
mutableString = (NSMutableString *)[mutableString stringByFoldingWithOptions:NSDiacriticInsensitiveSearch locale:[NSLocale currentLocale]];
return [mutableString stringByReplacingOccurrencesOfString:@"'" withString:@""];
}
其中[mutableString stringByFoldingWithOptions:NSDiacriticInsensitiveSearch locale:[NSLocale currentLocale]];
是将本地字符串折叠,这样看起来是提高了速度。
最后[mutableString stringByReplacingOccurrencesOfString:@"'" withString:@""]
在测试中并没有什么作用,也不知道这段代码的实际含义是什么
总结
一般来说,团队开发我是结合CFStringTransform那部分就差不多了,最后那部分代码,我觉得应该在模糊搜索使用中,可是看一些第三方库也是这么使用 来获取首字母,所以就这么用吧。最后说一句,如果不想自己写这部分代码,还可以参考[PinYin4Objc]这个第三方库,听说效率比上面这些都高,只不过在团队开发中,本着尽量减少第三方库的想法,就没有使用,读者有兴趣可以去使用看看。