php 汉字转拼音 [包含20902个基本汉字+5059生僻字]

原文: php 汉字转拼音 [包含20902个基本汉字+5059生僻字]

昨天在转换拼音的时候发现个bug,有好多字都无法转换,不过也不能怪他,毕竟人家的库才8k,应该只有常用的。
无奈上网找了下,发现一篇《最全的PHP汉字转拼音函数(共25961字,包含20902个基本汉字+5059生僻字)

看着都屌,测试后也不错,都能识别,但问题是功能不够,,无奈,自己动手压缩字库(无损压缩),扩展功能。
我用的是他 pinyin.php ~ 206KB 那个UTF8字库,经过压缩扩展后就剩 106K 了。
当然性能也直逼他的,1万次压力测试,他的2.4s,扩展后2.8s,仅仅损耗0.4s,所以可以忽略不计。
无图无真相 (测试环境 CPU:I5-4210M, 内存8G, win8.1, php5.5.12)

php 汉字转拼音 [包含20902个基本汉字+5059生僻字]_第1张图片

php 汉字转拼音 [包含20902个基本汉字+5059生僻字]_第2张图片

好了,展示的差不多了,下面介绍下扩展的功能吧。
原生的只有转换+是否返回首字母功能。
扩展后支持
1. 返回格式 [all:全拼音|first:首字母|one:仅第一字符首字母]
2. 无法识别的字符替换用的占位符 (原版写死的是 _ )
3. 允许的非中文字符 正则控制 (原版写死0-9a-zA-Z, 空格都不支持)

其实看图就都明白了

php 汉字转拼音 [包含20902个基本汉字+5059生僻字]_第3张图片

好了,上链接。

下载: pinyin.zip

你可能感兴趣的:(PHP)