反转UTF8编码中文字符串的2种方法

某天查手册时,看到strrev函数下面有一个 utf8_strrev函数的实现,觉得有些意思,于是自己使用mb开头的函数写了另一个实现。
【第一种方案】
使用正则匹配出所有的内容到数组,然后使用数组中的反转函数将整个数组反转,然后将数组转化成字符串
其代码如下:

12345678910111213141516
 <?phpheader("Content-type:text/html;charset=utf-8"); $str = "bb我是中国人aaaa"; /*** 反转utf8的字符串,使用正则和数组实现* @param string $str* @return string*/function utf8_strrev($str){  preg_match_all('/./us', $str, $ar);  return implode('', array_reverse($ar[0]));                                                   }echo utf8_strrev($str), '<br />';

其中正则的两个修正符的说明如下:
u (PCRE_UTF8)
此修正符启用了一个 PCRE 中与 Perl 不兼容的额外功能。模式字符串被当成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。
s (PCRE_DOTALL)
如果设定了此修正符,模式中的圆点元字符(.) 匹配所有的字符,包括换行符。没有此设定的话,则不包括换行符。这和 Perl 的 /s 修正符是等效的。排除字符类例如 [^a] 总是匹配换行符的,无论是否设定了此修正符。

【第二种方案】
使用Multibyte String Functions实现
算出字符串在utf8ut编码下的长度,倒序取每个utf8字符,连接起来,返回。

1234567891011121314151617181920
<?phpheader("Content-type:text/html;charset=utf-8"); $str = "bb我是中国人aaaa"; /*** 反转utf8的字符串,使用mb开头的函数* @param string $str* @return string*/function mb_strrev($str) {    $len = mb_strlen($str, 'UTF-8');    $string = '';    for ($i = $len - 1; $i >= 0; $i--) {       $string .= mb_substr($str, $i, 1, 'UTF-8');                                                             }    return $string;} echo mb_strrev($str);

最后一句:多看手册

本文地址: 反转UTF8编码中文字符串的2种方法    文章出处: PHP源码阅读,PHP设计模式,PHP学习笔记-胖子的空间

转载请以链接形式注明原始出处和作者,谢绝不尊重版权者抄袭!

你可能感兴趣的:(utf8)