php截取中文字符串长度的mb_substr()、mb_strcut()函数 附strlen/mb_strlen

substr()函数可以用来分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut这个函数,mb_substr() /mb_strcut的用法与substr()相似,只是在mb_substr()/mb_strcut最后要加入多一个参数,以设定字符串的编码,但是 一般的服务器都没打开php_mbstring.dll,需要在php.ini在把php_mbstring.dll打开。


举个例子:

echo mb_substr('这样一来我的字符串就不会有乱码^_^', 0, 7, 'utf-8');
?>
输出:这样一来我的字

echo mb_strcut('这样一来我的字符串就不会有乱码^_^', 0, 7,'utf-8');
?>
输出:这样

从上面的例子可以看出,mb_substr是按字来切分字符,而mb_strcut是按字节来切分字符,但是都不会产生半个字符的现象……

上面一段是摘抄网络上的,结果都是经本人测试得出的。

个人理解:
mb_substr()函数对英文或中文字符都表示一个单位。
mb_strcut()函数对中文字符是3个单位,英文是1个单位。

例如:
$str = "这样abcd一来";
echo "mb_substr:".mb_substr($str, 0, 5, 'utf-8');
echo "
";
echo "mb_strcut:".mb_strcut($str, 0, 8, 'utf-8');
?>
输出结果如下:
mb_substr: 这样abc
mb_strcut:  这样ab


附:

strlen 与 mb_strlen 的差别:
$str="中文a字1符"; 
echo strlen($str);
echo "
"; 
echo mb_strlen($str,'UTF8'); 
?>
输出结果:
14 


以上结果都是经测试得出

你可能感兴趣的:(php)