php截取中文字符串长度的mb_substr()、mb_strcut()函数

substr()函数可以用来分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut这个函数,mb_substr() /mb_strcut的用法与substr()相似,只是在mb_substr()/mb_strcut最后要加入多一个参数,以设定字符串的编码,但是 一般的服务器都没打开php_mbstring.dll,需要在php.ini在把php_mbstring.dll打开。

举个例子:

echo mb_substr(‘这样一来我的字符串就不会有乱码^_^’, 0, 7, ‘utf-8′);
?>

输出:这样一来我的字

echo mb_strcut(‘这样一来我的字符串就不会有乱码^_^’, 0, 7,’utf-8′);
?>

输出:这样

从上面的例子可以看出,mb_substr是按字来切分字符,而mb_strcut是按字节来切分字符,但是都不会产生半个字符的现象……

上面一段是摘抄网络上的,结果都是经本人测试得出的。

个人理解:
mb_substr()函数对英文或中文字符都表示一个单位。
mb_strcut()函数对中文字符是3个单位,英文是1个单位。

例如:
$str = “这样abcd一来”;
echo “mb_substr:”.mb_substr($str, 0, 5, ‘utf-8′);
echo “
”;
echo “mb_strcut:”.mb_strcut($str, 0, 8, ‘utf-8′);
?>

输出结果如下:
mb_substr: 这样abc
mb_strcut:  这样ab

附:

strlen 与 mb_strlen 的差别:

$str=”中文a字1符”; 
echo strlen($str); 
echo “
”; 
echo mb_strlen($str,’UTF8′); 
?>

输出结果:
14 

转载于:https://my.oschina.net/u/3483680/blog/1853788

你可能感兴趣的:(php)