php mb_substr、mb_strcut 函数详细介绍

PHP substr()函数可以分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut这个函 数,mb_substr() /mb_strcut的用法与substr()相似,只是在mb_substr()/mb_strcut最后要加入多一个参数,以设定字符串的编码,一般的服务器都没打开php_mbstring.dll,需要在php.ini中打开php_mbstring.dll。

<?php
header("Content-type:text/html;charset=utf-8");

$str = '这样一来我的字符串就不会有乱码^_^';

echo "mb_substr:" . mb_substr($str, 0, 6);
//结果:这样
echo "<br>";
echo "mb_substr:" . mb_substr($str, 0, 6, 'utf-8');
//结果:这样一来我的
echo "<br>";

echo "mb_strcut:" . mb_strcut($str, 0, 6);
//结果:这样
echo "<br>";
echo "mb_strcut:" . mb_strcut($str, 0, 6, 'utf-8');
//结果:这样
?>

从上面的例子可以看出,mb_substr不指定编码时是按字节来切分字符,指定编码时是按字来切分字符,而mb_strcut都是按字节来切分字符,而且都不会产生半个字符的现象。

php 中 utf-8 编码一个中文字符占 3 个字节,gbk 和 gb2312 编码一个中文字符占 2 个字节。

下面是ecshop里面的截取UTF-8编码下字符串的函数

function sub_str($str, $length = 0, $append = true)
{
    $str = trim($str);
    $strlength = strlen($str);

    if ($length == 0 || $length >= $strlength)
    {
        return $str;  //截取长度等于0或大于等于本字符串的长度,返回字符串本身
    }
    elseif ($length < 0)  //如果截取长度为负数
    {
        $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
        if ($length < 0)
        {
            $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
        }
    }

    if (function_exists('mb_substr'))
    {
        $newstr = mb_substr($str, 0, $length, EC_CHARSET);
    }
    elseif (function_exists('iconv_substr'))
    {
        $newstr = iconv_substr($str, 0, $length, EC_CHARSET);
    }
    else
    {
        //$newstr = trim_right(substr($str, 0, $length));
        $newstr = substr($str, 0, $length);
    }

    if ($append && $str != $newstr)
    {
        $newstr .= '...';
    }

    return $newstr;
}


参考:http://www.cnblogs.com/whendream/archive/2011/10/02/2198124.html

你可能感兴趣的:(php mb_substr、mb_strcut 函数详细介绍)