utf-8字符串截断函数

我在《转用PHP截断函数mb_substr()》这篇文章说过,由于主机对 mb_strimwidth() 函数支持不够好(主要是无法解决)——会出现乱码,所以我专用 php 的另外一个支持中文字符串截断函数 mb_substr(),但:

mb_substr() 函数的文字个数中,英文字母也算1个,这样就造成带有中英文字符的字符串截取后的长短差异太大,不美观啊。

于是想起以前收录过的一段支持utf-8字符串截取的代码,但以前收录时忘了哪里收录的,貌似也没有源代码出处,我稍微改下,用法类似 mb_strimwidth()。不同的是文字个数计算,mb_strimwidth() 中的长度是2个算一个中文字符;而现在这个新写的函数是2个英文字母算1个字符来计算的,中文是1对1。

例如:ZWWoOoOo的博客
总数字是:7个

下面是我修改过的函数代码:(代码扔到主题文件 functions.php 里面)

/*
utf-8 字符串截取函数 edit by zwwooooo
$sourcestr:要截取的字符串,默认空
$i:开始截取地方,默认0
$cutlength:截取长度(文字个数),默认150
$endstr:截取后的字符串末尾字符串,默认是 “....”
*/
function z_substr($sourcestr='',$i=0,$cutlength=150,$endstr='...')
{
	$str_length=strlen($sourcestr);//字符串的字节数
	while (($n<$cutlength) and ($i<=$str_length))
	{
		$temp_str=substr($sourcestr,$i,1);
		$ascnum=Ord($temp_str);//ascii码
		if ($ascnum>=224)
		{
			$returnstr=$returnstr.substr($sourcestr,$i,3);
			$i=$i+3;
			$n++;
		}elseif ($ascnum>=192)
		{
			$returnstr=$returnstr.substr($sourcestr,$i,2);
			$i=$i+2;
			$n++;
		}else
		{
			$returnstr=$returnstr.substr($sourcestr,$i,1);
			$i=$i+1;
			$n=$n+0.5;
		}
	}
	if($i<$str_length)$returnstr.=$endstr;
	return $returnstr;
}

调用方法:参数说明看上面代码注释。

<?php echo z_substr($sourcestr$i$cutlength, $endstr); ?>

具体应用可以参考《mb_strimwidth函数的简单应用》。

就这样,完。

转自《 utf-8字符串截断函数》

你可能感兴趣的:(utf-8字符串截断函数)