----- 最后更新【2019-1-7】-----
一、语法
1、字符串的4种声明方式:
在php语法当中,一个字符串可以用 4 种方式表达,它们分别是:单引号
、双引号
、heredoc语法结构
、nowdoc语法结构
。
1)单引号
要表达一个单引号自身,需在它的前面加个反斜线\
来转义,即\'
。要表达一个反斜线自身,则用两个反斜线\\
。其它任何方式的反斜线都会被当成反斜线本身,即在单引号字符串中的变量和特殊字符的转义序列将不会被替换(例如\r
或者\n
也是不会被转义,也是原样输出)。
2)双引号
如果字符串是包围在双引号" "
中, PHP 将对一些特殊的字符进行解析。
当 PHP 解析器遇到一个美元符号$
时,它会和其它很多解析器一样,去组合尽量多的标识以形成一个合法的变量名。可以用花括号{}
来明确变量名的界线。
3)heredoc 语法结构
第三种表达字符串的方法是用 heredoc 语法结构:<<<
。在该运算符之后要提供一个标识符,然后换行。接下来是字符串string本身,最后要用前面定义的标识符作为结束标志。
$str = <<
Warning: 要注意的是结束标识符这行除了可能有一个分号;
外,绝对不能包含其它字符。这意味着标识符不能缩进,分号的前后也不能有任何空白或制表符。
4)nowdoc 语法结构
就象 heredoc 结构类似于双引号字符串,Nowdoc 结构是类似于单引号字符串的。Nowdoc 结构很象 heredoc 结构,但是 nowdoc 中不进行解析操作。这种结构很适合用于嵌入 PHP 代码或其它大段文本而无需对其中的特殊字符进行转义。
一个 nowdoc 结构也用和 heredocs 结构一样的标记<<<
, 但是跟在后面的标识符要用单引号括起来,即<<<'EOT'
。Heredoc 结构的所有规则也同样适用于 nowdoc结构,尤其是结束标识符的规则。
$str = <<<'EOD'
Example of string
spanning multiple lines
using nowdoc syntax.
EOD;
注意:
--单引号比双引号效率更高。
--当双引号里面包含单引号,然后单引号里面包含变量,这种情况变量也是会正常解析的,同时单引号会原样输出。
2、存取和修改字符串中的字符:
string 中的字符可以通过一个从 0 开始的下标,用类似 array 结构中的方括号包含对应的数字来访问和修改,比如$str[42]
。也可用花括号访问,比如 $str{42}
。可以把 string 当成字符组成的 array。函数 substr()
和 substr_replace()
可用于操作多于一个字符的情况。
3、转换成字符串
1)自动转换
在一个需要字符串的表达式中,会自动转换为 string。比如在使用函数 echo 或 print 时,或在一个变量和一个 string 进行比较时,就会发生这种转换。
2)强制转换
在PHP中,数据类型的转换属于强制转换,且共有三种转换方式:
一个值可以通过在其前面加上(string)
或用strval()
函数来转变成字符串。
在一个需要字符串的表达式中,会自动转换为 string。也可参考函数settype()
,如settype($var, "string");
。
二、常用函数
1、子字符串操作
1)substr—返回字符串的子串
string substr( string $string, int $start [, int $length ] )
返回字符串 string 由 start 和 length 参数指定的子字符串。
substr("abcdef", -3, 1); // 返回 "d"
substr('abcdef', 1, 3); // bcd
2)substr_replace—替换字符串的子串
mixed substr_replace ( mixed $string , mixed $replacement , mixed $start [, mixed $length ] )
substr_replace()
在字符串 string 的副本中将由 start 和可选的 length 参数限定的子字符串使用 replacement 进行替换。返回结果字符串。如果 string 是个数组,那么也将返回一个数组。
Tip: 在用于长文本隐藏时非常有用(如用...
来替换后面的字符串)。
3)str_replace—子字符串替换
mixed str_replace ( mixed $search , mixed $replace , mixed $subject [, int &$count ] )
该函数返回一个字符串或者数组。该字符串或数组是将 subject 中全部的 search 都被 replace 替换之后的结果。
如果没有一些特殊的替换需求(比如正则表达式),你应该使用该函数替换 ereg_replace()
和 preg_replace()
。
类似的方法有:
preg_replace
- 执行一个正则表达式的搜索和替换
4)strpos—查找字符串首次出现的位置
int strpos ( string $haystack , mixed $needle [, int $offset = 0 ] )
返回 needle 在 haystack 中首次出现的数字位置。
$newstring = 'abcdef abcdef';
$pos = strpos($newstring, 'a'); //$pos = 0
$pos = strpos($newstring, 'a', 1); // $pos = 7, 不是 0
与该方法类似的还有:
stripos
- 查找字符串首次出现的位置(不区分大小写)
strrpos
- 计算指定字符串在目标字符串中最后一次出现的位置
strripos
- 计算指定字符串在目标字符串中最后一次出现的位置(不区分大小写)
5)strstr—查找字符串的首次出现;别名也叫strchr
string strstr ( string $haystack , mixed $needle [, bool $before_needle = FALSE ] )
返回 haystack 字符串从 needle 第一次出现的位置开始到 haystack 结尾的字符串
Note:该函数区分大小写。如果想要不区分大小写,请使用stristr()
。
Note:如果你仅仅想确定needle是否存在于haystack中,请使用速度更快、耗费内存更少的strpos()
函数。
$email = '[email protected]';
echo strstr($email, '@'); // 打印 @example.com
echo strstr($email, '@', true); // 打印 name,从 PHP 5.3.0 起
与该方法类似的还有:
stristr
- strstr函数的忽略大小写版本
strrchr
- 查找指定字符在字符串中的最后一次出现
2、字符串修改
1)strrev—反转字符串
echo strrev("Hello world!"); // 输出 "!dlrow olleH"
2)trim—去除字符串首尾处的空白字符(或者其他字符)
相关方法:
ltrim
- 删除字符串开头的空白字符(或其他字符)
rtrim
- 删除字符串末端的空白字符(或者其他字符)。chop—rtrim 的别名
3)从字符串中去除 HTML 和 PHP 标记
string strip_tags ( string $str [, string $allowable_tags ] )
该函数尝试返回给定的字符串 str
去除空字符、HTML 和 PHP 标记后的结果。它使用与函数 fgetss() 一样的机制去除标记。
$text = 'Test paragraph.
Other text';
echo strip_tags($text);
echo "\n";
// 允许
以上例程会输出:
Test paragraph. Other text
Test paragraph.
Other text
4)字符串中大小写的转换
strtoupper
- 将字符串转化为大写
strtolower
- 将字符串转化为小写
ucfirst
- 将字符串的首字母转换为大写
ucwords
- 将字符串中每个单词的首字母转换为大写
3、字符串转换为数组
1)str_split—将字符串转换为数组
array str_split ( string $string [, int $split_length = 1 ] )
将一个字符串转换为数组。
$str = "Hello Friend";
$arr = str_split($str, 3);
print_r($arr);
以上例程会输出:
Array
(
[0] => Hel
[1] => lo
[2] => Fri
[3] => end
)
2)preg_split - 通过一个正则表达式分隔字符串。
array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )
通过一个正则表达式分隔给定字符串.
//使用逗号或空格(包含" ", \r, \t, \n, \f)分隔短语
$keywords = preg_split("/[\s,]+/", "hypertext language, programming");
print_r($keywords);
以上例程会输出:
Array
(
[0] => hypertext
[1] => language
[2] => programming
)
3)explode—使用一个字符串分割另一个字符串,返回一个数组。
array explode ( string $delimiter , string $string [, int $limit ] )
此函数返回由字符串组成的数组,每个元素都是 string 的一个子串,它们被字符串 delimiter 作为边界点分割出来。
$str = 'one|two|three|four';
print_r(explode('|', $str));
// 正数的 limit
print_r(explode('|', $str, 2));
// 负数的 limit(自 PHP 5.1 起)
print_r(explode('|', $str, -1));
以上例程会输出
Array
(
[0] => one
[1] => two
[2] => three
[3] => four
)
Array
(
[0] => one
[1] => two|three|four
)
Array
(
[0] => one
[1] => two
[2] => three
)
相关方法:
implode
- 将一个一维数组的值转化为字符串
split
- 用正则表达式将字符串分割到数组中
4、固定字符串的宽度
1)生成固定宽度字符串
方法一: 使用pack()
函数
$str = pack("A35A14A4", "The line of Unix", "Nosee Chan", 2018);
var_dump($str);
在命令行中执行可以看到如下效果:
格式字符串A35A14A4
告诉pack()将后面的参数分别转换为一个包含35个字符用空格填充的字符串、 一个14字符用空格填充的字符串、以及一个4个字符用空格填充的字符串。要在固定宽度记录中生成空格填充字段,pack()
为此提供了一个简洁的解决方案。
方法二: 使用substr()
与str_pad()
结合。
如果非空格的其它字符来填充字段,则可以考虑用该方法。
string str_pad ( string $input , int $pad_length [, string $pad_string = " " [, int $pad_type = STR_PAD_RIGHT ]] )
使用另一个字符串填充字符串为指定长度
$data = "The line of Unix";
$str = str_pad(substr($data, 0, 25), 25, '_');
var_dump($str);
2)使文本在指定行长度自动换行。
string wordwrap ( string $str [, int $width = 75 [, string $break = "\n" [, bool $cut = FALSE ]]] )
打断字符串为指定数量的字串
参数说明:str--输入字符串。 width--列宽度。 break--使用可选的break参数打断字符串。 cut--如果cut设置为TRUE,字符串总是在指定的width或者之前位置被打断。因此,如果有的单词宽度超过了给定的宽度,它将被分隔开来。(参见第二个范例)。当它是FALSE,函数不会分割单词,哪怕width小于单词宽度。
$text = "A very long woooooooooooord.";
$newtext = wordwrap($text, 8, "\n", true);
echo "$newtext\n";
以上例程会输出:
A very
long
wooooooo
ooooord.
$text = "A very long woooooooooooooooooord. and something";
$newtext = wordwrap($text, 8, "\n", false);
echo "$newtext\n";
以上例程会输出:
A very
long
woooooooooooooooooord.
and
something
5、获取字符串信息
1)获取字符串长度
int strlen ( string $string )
返回给定的字符串 string 的长度。
mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )
获取字符串的长度。返回具有 encoding 编码的字符串 str 包含的字符数。 多字节的字符被计为 1。如果给定的 encoding 无效则返回 FALSE。
$str = '玩去吧a';
echo strlen($str); //输出10
echo mb_strlen($str); //输出10
echo mb_strlen($str,'UTF-8'); //输出4
注意:
在PHP中,字符串的长度信息是直接存储在zval结构体中的,所以函数strlen()的速度非常快,时间复杂度为O(1)。
2)strval — 获取变量的字符串值
string strval ( mixed $var )
var 可以是任何标量类型(integer/float/string/boolean)。不能将 strval()
用于数组或对象。
3)is_string — 检测变量是否是字符串
bool is_string ( mixed $var )
如果 var 是 string 则返回 TRUE,否则返回 FALSE。
6、其它常用函数
htmlentities
- 将字符转换为 HTML 转义字符
md5_file
- 计算指定文件的 MD5 散列值
md5
- 计算字符串的 MD5 散列值
sha1
- 计算字符串的 sha1 散列值
str_repeat
- 重复一个字符串
strip_tags
- 从字符串中去除 HTML 和 PHP 标记
三、经典实例
1、求出字符串"45,8,7,22,34,1,12"所有数字的总合。
扩展:如果字符串中的数字并不是规范地间隔开来的呢,这时要怎么处理。如,字符串"aa56 hello,--12--5,10"。
$str = 'aa56 hello,--12--5,10';
preg_match_all('/([0-9]+)/',$str,$reg); //取出字符串中的所有数字
$sum = array_sum($reg[1]); //将数组中的所有值相加
var_dump($sum);
// 运行结果如下:
nosee123@Chan:~$ php demo9.php
int(83)
注意:如果要兼容数字有小数点的情况,则正则表达式改为/([0-9]+\.?[0-9]*)/
2、统计字符串"aaa,abcd,xxxdd;dcba"中每个字符出现的次数。
$str ='aaa,abcd,xxxdd;dcba';
$arr = str_split($str); //字符串分割成数组
$res = array_count_values($arr); //统计数组中所有值出现的次数
var_dump($res);
// 结果如下:
array (size=7)
'a' => int 5
',' => int 2
'b' => int 2
'c' => int 2
'd' => int 4
'x' => int 3
';' => int 1
其它方法参考:
$res = array();
$arr = str_split($str);
foreach ($arr as $key => $val) {
if (!isset($res[$val])) {
$res[$val] = 1;
} else {
$res[$val] += 1;
}
}
//或者:
$res = array();
$arr = str_split($str);
$unique = array_unique($arr);
foreach ($unique as $key => $val) {
$res[$val] = substr_count($str, $val); // 统计某字符在字符串中出现的次数
}
3、不使用PHP函数,用方法写一个反转字符串的函数
这里很明显是不能使用PHP的内置函数strrev()
,下面我们来模拟一个strrev方法:
$str = 'abcdefg';
function str_rev($str){
$res = '';
$len = strlen($str);
for($i=$len; $i>0;$i--){
$res .= $str[$i-1];
}
return $res;
}
echo str_rev($str); //输出为:gfedcba
4、将字符串"open_door"转换成"OpenDoor"、"make_by_id"转换成 "MakeById"。
str_replace(' ','',ucwords(str_replace('_',' ',$str)));
参考:
1、官方文档:
- http://php.net/manual/zh/book.strings.php
- http://php.net/manual/zh/language.types.string.php
2、相关书籍:
- 《PHP经典实例》 David Sklar & Adam Trachtenberg