ES6--(2)字符串与正则表达式

更好的 Unicode 支持

UTF-16 代码点

        在 UTF-16 中的第一个 2 代码点表示单个 16 位码元,这个范围被称为多语言基本平面(Basic Multilingual Plane , BMP )。任何超出该范围的代码点都不能用单个 16 位码元表示,而是会落在扩展平面( supplementary planes )内。 UTF-16 引入了代理对(surrogate pairs )来解决这个问题,允许使用两个 16 位码元来表示单个代码点。这意味着字符串内的任意单个字符都可以用一个码元(共 16 位)或两个码元(共 32 位)来表示,前者对应基本平面字符,而后者对应扩展平面字符。

codePointAt() 方法:可以在给定字符串中按位置提取 Unicode 代码点。该方法接受的是码元位置而非字符位置,并返回一个整数值。( charCodeAt() )

String.fromCodePoint() 方法:可以使用codePointAt() 来提取字符串内中某个字符的代码点,也可以借助 String.fromCodePoint()用给定的代码点来产生包含单个字符的字符串。

normalize() 方法

正则表达式 u 标志

        ES6 为正则表达式定义了用于处理Unicode 的 u 标志。

u 标志如何运作

        当一个正则表达式设置了 u 标志时,它的工作模式将切换到针对字符,而不是针对码元。这意味着正则表达式将不会被字符串中的代理对所混淆,而是会如预期那样工作。

判断是否支持 u 标志

ES6--(2)字符串与正则表达式_第1张图片

字符串的其他改动

    识别子字符串的方法

        includes() 方法:在给定文本存在于字符串中的任意位置时会返回 true ,否则返回false ;

        startsWith() 方法:在给定文本出现在字符串起始处时返回 true ,否则返回 false ;

        endsWith() 方法:在给定文本出现在字符串结尾处时返回 true ,否则返回 false。

    repeat() 方法

        它接受一个参数作为字符串的重复次数,返回一个将初始字符串重复指定次数的新字符串。


正则表达式的其他改动

    正则表达式 y 标志

        y 标志影响正则表达式搜索时的粘连( sticky )属性,它表示从正则表达式的 lastIndex 属性值的位置开始检索字符串中的匹配字符。如果在该位置没有匹配成功,那么正则表达式将停止检索。

    复制正则表达式

ES6--(2)字符串与正则表达式_第2张图片

    flags属性

        ES6 新增了 flags 属性用于配合 source 属性,让标志的获取变得更容易。这两个属性均为只有 getter 的原型访问器属性,因此都是只读的。

ES6--(2)字符串与正则表达式_第3张图片

模板字面量

    模板字面量是 ES6 针对 JS 直到 ES5 依然完全缺失的如下功能的回应:

        1、多行字符串:针对多行字符串的形式概念;

        2、基本的字符串格式化:将字符串部分替换为已存在的变量值的能力;

        3、HTML 转义:能转换字符串以便将其安全插入到 HTML 中的能力。

    基本语法

        使用反引号( ` )来包裹普通字符串。在模板字面量中无需对双引号或单引号进行转义。

多行字符串

    制造替换位

        替换位允许你将任何有效的 JS 表达式嵌入到模板字面量中,并将其结果输出为字符串的一部分。

        替换位由起始的 ${ 与结束的 } 来界定,之间允许放入任意的 JS 表达式。

ES6--(2)字符串与正则表达式_第4张图片

    标签化模板

        一个模板标签( template tag )能对模板字面量进行转换并返回最终的字符串值,标签在模板的起始处被指定,即在第一个 ` 之前。

    定义标签

 一个名为 passthru() 的函数,该函数将会接收到三个参数。首先是一个literals 数组,包含如下元素:

            在首个替换位之前的空字符串( "" );

            首个替换位与第二个替换位之间的字符串( " items cost $" );

            第二个替换位之后的字符串( "." )。

    接下来的参数会是 10 ,也就是 count 变量的解释值,它也会成为 substitutions 数组的第一个元素。

    最后一个参数则会是 "2.50" ,即 (count * price).toFixed(2) 的解释值,并且会是 substitutions 数组的第二个元素。

    需要注意 literals 的第一个元素是空字符串,以确保 literals[0] 总是字符串的起始部分,正如 literals[literals.length - 1] 总是字符串的结尾部分。同时替换位的元素数量也总是比字面量元素少 1 ,意味着表达式 substitutions.length === literals.length - 1 的值总是 true。

    使用模板字面量中的原始值

        模板标签也能访问字符串的原始信息,主要指的是可以访问字符在转义之前的形式。获取原始字符串值的最简单方式是使用内置的 String.raw() 标签。

你可能感兴趣的:(ES6--(2)字符串与正则表达式)