日常开发之9 字符串length属性“不准确”

let str = ""
let str2 = "及"
console.log(str.length) // 2
console.log(str2.length) // 1

开发中经常会出现需要控制用户输入长度的需求,偶然间遇到这个问题,为什么都是一个汉字,str.length 是2呢?
这也是历史原因,起初电脑配置不高,Unicode使用16位二进制来存储文字(一个码元),一共可以标识65,536多个字符,后期扩展成32位(两个码元),“”就是32位由两个码元组成, "及"是16位一个码元,字符串的length属性是根据码元计算的,所以str.length是2,
判断单个字符是2个码元还是一个码元的方式:

//方法一:
/**
*return true 2个码元,false 1个码元
*/
function checkCode(str){
	//Oxffff 65,536
	return str.codePointAt(0) > 65536
}
//方法二
/**
*return true 2个码元,false 1个码元
*/
function checkCode2(str){
	return str.codePointAt(0) > str.charCodeAt(0)
}
//获取精确的length属性
 //获取精确的length属性
  function getLength(str){
      let len = 0;
      for(let i=0;i<str.length;i++){
          if(str.codePointAt(i)> 65536) i++;
          len++
          console.log(i,len)
      }
      return len
  }
  let testStr = "abc"
  getLength(testStr) // 3
  getLength("及a") //3

你可能感兴趣的:(javascript,前端)