Java toLowerCase/toUpperCase方法导致长度不一致

例子:

String s = "İstanbullu";
System.out.println(s.length == s.toLowerCase().length)

İstanbullu是土耳其语伊斯坦布尔

原因:

官方文档 toLowerCase

使用给定语言环境的规则将此字符串中的所有字符转换为小写。大小写映射基于由字符类指定的Unicode标准版本。因为大小写映射并不总是1:1的字符映射,所以结果字符串的长度可能与原始字符串不同。

解决方案

方案一

自己写一个转换方法

public static String toLowerCase(String cs) {
        char[] letter = cs.toCharArray();
        for (int i = 0; i < cs.length(); i++) {
            char ch = letter[i];
            letter[i] = Character.toLowerCase(ch);
        }
        return new String(letter);
    }

方案二

s.toLowerCase(new Locale("tr","TR"));

你可能感兴趣的:(Java toLowerCase/toUpperCase方法导致长度不一致)