1. 字符串有多长是指字符数还是字节数?
2.字符串有几种存在形式?
3.字符串存在的形式有那些限制?
由一个问题,我们可以延伸出这么多问题?
样板代码:
// 栈
String longStr = "aaaaa.....aaaaa";
这种样板代码的形式是存在栈中。
从文件中读取字符串:
// 堆
byte[] strByte = loadFromFile(new File("String.txt"));
String longStr = new String(strByte);
这种通过从文件中读取字符串的形式是存在堆中。
// 栈
String longStr = "aaaaa.....aaaaa";
CONSTANT_Utf8_info{
u1 tag;
u2 length; // 16位证书 2^16-1 = 65535 0~65535
u1 bytes[length]; // 65535
}
Java String 的字节长度为65535,由此得出栈中String的最大长度可以装65535个字节?
当我们写65535个a的时候运行它居然报错:error: constant string too long
不思其解???
我们找到javac编译源码:view src/share/classes/com/sun/tools/javac/jvm/Gen.java
找到方法:checkStringConstant()
我们看下Pool.MAX_STRING_LENGTH 是多少
路径:/langtools/src/share/classes/com/sun/tools/javac/jvm/Pool.java
由此得出必须得小于65535,所以String 能装65534个拉丁字符。
引发思考既然能装65534个拉丁字符,那能装多少个中文字符呢?
有人这时马上就说能装 65534/3个,结果出乎意料中文能装65535/3个。
我们再一起探索中文字符,我们再次翻出javac源码进行探索
路径:/langtools/src/share/classes/com/sun/tools/javac/jvm/ClassWriter.java
writePool 方法
可以看到这里写的是 bs.length > Pool.MAX_STRING_LENGTH 就会抛出异常,那么证明中文字符是可以装65535/3个。
由此我们得出结论:在栈中的字符串可以装拉丁字节65534个,非拉丁字节可以装65535个,可以装中文字符65535/3个。
// 堆
byte[] strByte = loadFromFile(new File("String.txt"));
String longStr = new String(strByte);
String内部是以char数组的形式存储,数组的长度是int类型,那么String允许的最大长度就是Integer.MAX_VALUE,不过也受实际的内存影响。
由此得出如果我们的字符长过长,我们可以通过写文件 读文件的方式去解决。
javac编译源码github参考地址:https://github.com/infobip/infobip-open-jdk-8