闲来无事想大概看下Java编译器的执行过程
一、 编译一个文件
首先去搞到源代码。从JDK6开始Java代码开源,放到OPENJDK组织中去,所以从这个网站进行下载:
http://hg.openjdk.java.net/jdk6/jdk6/langtools/
下载之后是一个zip包,解压,可以直接导入到eclipse中进行使用,导入之后可能会报错,需要设置一下。
好,下面写一个用作测试的类:
import java.util.Arrays;
import java.util.List;
import org.apache.commons.lang.StringUtils;
public class Test {
public static void main(String[] args) {
System.out.println("main");
}
public void test(){
List list = Arrays.asList(1, 2, 3, 4);
for (int i : list) {
System.out.println(i);
}
}
}
这个代码之后还会用到,其中包含了foreach, 变参, 泛型,自动封包这些Java提供的一些语法上的支持, 在后面会看到其实知识语法糖,并不是JVM底层支持的。
另外如下代码调用编译器对这个文件进行编译:
import com.sun.tools.javac.main.Main;
public class MyCompiler {
public static void main(String[] args) {
Main compiler = new Main("javac");
args = new String[]{"-classpath", ".\\lib\\commons-lang-2.5.jar", "-d", "\\", ".\\src\\com\\prince\\jvmtest\\Test.java"};
compiler.compile(args);
}
}
执行之就能够编译出class文件了。
二、查看编译过程
1. 参数转化及文件验证
在调用到最最重要的JavaCompiler类之前会有统一进行一次参数处理,
把参数存到Option类中,
检查源文件是否存在,不存在会抛出异常:
javac: 找不到文件: .\src\com\prince\jvmtest\Test1.java
主要的代码块来了:
// These method calls must be chained to avoid memory leaks
delegateCompiler =
processAnnotations(
enterTrees(stopIfError(CompileState.PARSE, parseFiles(sourceFileObjects))),
classnames);
delegateCompiler.compile2();
2. parseFiles 语法和词法分析,经过了这一步将会把java文件转化为一个treemap, 所有的代码都转化为语法单元。以后就不会用到源文件了。
3. stopIfError 语法错误检测,比如final类型不能重定义等。
4. processAnnotations 标注处理
下一块代码
generate(desugar(flow(attribute(todo.remove()))));
5. attribute 语义错误检查至标注分析。 比如定义了String a = 1;会在这里抛出异常
还进行了代码折叠,比如int a = 1+ 2会被折叠为int a =3.
6. flow 另外一些有关流程的语义分析,比如是否有返回值,受检异常是否捕获, 是否存在未初始化就使用变量的情况
7. desugar 解语法糖
语法糖还是很重要的, Java中很多新的特性并不提供运行期支持,仅仅提供了编译器支持。
刚才的那段代码经过了这一系列操作之后的代码会变成如下的状态:
[Pair[Env[AttrContext[Scope[super, this]],outer=Env[AttrContext[Scope[java.util.List, java.util.Arrays, com.prince.jvmtest.Test]]]],
public class Test {
public Test() {
super();
}
public static void main(String[] args) {
System.out.println("main");
}
public void test() {
List list = Arrays.asList(new Integer[]{Integer.valueOf(1), Integer.valueOf(2), Integer.valueOf(3), Integer.valueOf(4)});
for (.java.util.Iterator i$ = list.iterator(); i$.hasNext(); ) {
int i = ((Integer)i$.next()).intValue();
{
System.out.println(i);
}
}
}
}]]
会发现变了很多的内容
以后Java可能还会提供更多的语法糖来简化开发。
8. 生成字节码, 回写到class文件。
三、用注解参与Java编译过程
主要需要写两部分内容。 Processor和Scanner.
代码如下:
public class MyCheckerScanner extends ElementScanner6 {
private final Messager messager;
public MyCheckerScanner(Messager messager) {
this.messager = messager;
}
@Override
public Void visitVariable(VariableElement e, Void p) {
String name = e.getSimpleName().toString();
System.out.println(name);
int firstCode = name.codePointAt(0);
if(Character.isUpperCase(firstCode)){
System.out.println("asdfasdfasf");
messager.printMessage(Kind.WARNING, "方法名第一个字母必须小写", e);
}
return null;
}
}
Processor的代码:
@SupportedAnnotationTypes("*")
@SupportedSourceVersion(SourceVersion.RELEASE_6)
public class MyProcessor extends AbstractProcessor {
private MyCheckerScanner scanner = null;
@Override
public synchronized void init(ProcessingEnvironment processingEnv) {
super.init(processingEnv);
scanner = new MyCheckerScanner(processingEnv.getMessager());
}
@Override
public boolean process(Set extends TypeElement> annotations,
RoundEnvironment roundEnv) {
if(!roundEnv.processingOver()){
for (Element element : roundEnv.getRootElements()) {
scanner.scan(element);
}
}
return false;
}
}
public static void main(String[] args) {
Main compiler = new Main("javac");
args = new String[]{"-processor","com.prince.jvmtest.MyProcessor", "-classpath", ".\\lib\\commons-lang-2.5.jar", "-d", "\\", ".\\src\\com\\prince\\jvmtest\\Test.java"};
compiler.compile(args);
}
编译的时候增加了-processor的参数来指定处理器,然后就能够查看到编译的结果了,如下:
.\src\com\prince\jvmtest\Test.java:7: 警告:方法名第一个字母必须小写
public static void main(String[] Args) {
总的来说Java编译器并不会对代码性能方面有多少提升,更多的是提高了Java本身的易用性和对程序员的编码习惯起到规范的作用。
例子代码下载地址: http://download.csdn.net/detail/three_man/7990081