Java类加载机制源码分析

Java代码首先要编译成class文件字节码,在运行时通过JIT(即时编译器)编译成本地机器码,最后由ClassLoader将其加载解析成Class对象到内存中。通过ClassLoader的loadClass方法的源码加深对Java类加载机制的理解。


1. ClassLoader加载机制简述

Java的类加载遵循父类优先的原则,也就是说ClassLoader是一个有层级的树形组合体系,并且一个ClassLoader要加载一个类,首先逐层向上检查是否有加载器加载过该类,如果有,将结果逐层返回到下级。如果没有,继续检查直到有一层ClassLoader返回没有加载并且它不应该加载,那么该层的下一层就可以加载该类。


PS:父类优先的方式也不是万能的,在JavaEE Web应用程序中,也会使用子女优先加载的方式;


1.1 JVM提供3层基本的类加载平台

BootstrapClassLoader:加载JVM自身需要的类,注意在Hotspot JVM中它严格来说不是JVM类加载体系中的,它并不遵循上述机制,也不是下面ExtClassLoader的父类加载器;

ExtClassLoader:加载特定的类:System.getProperty("java.ext.dirs");也就是JRE/LIB/EXT目录下的类,加载的是sun公司的一些扩展包,它是AppClassLoader的父类加载器;

AppClassLoader:加载System.getProperty("java.class.path");就是classpath,看到这个你可能已经知道eclipse项目下.classpath的作用了,就是告诉AppClassLoader这些类由它加载;

继承自URLClassLoader的自定义类加载器,通过调用getSystemClassLoader获取自己的父加载器(AppClassLoader);


ClassLoader的类层次结构:

Java类加载机制源码分析_第1张图片


图中的AppClassLoader和ExtClassLoader是Launcher的内部类;

到现在,我们可以也可以看出Java的ClassLoader使用了职责链设计模式,父优先加载,一定程度上保证了程序安全(防止恶意代码替换JSE核心类)。


1.2 JVM加载Class文件到内存的方式:

一是隐式加载:继承或引用某个类时,有JVM负责加载;

二是显式加载:在代码中调用loadClass(),Class.forName,ClassLoader的findClass方法等,显式加载中也可能包含隐式加载;


2. ClassLoader的重要方法:

findClass:主要由URLClassLoader实现,根据URLClassPath去指定地方查找class文件;取得要加载class文件的字节流;

defineCLass:可以将字节流解析成Class对象,该Class对象并未进行resolve;

resolveClass:对Class对象进行Link,载入引用类(超类,接口字段,方法签名,方法中的本地变量);

loadClass:采用默认的加载逻辑根据类名加载一个类,返回Class对象,调用前面3个方法实现;


3. 加载class文件的过程:

3.1 加载字节码到内存:findClass和defineClass方法

首先来看看URLClassLoader中的findClass方法,因为加载的第一步,找到并获取指定class文件的字节流;
protected Class<?> findClass(final String name)
            throws ClassNotFoundException
    {
        final Class<?> result;
        try {
            //获取特权,确保有权限可以读取到资源,这里
            result = AccessController.doPrivileged(
                    new PrivilegedExceptionAction<Class<?>>() {
                        public Class<?> run() throws ClassNotFoundException {
                            //将完整的类名转换成文件路径格式
                            String path = name.replace('.', '/').concat(".class");
                            //在指定的URLPath中获取对应的class文件资源
                            Resource res = ucp.getResource(path, false);
                            if (res != null) {
                                try {
                                    //获取成功将资源传入,最终获取未解析的Class对象
                                    return defineClass(name, res);
                                } catch (IOException e) {
                                    //不能成功读取文件内容
                                    throw new ClassNotFoundException(name, e);
                                }
                            } else {
                                //不能获取资源
                                return null;
                            }
                        }
                    }, acc);
        } catch (java.security.PrivilegedActionException pae) {
            //因为要在特权操作中抛出ClassNotFoundException,使用了PrivilegedExceptionAction回调
            //它会将异常包装,这里要解除包装
            throw (ClassNotFoundException) pae.getException();
        }
        if (result == null) {
            throw new ClassNotFoundException(name);
        }
        return result;
    }

findClass方法的作用就是找到并借助defineClass方法返回Class对象(未解析),它获取特权权限去读取资源(Java安全模型对不同的代码是区分Domain的,不同的域(比如不同的项目的代码)可能对其他域的代码限制了访问自身资源的权限,具体可以参看 http://www.ibm.com/developerworks/cn/java/j-lo-javasecurity/),并保证了在不同情况下可以正确的抛出ClassNotFoundException;

接下来看看findClass中使用的defineClass方法:
private Class<?> defineClass(String name, Resource res) throws IOException {
        long t0 = System.nanoTime();
        int i = name.lastIndexOf('.');
        URL url = res.getCodeSourceURL();
        //首先加载包
        if (i != -1) {
            String pkgname = name.substring(0, i);
            // Check if package already loaded.
            Manifest man = res.getManifest();
            definePackageInternal(pkgname, man, url);
        }
        // Now read the class bytes and define the class
        //使用nio,获取字节缓冲区
        java.nio.ByteBuffer bb = res.getByteBuffer();
        if (bb != null) {
            // Use (direct) ByteBuffer:
            CodeSigner[] signers = res.getCodeSigners();
            CodeSource cs = new CodeSource(url, signers);
            sun.misc.PerfCounter.getReadClassBytesTime().addElapsedTimeFrom(t0);
            return defineClass(name, bb, cs);
        } else {
            //获取不到缓冲区,直接InputStream获取字节数组
            byte[] b = res.getBytes();
            // must read certificates AFTER reading bytes.
            CodeSigner[] signers = res.getCodeSigners();
            CodeSource cs = new CodeSource(url, signers);
            sun.misc.PerfCounter.getReadClassBytesTime().addElapsedTimeFrom(t0);
            return defineClass(name, b, 0, b.length, cs);
        }
    }

在这个方法中,我们可以看到对于class文件的读取策略,其中CodeSigner和CodeSource分别是代码签名和代码源,它们组合使用与前面提及的保护域机制( ProtectionDomain)当中,可见Java中类加载机制和安全模型是密不可分的。

3.2 验证和解析:defineClass方法和resovleClass方法:

defineClass首先进行:
(1)字节码验证;
(2)类准备:准备类中每个字段、方法和实现接口所需的数据结构
protected final Class<?> defineClass(String name, byte[] b, int off, int len,
                                         ProtectionDomain protectionDomain)
            throws ClassFormatError
    {
        //首先检查类名;阻止加载“java.”开头包内的类(应有BootStrapLoader加载);
        //确保同一个包内的Class拥有相同的证书
        protectionDomain = preDefineClass(name, protectionDomain);
        //根据CodeSource获取一个URL的字符串表示
        String source = defineClassSourceLocation(protectionDomain);
        //字节码验证;类准备(准备字段,方法,实现接口所必需的数据结构);
        Class<?> c = defineClass1(name, b, off, len, protectionDomain, source);
        //通过证书为该类设置签名
        postDefineClass(c, protectionDomain);
        return c;
    }

(3)解析:resolveClass方法,直接通过一个native方法实现
进行LINK,装入引用类,如超类,接口,字段,方法中使用的本地变量。

3.3 显式加载时的过程:

调用this.getClass().getClassLoader().loadClass("className");时的过程:

首先看看URLClassLoader中的loadClass方法:

protected Class<?> loadClass(String name, boolean resolve)
            throws ClassNotFoundException
    {
        //该getClassLoadingLock获取同步锁,该锁用并发Map保存(享元模式)
        synchronized (getClassLoadingLock(name)) {
            // First, check if the class has already been loaded
            Class<?> c = findLoadedClass(name);
            if (c == null) {
                long t0 = System.nanoTime();
                try {
                    // 这里体现了类加载机制中的父优先的查找机制
                    // 通过上滤直到parent为null
                    // 这时再去BootstrapClassLoader中查找,在运行用户程序时,这一步一般都是null
                    if (parent != null) {
                        c = parent.loadClass(name, false);
                    } else {
                        c = findBootstrapClassOrNull(name);
                    }
                } catch (ClassNotFoundException e) {
                    // ClassNotFoundException thrown if class not found
                    // from the non-null parent class loader
                }

                if (c == null) {
                    // If still not found, then invoke findClass in order
                    // to find the class.
                    long t1 = System.nanoTime();
                    //载入字节码到内存
                    c = findClass(name);

                    // this is the defining class loader; record the stats
                    sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
                    sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
                    sun.misc.PerfCounter.getFindClasses().increment();
                }
            }
            //解析连接类
            if (resolve) {
                resolveClass(c);
            }
            return c;
        }
    }

反映了JVM类加载机制的过程为:加载一个新类,逐层上滤检查父加载器,直到顶层(parent==null),再去BootStrapClassLoader中查找,如果返回null,就要调用findClass,resolveCass(需要的话);

3.4 初始化Class对象:

类的静态字段,静态初始化器会按顺序赋值/执行;

上面的过程概括一下:(1)加载class文件字节码到内存——>(2)将字节码转换成未Link的Class对象(安全验证/字节码验证/类准备)——>(3)resolveClass方法Link
——>(4)类初始化;

4. 小结

本篇总结了一下Java类加载机制的机制和过程,并从源码角度加以分析。在分析源码的过程也看到了Java中的安全模型的应用,以及并发控制(findClass中的lock并发Map)







你可能感兴趣的:(java,ClassLoader)