JVM源码分析(二)jvm中的线程

1. JVM中线程的创建流程

jvm剥离了一套公共的无关平台的线程类:Thread抽象类。Thread类声明在jdk8u-dev/hotspot/src/share/vm/runtime/thread.hpp中。Thread有个抽象方法run()。当创建好一个Thread实例,需要调用操作系统底层的os::create_thread方法,传入thread对象和新线程栈大小(64位系统默认是1m,32位的是512k;CompilerThread比较特殊,分配了4m)。

在调用系统的底层函数创建好线程之后,将以java_start函数为线程入口,Thread对象为参数启动线程。在线程中,会调用该对象的run方法,实现线程功能的定制。直接借用thread.hpp中的代码注释显示继承关系。

// Class hierarchy
// - Thread
//   - NamedThread
//     - VMThread
//     - ConcurrentGCThread
//     - WorkerThread
//       - GangWorker
//       - GCTaskThread
//   - JavaThread
//   - WatcherThread

使用伪代码大概是这样。

父线程:
step1:   Thread *thread = new VMThread();//for example

step2 :  os::create_thread(Thread:thread ,stacksize:0);

子线程:
thread->run();

我们知道,线程是cpu调度的最小单位。可以从线程的角度,大致分析下jvm的工作内容。所以我们先初步分析下各种线程的作用。

2. JVM中的Thread子类

2.1 VMThread

VMThread可以说是最核心的线程了,一个进程中只会创建一个,继承关系:VMThread->NamedThread->Thread->ThreadShadow,其中ThreadShadow是一个异常相关的类。VMThread内部维护了一个任务队列,jvm通过调用VMThread的execute方法来塞入VM_Operation类型的任务。在vm线程获取到任务后,调用VM_Operation对象的doit()方法。下面我们看看有哪些VM_Operation。先上我们最关心的GC任务。

  • VM_CMS_Operation

  • VM_CGC_Operation

  • VM_GC_Operation

重要的子类:VM_ParallelGCSystemGC,调用java代码System.gc() 或者JVMTI中会用到;VM_G1CollectFull,VM_GenCollectFull,VM_GC_HeapInspection。

  • VM_CGC_Operation

  • VM_CGC_Operation

  • VM_CGC_Operation

  • VM_CGC_Operation

  • VM_CGC_Operation

  • VM_CGC_Operation

2.2 JavaThread

用户可以通过参数-XX:ThreadStackSize=2m 或者 -Xss2m 或者 -XX:ThreadStackSize=2048 (注意千字节时不加k,我调试的时候加k直接变成2g了)将JavaThread类型的线程的栈大小调整为2m(注意仅仅是JavaThread类型,包括用户自定的和jvm内部生成的)。但是有最小值,低于这个最小值则取系统最小值,我的机器上是160k。

2.2.1 java程序中创建的线程

我们知道,java.lang.Thread 的start方法最终是调用了start0本地方法。查看jvm的实际映射函数为jvm.cpp中的JVM_StartThread。实现也比较清晰,将java线程对象包装成一个entry,生成一个JavaThread按照第一节的流程创建对象,最后在新线程中通过JavaCalls::call_virtual方法调用Java代码中对应的线程对象run方法,在退出时将线程状态改变成terminal。之前我还很疑惑在jdk代码中没有改变threadStatus的地方,但是实际却可以通过这个值来判断线程的状态。原来是jvm代码中操纵的,具体的函数是java_lang_Thread::set_thread_status

2.2.2 jvm自建的JavaThread

2.2.2.1 CompilerThread

CompilerThread 按照功能细微不同分为C1 CompilerThread(client模式下的编译器) 和C2 CompilerThread(server模式下的编译器)。默认数量根据cpu计算,我们可以用vm参数-XX:CICompilerCount=n来设置总的编译线程数量,其中 C1类型的占1/3。
CompilerThread中的队列实际上是CompileBroker管理的,我们可以通过调用CompileBroker::compile_method方法塞入一个方法级的编译任务。

2.3 GCTaskThread

顾名思义,GCTaskThread是用来执行gc任务的。粘贴其run方法

void GCTaskThread::run() {
  // Set up the thread for stack overflow support
  this->record_stack_base_and_size();
  this->initialize_thread_local_storage();
  // Bind yourself to your processor.
  if (processor_id() != GCTaskManager::sentinel_worker()) {
    if (TraceGCTaskThread) {
      tty->print_cr("GCTaskThread::run: "
                    "  binding to processor %u", processor_id());
    }
    if (!os::bind_to_processor(processor_id())) {
      DEBUG_ONLY(
        warning("Couldn't bind GCTaskThread %u to processor %u",
                      which(), processor_id());
      )
    }
  }
  // Part of thread setup.
  // ??? Are these set up once here to make subsequent ones fast?
  HandleMark   hm_outer;
  ResourceMark rm_outer;

  TimeStamp timer;

  for (;/* ever */;) {
    // These are so we can flush the resources allocated in the inner loop.
    HandleMark   hm_inner;
    ResourceMark rm_inner;
    for (; /* break */; ) {
      // This will block until there is a task to be gotten.
      GCTask* task = manager()->get_task(which());
      // Record if this is an idle task for later use.
      bool is_idle_task = task->is_idle_task();
      // In case the update is costly
      if (PrintGCTaskTimeStamps) {
        timer.update();
      }

      jlong entry_time = timer.ticks();
      char* name = task->name();

      // If this is the barrier task, it can be destroyed
      // by the GC task manager once the do_it() executes.
      task->do_it(manager(), which());

      // Use the saved value of is_idle_task because references
      // using "task" are not reliable for the barrier task.
      if (!is_idle_task) {
        manager()->note_completion(which());

        if (PrintGCTaskTimeStamps) {
          assert(_time_stamps != NULL,
            "Sanity (PrintGCTaskTimeStamps set late?)");

          timer.update();

          GCTaskTimeStamp* time_stamp = time_stamp_at(_time_stamp_index++);

          time_stamp->set_name(name);
          time_stamp->set_entry_time(entry_time);
          time_stamp->set_exit_time(timer.ticks());
        }
      } else {
        // idle tasks complete outside the normal accounting
        // so that a task can complete without waiting for idle tasks.
        // They have to be terminated separately.
        IdleGCTask::destroy((IdleGCTask*)task);
        set_is_working(true);
      }

      // Check if we should release our inner resources.
      if (manager()->should_release_resources(which())) {
        manager()->note_release(which());
        break;
      }
    }
  }
}

这里引入一个GCTaskManager类,用于管理gc线程的。gc线程从GCTaskManager的任务队列SynchronizedGCTaskQueue中取一个GCTask任务,然后调用GCTask对象的do_it方法执行具体逻辑。

  • GCTaskManager维护了一个GCTask任务队列,如何塞入队列?

GCTaskManager提供了两个方法入列,add_task:添加单个,实际未使用;add_list:添加多个,类外是通过execute_and_wait方法间接调用来插入。

  • GCTask任务有哪些?

  • NoopGCTask

啥也没做

  • BarrierGCTask

等待其他gc工作线程空闲下来才返回do_it方法, 一个常见子类是WaitForBarrierGCTask,内部维护了monitor,实现了事后通知的功能。

  • IdleGCTask

只能用于动态的gc线程,作用应该是辅助,如果是获取到的是"傻子"任务,那么可以略过。

  • MarkFromRootsTask
  • RefProcTaskProxy

  • RefEnqueueTaskProxy

  • StealMarkingTask

  • StealRegionCompactionTask

  • UpdateDensePrefixTask

  • DrainStacksCompactionTask

  • PSRefProcTaskProxy

  • PSRefEnqueueTaskProxy

  • ScavengeRootsTask

  • ThreadRootsTask

  • StealTask

  • OldToYoungRootsTask

你可能感兴趣的:(JVM源码分析(二)jvm中的线程)