●程序由指令和数据组成,但这些指令要运行,数据要读写,就必须将指令加载至 CPU,数据加载至内存。在指令运行过程中还需要用到磁盘、网络等设备。进程就是用来加载指令、管理内存、管理 IO 的。
●当一个程序被运行,从磁盘加载这个程序的代码至内存,这时就开启了一个进程。
●进程就可以视为程序的一个实例。大部分程序可以同时运行多个实例进程(例如记事本、画图、浏览器 等),也有的程序只能启动一个实例进程(例如网易云音乐、360 安全卫士等)。
●操作系统会以进程为单位,分配系统资源(CPU时间片、内存等资源),进程是资源分配的最小单位。
●线程是进程中的实体,一个进程可以拥有多个线程,一个线程必须有一个父进程。
●一个线程就是一个指令流,将指令流中的一条条指令以一定的顺序交给 CPU 执行 。
●线程,有时被称为轻量级进程(Lightweight Process,LWP),是操作系统调度(CPU调度)执行的最小单位。
1资源占用
a进程拥有共享的资源,如内存空间等,供其内部的线程共享
2依赖关系
a进程基本上相互独立的,而线程存在于进程内,是进程的一个子集
3通信方式
a进程间通信较为复杂
ⅰ同一台计算机的进程通信称为 IPC(Inter-process communication)
ⅱ不同计算机之间的进程通信,需要通过网络,并遵守共同的协议,例如 HTTP
b线程通信相对简单,因为它们共享进程内的内存,一个例子是多个线程可以访问同一个共享变量
4上下文切换
a线程更轻量,线程上下文切换成本一般上要比进程上下文切换低
b当两个线程不是属于同一个进程,则切换的过程就跟进程上下文切换一样;
c当两个线程是属于同一个进程,因为虚拟内存是共享的,所以在切换时,虚拟内存这些资源就保持不动,只需要切换线程的私有数据、寄存器等不共享的数据
详见操作系统-进程间通信。
1管道(pipe)及有名管道(named pipe):管道可用于具有亲缘关系的父子进程间的通信,有名管道除了具有管道所具有的功能外,它还允许无亲缘关系进程间的通信。
2信号(signal):信号是在软件层次上对中断机制的一种模拟,它是比较复杂的通信方式,用于通知进程有某事件发生,一个进程收到一个信号与处理器收到一个中断请求效果上可以说是一致的。
3消息队列(message queue):消息队列是消息的链接表,它克服了上两种通信方式中信号量有限的缺点,具有写权限得进程可以按照一定得规则向消息队列中添加新信息;对消息队列有读权限得进程则可以从消息队列中读取信息。
4共享内存(shared memory):可以说这是最有用的进程间通信方式。它使得多个进程可以访问同一块内存空间,不同进程可以及时看到对方进程中对共享内存中数据得更新。这种方式需要依靠某种同步操作,如互斥锁和信号量等。
5信号量(semaphore):主要作为进程之间及同一种进程的不同线程之间得同步和互斥手段。
6套接字(socket):这是一种更为一般得进程间通信机制,它可用于网络中不同机器之间的进程间通信,应用非常广泛。
互斥
是指对于共享的进程系统资源,在各单个线程访问时的排它性。当有若干个线程都要使用某一共享资源时,任何时刻最多只允许一个线程去使用,其它要使用该资源的线程必须等待,直到占用资源者释放该资源。
同步
是指线程之间所具有的一种制约关系,比如:
●一个线程的执行依赖另一个线程的消息,当它没有得到另一个线程的消息时应等待,直到消息到达时才被唤醒
广义上来看,互斥也是同步的一种。
线程同步与互斥的控制方法
●临界区 通过对多线程的串行化来访问公共资源或一段代码,速度快,适合控制数据访问。 临界资源是一次仅允许一个进程使用的共享资源。 每个进程中访问临界资源的那段代码称为临界区(criticalsection)
●互斥量 为协调共同对一个共享资源的单独访问而设计的
●信号量 为控制一个具有有限数量用户资源而设计
●事件 用来通知线程有一些事件已发生,从而启动后继任务的开始。
上下文切换是指CPU(中央处理单元)从一个进程或线程到另一个进程或线程的切换。
上下文是CPU寄存器和程序计数器在任何时间点的内容。
寄存器是CPU内部的一小部分非常快的内存(相对于CPU外部较慢的RAM主内存),它通过提供对常用值的快速访问来加快计算机程序的执行。
程序计数器是一种专门的寄存器,它指示CPU在其指令序列中的位置,并保存着正在执行的指令的地址或下一条要执行的指令的地址,这取决于具体的系统。
进程上下文切换详见操作系统-进程上下文切换。
切换过程可以简单描述为,内核(即操作系统的核心)对CPU上的进程(包括线程)执行以下活动:
1暂停一个进程的处理,并将该进程的CPU状态(即上下文)存储在内存中的某个地方
2从内存中获取下一个进程的上下文,并在CPU的寄存器中恢复它
3返回到程序计数器指示的位置(即返回到进程被中断的代码行)以恢复进程。
●只能在内核模式下发生 详见内核模式VS用户模式 & 操作系统-linux内存管理
●是多任务操作系统的一个特性 多任务操作系统有并发和并行两种情况。 上下文切换发生的原因是
○进程自愿放弃它们在CPU中的时间
○或者是调度器在进程耗尽其CPU时间片时进行切换的结果。
●通常发生在计算密集型任务 IO密集型任务很少需要CPU上下文切换,交给外部设备去处理就好了,处理完毕后,发送中断请求给CPU即可,不需要一直占用CPU时间片。 就CPU时间而言,上下文切换对系统来说是一个巨大的成本,实际上,它可能是操作系统上成本最高的操作。因此,操作系统设计中的一个主要焦点是尽可能地避免不必要的上下文切换。与其他操作系统(包括一些其他类unix系统)相比,Linux的众多优势之一是它的上下文切换和模式切换成本极低。
linux系统可以通过命令统计CPU上下文切换数据
1查看整个操作系统每秒CPU上下文切换的统计
vmstat 1
其中cs列就是CPU上下文切换的统计。当然,CPU上下文切换不等价于线程切换,很多操作会造成CPU上下文切换:
○线程、进程切换
○系统调用
○中断
2查看某个进程/线程上下文切换
a使用pidstat命令
常用的参数:
-u 默认参数,显示各个进程的 CPU 统计信息
-r 显示各个进程的内存使用情况
-d 显示各个进程的 IO 使用
-w 显示各个进程的上下文切换
-p PID 指定 PID
# 显示进程5598每一秒的切换情况
pidstat -w -p 5598 1
其中cswch表示主动切换,nvcswch表示被动切换。从统计数据中看到,该进程每秒主动切换次数达到将近500次,因此代码中存在大量的 睡眠\唤醒 操作。
b从进程的状态信息中查看
cat /proc/5598/status
操作系统层面的线程生命周期基本上可以用下图这个“五态模型”来描述。
●初始状态 线程已被创建,还不允许CPU执行。 这里的被创建指的是在编程语言层面被创建,真正的线程,操作系统还没有创建。
●就绪状态 线程可以分配CPU时间片执行。 操作系统创建了线程。
●运行状态 被分配到CPU时间片的线程。
●休眠状态 释放CPU使用权。 运行状态的线程调用阻塞API,比如以阻塞方式读取文件,或者等待某个事件,例如条件变量,线程状态就会变成该状态。当等待时间出现,线程会从休眠状态切换到就绪状态。
●终止状态 线程执行完毕,或出现异常进入终止状态。 线程生命周期结束。
这五种状态在不同编程语言里会有简化合并。例如:
●C 语言的 POSIX Threads 规范,就把初始状态和可运行状态合并了
●Java 语言里则把可运行状态和运行状态合并了,这两个状态在操作系统调度层面有用,而 JVM 层面不关心这两个状态,因为 JVM 把线程调度交给操作系统处理了。
windows
●任务管理器 查看进程和线程数,也可以杀死进程
●tasklist 查看进程
●taskkill 杀死线程
linux
●ps -ef 查看所有进程
●top 按大写H切换是否显式线程
●ps -fT -p
●top -H -p
●kill 杀死进程
系统线程实现方式
●LinuxThreads linux/glibc包在2.3.2之前只实现了LinuxThreads
●NPTL(Native POSIX Thread Library)
可以通过以下命令查看系统是使用哪种线程实现 getconf GNU_LIBPTHREAD_VERSION
Java
●jps 查看所有java进程
●jstack
●jconsole 图形化界面查看
使用Thread或继承Thread类
public void test() {
Thread newThread = new Thread() {
@Override
public void run() {
System.out.println("new Thread");
}
};
MyThread myThread = new MyThread();
newThread.start();
myThread.start();
}
class MyThread extends Thread {
@Override
public void run() {
System.out.println("extend Thread");
}
}
实现Runnable接口
public void test2() {
Runnable runnable = new Runnable() {
@Override
public void run() {
System.out.println("implement runnable");
}
};
Thread thread = new Thread(runnable);
thread.start();
}
使用有返回值的Callable接口
方式一
public void test3() {
ExecutorService executorService = Executors.newFixedThreadPool(10);
Future submit = executorService.submit(new MyCallableTask());
try {
System.out.println(submit.get());
} catch (InterruptedException e) {
e.printStackTrace();
} catch (ExecutionException e) {
e.printStackTrace();
}
executorService.shutdown();
}
class MyCallableTask implements Callable {
@Override
public Integer call() throws Exception {
return new Random().nextInt();
}
}
方式二
public void test4() {
FutureTask task = new FutureTask<>(new Callable() {
@Override
public String call() throws Exception {
return "callable";
}
});
new Thread(task).start();
try {
String s = task.get();
System.out.println(s);
} catch (InterruptedException e) {
e.printStackTrace();
} catch (ExecutionException e) {
e.printStackTrace();
}
}
使用lambda
new Thread(() -> System.out.println(Thread.currentThread().getName())).start();
总结
本质上Java中实现线程只有一种方式,都是通过new Thread()创建线程,调用Thread#start启动线程最终都会调用Thread#run方法。
为什么这么说?
前两种没什么好说的,都是直接调用Thread#start方法。关键在于第三种线程池的调用方式:
当调用方法java.util.concurrent.Executors#newFixedThreadPool时,会创建一个ThreadPoolExecutor类
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue());
}
ThreadPoolExecutor类的构造方法会使用Executors.defaultThreadFactory()方法创建DefaultThreadFactory,它包含一个newThread方法,线程中最终都会调用该方法完成线程的初始化与调用
public Thread newThread(Runnable r) {
Thread t = new Thread(group, r,
namePrefix + threadNumber.getAndIncrement(),
0);
if (t.isDaemon())
t.setDaemon(false);
if (t.getPriority() != Thread.NORM_PRIORITY)
t.setPriority(Thread.NORM_PRIORITY);
return t;
}
可以看到它去new Thread,最终也会调用Thread#start方法启动线程。
Java线程执行为什么要调用start方法而不是run方法?
start方法是本地方法,对应了Java线程->JVM线程->OS线程的创建过程;run方法只是Thread对象的一个方法,运行它不会导致OS线程的创建。
下面是Java线程调用Thread#start方法,从Java代码层面到操作系统层面所经历的整个过程:
协程
协程,英文Coroutines, 是一种基于线程之上,但又比线程更加轻量级的存在,协程不是被操作系统内核所管理,而完全是由程序所控制(也就是在用户态执行),具有对内核来说不可见的特性。
这样带来的好处就是性能得到了很大的提升,不会像线程切换那样消耗资源。
Java
def A():
print '1'
print '2'
print '3'
def B():
print 'x'
print 'y'
print 'z'
假设由协程执行,在执行A的过程中,可以随时中断,去执行B,B也可能在执行过程中中断再去执行A,结果可能是:1 2 x y 3 z。
协程的特点在于是一个线程执行。
协程优势
●线程的切换由操作系统调度,协程由用户自己进行调度,因此减少了上下文切换,提高了效率。
●线程的默认stack大小是1M,而协程更轻量,接近1k。因此可以在相同的内存中开启更多的协程。
●不需要多线程的锁机制:因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比多线程高很多。
协程适用于被阻塞的,且需要大量并发的场景(网络io)。不适合大量计算的场景。
Java中的协程框架
kilim quasar
线程调度是指系统为线程分配处理器使用权的过程,主要调度方式分两种,分别是协同式线程调度和抢占式线程调度
线程执行时间由线程决定。线程把自己的任务执行完毕后,要主动通知系统切换到另外一个线程上。
好处:
1实现简单,上下文切换对线程来说是可见的
2没有线程同步问题
坏处:
1执行时间不可控。如果某个线程发生阻塞,CPU可能一直阻塞。
抢占式线程调度
由操作系统为每个线程分配执行时间片,线程切换有OS决定。 好处:
1线程执行时间可控,不会因为一个线程阻塞导致整个CPU阻塞。
Java线程的抢占式线程调度体现
希望系统能给某些线程多分配一些时间,给一些线程少分配一些时间,可以通过设置线程优先级来完成。Java语言一共10个级别的线程优先级(Thread.MIN_PRIORITY至Thread.MAX_PRIORITY),在两线程同时处于ready状态时,优先级越高的线程越容易被系统选择执行。但优先级并不是很靠谱,因为Java线程是通过映射到系统的原生线程上来实现的,所以线程调度最终还是取决于操作系统。
Java 语言中线程共有六种状态,分别是:
1NEW(初始化状态)
2RUNNABLE(可运行状态+运行状态)
3BLOCKED(阻塞状态)
4WAITING(无时限等待)
5TIMED_WAITING(有时限等待)
6TERMINATED(终止状态)
在操作系统层面,Java 线程中的 BLOCKED、WAITING、TIMED_WAITING 是一种状态,即前面我们提到的休眠状态。也就是说只要 Java 线程处于这三种状态之一,那么这个线程就永远没有 CPU 的使用权。
*/
等待调用join方法的线程结束之后,程序再继续执行,一般用于等待异步线程执行完结果之后才能继续运行的场景。
public class ThreadJoinDemo {
public static void main(String[] sure) throws InterruptedException {
Thread t = new Thread(new Runnable() {
@Override
public void run() {
System.out.println("t begin");
try {
Thread.sleep(5000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("t finished");
}
});
long start = System.currentTimeMillis();
t.start();
//主线程等待线程t执行完成
t.join();
System.out.println("执行时间:" + (System.currentTimeMillis() - start));
System.out.println("Main finished");
}
}
stop()方法已经被jdk废弃,原因就是stop()方法太过于暴力,强行把执行到一半的线程终止。
这种方式会释放对象锁,导致线程执行到一半被强制结束,可能导致数据的不一致性。
public class ThreadStopDemo {
private static Object lock = new Object();
public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(new Runnable() {
@Override
public void run() {
synchronized (lock) {
System.out.println(Thread.currentThread().getName() + "获取锁");
try {
Thread.sleep(60000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
System.out.println(Thread.currentThread().getName() + "执行完成");
}
});
thread.start();
Thread.sleep(2000);
// 停止thread,并释放锁
thread.stop();
new Thread(new Runnable() {
@Override
public void run() {
System.out.println(Thread.currentThread().getName() + "等待获取锁");
synchronized (lock) {
System.out.println(Thread.currentThread().getName() + "获取锁");
}
}
}).start();
}
}
如何优雅的停止线程?
Java提供了中断机制去优雅的停止线程,见下面。
Java没有提供一种安全、直接的方法来停止某个线程,而是提供了中断机制。中断机制是一种协作机制,也就是说通过中断并不能直接终止另一个线程,而需要被中断的线程自己处理。被中断的线程拥有完全的自主权,它既可以选择立即停止,也可以选择一段时间后停止,也可以选择压根不停止。
简单来说,A线程运行过程中,要去中断B线程,会为B线程设置一个标记,B线程代码实现中,可以有针对于标记的检查点,当发现标志位表示中断时,B线程调用自己的代码逻辑去处理中断请求,比如可以停止自己、或者忽视。
使用中断机制时一定要注意是否存在中断标志位被清除的情况,即认真区分下面的两种情况:
测试isInterrupted()
public class ThreadInterruptTest {
static int i = 0;
public static void main(String[] args) {
System.out.println("begin");
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
while (true) {
i++;
System.out.println(i);
//Thread.interrupted() 清除中断标志位
//Thread.currentThread().isInterrupted() 不会清除中断标志位
if (Thread.currentThread().isInterrupted()) {
System.out.println("=========");
}
if (i == 10) {
break;
}
}
}
});
t1.start();
//不会停止线程t1,只会设置一个中断标志位 flag=true
t1.interrupt();
}
}
测试Thread.interrupted()
public class ThreadInterruptTest {
static int i = 0;
public static void main(String[] args) {
System.out.println("begin");
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
while (true) {
i++;
System.out.println(i);
//Thread.interrupted() 清除中断标志位
//Thread.currentThread().isInterrupted() 不会清除中断标志位
if (Thread.interrupted()) {
System.out.println("=========");
}
if (i == 10) {
break;
}
}
}
});
t1.start();
//不会停止线程t1,只会设置一个中断标志位 flag=true
t1.interrupt();
}
}
while (!Thread.currentThread().isInterrupted() && more work to do) {
do more work
}
public class StopThread implements Runnable {
@Override
public void run() {
int count = 0;
while (!Thread.currentThread().isInterrupted() && count < 1000) {
System.out.println("count = " + count++);
}
System.out.println("线程停止: stop thread");
}
public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(new StopThread());
thread.start();
Thread.sleep(5);
thread.interrupt();
}
}
@Override
public void run() {
int count = 0;
while (!Thread.currentThread().isInterrupted() && count < 1000) {
System.out.println("count = " + count++);
try {
Thread.sleep(1);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
System.out.println("线程停止: stop thread");
}
处于休眠中的线程被中断,线程是可以感受到中断信号的,并且会抛出一个 InterruptedException 异常,同时清除中断信号,将中断标记位设置成 false。这样就会导致while条件Thread.currentThread().isInterrupted()为false,程序会在不满足count < 1000这个条件时退出。如果不在catch中重新手动添加中断信号,不做任何处理,就会屏蔽中断请求,有可能导致线程无法正确停止。
try {
Thread.sleep(1);
} catch (InterruptedException e) {
e.printStackTrace();
//重新设置线程中断状态为true
Thread.currentThread().interrupt();
}
总结
sleep可以被中断 抛出中断异常:sleep interrupted, 清除中断标志位
wait可以被中断 抛出中断异常:InterruptedException, 清除中断标志位
volatile有两大特性,一是可见性,二是有序性,禁止指令重排序,其中可见性就是可以让线程之间进行通信。
public class VolatileTest {
private static volatile boolean flag = true;
public static void main(String[] args) {
new Thread(new Runnable() {
@Override
public void run() {
while (true) {
if (flag) {
System.out.println("trun on");
flag = false;
}
}
}
}).start();
new Thread(new Runnable() {
@Override
public void run() {
while (true) {
if (!flag) {
System.out.println("trun off");
flag = true;
}
}
}
}).start();
}
}
等待唤醒机制可以基于wait和notify方法来实现,在一个线程内调用该线程锁对象的wait方法,线程将进入等待队列进行等待直到被唤醒。
public class WaitDemo {
private static Object lock = new Object();
private static boolean flag = true;
public static void main(String[] args) {
new Thread(new Runnable() {
@Override
public void run() {
synchronized (lock) {
while (flag) {
try {
System.out.println("wait start .......");
lock.wait();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
System.out.println("wait end ....... ");
}
}
}).start();
new Thread(new Runnable() {
@Override
public void run() {
if (flag) {
synchronized (lock) {
if (flag) {
lock.notify();
System.out.println("notify .......");
flag = false;
}
}
}
}
}).start();
}
}
LockSupport是JDK中用来实现线程阻塞和唤醒的工具,具有如下特点:
public class LockSupportTest {
public static void main(String[] args) {
Thread parkThread = new Thread(new ParkThread());
parkThread.start();
System.out.println("唤醒parkThread");
LockSupport.unpark(parkThread);
}
static class ParkThread implements Runnable{
@Override
public void run() {
System.out.println("ParkThread开始执行");
LockSupport.park();
System.out.println("ParkThread执行完成");
}
}
}
管道输入/输出流和普通的文件输入/输出流或者网络输入/输出流不同之处在于,它主要用于线程之间的数据传输,而传输的媒介为内存。管道输入/输出流主要包括了如下4种具体实现:
public class Piped {
public static void main(String[] args) throws Exception {
PipedWriter out = new PipedWriter();
PipedReader in = new PipedReader();
// 将输出流和输入流进行连接,否则在使用时会抛出IOException
out.connect(in);
Thread printThread = new Thread(new Print(in), "PrintThread");
printThread.start();
int receive = 0;
try {
while ((receive = System.in.read()) != -1) {
out.write(receive);
}
} finally {
out.close();
}
}
static class Print implements Runnable {
private PipedReader in;
public Print(PipedReader in) {
this.in = in;
}
@Override
public void run() {
int receive = 0;
try {
while ((receive = in.read()) != -1) {
System.out.print((char) receive);
}
} catch (IOException ex) {
}
}
}
}
join可以理解成是线程合并,当在一个线程调用另一个线程的join方法时,当前线程阻塞等待被调用join方法的线程执行完毕才能继续执行,所以join的好处能够保证线程的执行顺序,但是如果调用线程的join方法其实已经失去了并行的意义,虽然存在多个线程,但是本质上还是串行的,最后join的实现其实是基于等待通知机制的。