1.1 程序与进程的概念
(1)程序:一组有序的静态指令,是一种静态概念;
(2)进程:是一种活动,它是由一个动作序列组成,每个动作是在某个数据集上执行一段程序,整个活动的结果是提供一种系统或用户功能。
1.2 进程与程序的区别
(1)进程是程序的一次运行活动,属于一种动态的概念。进程是执行程序的动态过程,而程序是进程运行的静态文本。
(2)一个进程可以执行一个或多个程序。当然,同一程序也可能由多个进程同时执行。
(3)程序可以作为一种软件资源长期保存着,而进程则是一次执行过程。
1.3 进程的结构
在 UNIX 或者 Linux 中, 进程是通过 FORK 系统调用被创建的。 在调用了 FORK 之后,父进程可以和子进程并行。父进程还可以创建多个子进程,也就是说,在同一时刻,一个父进程可以有多个正在运行的子进程。子进程也可以执行 FORK 调用。这样就可以在系统中生成一个进程树。
进程通常由三部分组成。一部分是程序,一部分数据集合,另一部分被称为进程控制块(ProcessControlBlock,简记PCB)。
进程的程序部分描述了进程所要完成的功能。数据集合部分则有两方面的内容,即程序运行时所需要的数据部分和工作区。如果一个程序能为多个进程同时共享执行,它是进程执行时不可修改的部分。而数据集合部分则通常为一个进程独占,为进程的可修改部分。程序和数据集合是进程存在的物质基础,是进程的实体。
进程控制块有时也称为进程描述块,它包含了进程的描述信息和控制信息,是进程动态特性的集中反映。
总之, 每个进程基本上有自己独立的代码和数据空间, 独立的程序计数器等上下文环境,进程切换的开销是比较大的。
进程具备并发性的特点,这种并发性是不同的进程之间反映出来的,不同的进程有不同进程空间,进程之间的切换消耗比较大。那么就考虑到引入线程的概念,在进程的内部引入并发性,一个进程可以创建多个线程,线程之间具备并发性。不同的线程之间可以共享进程的地址空间和数据。
一般的讲, 线程是一个程序, 或者进程内部的一个顺序控制流。 线程本身不能独立运行,必须在进程中执行,使用进程的地址空间。每个线程有自己单独的程序计数器。
2.1 多线程的优势(相比多进程)
创建进程的高消耗(每个进程都有独立的数据和代码空间),进程之间通信的不方便(消息机制),进程切换的时间太长。
然而线程的切换也是需要时间的。对于单CPU,采用多线程不会提高程序的执行速度,反而会降低速度,但是对于用户来说,可以减少用户的响应时间。而对于多CPU或者 CPU 采用超线程技术的话,采用多线程技术还是会提高程序的执行速度的。
进程内的同一类线程可以共享代码和数据空间,每个线程有独立的运行栈和程序计数器,切换的开销比较小,灵活性高。在支持超线程和多核的 CPU 上,多线程能够并发或者并行执行,可以在同一时间段内完成不同的任务,或者加快程序的执行。同一进程内的多个线程,调度比较灵活,可以相互协调和协作共同完成特定任务。
2.2 Java创建多线程
Java 定义了一个线程的概念模型,把一个线程分为三部分:虚拟 CPU(java.lang.Thread类),虚拟 CPU执行的代码和数据。创建一个Thread对象就意味着创建了一个线程。
创建线程的方法就总结了,可以参考Polaris的《第一篇 多线程的使用——Thread类和Runnable接口》。
根据Java线程的概念模型,继承Thread方式会将虚拟CPU和代码混合在一起,而Runnable方式将它们分开。
2.3 线程池
线程有时称为轻量级进程。与进程一样,它们拥有通过程序运行的独立的并发路径,并且每个线程都有自己的程序计数器,称为堆栈和本地变量。然而,线程存在于进程中,它们与同一进程内的其他线程共享内存、文件句柄以及每进程状态。
创建线程会使用相当一部分内存,其中包括有堆栈,以及每线程数据结构。如果创建过多线程,其中每个线程都将占用一些 CPU 时间,结果将使用许多内存来支持大量线程,每个线程都运行得很慢。这样就无法很好地使用计算资源。
可喜的是,Java自从 5.0以来,提供了线程池。线程的目标执行对象可以共享线程池中有限数目的线程对象。
一切的服务器都需要线程池,比如Web、FTP等服务器。
2.3.1 使用线程池
使用JDK提供的线程池一般分为3步:1)创建线程目标对象,可以多个;2)使用 Executors 创建线程池, 返回一个ExecutorService类型的对象;3)使用线程池执行线程目标对象,exec.execute(run),最后,结束线程池中的线程,exec.shutdown()。
以上大部分知识点在后面的章节会详细介绍。
注:写完这些后,阅读英文原版,发现第一章不是这些内容,这一章似乎是中文翻译者加上去的,又或者是网络上谁流传的。不过竟然笔记写好了,也就留下来,毕竟讲得也不错。