CPU密集型、IO密集型

CPU密集型 vs IO密集型

CPU密集型也叫计算密集型,此时系统运作大部分的状况是CPU Loading 100%,I/O在很短的时间就可以完成,而CPU还有许多运算要处理,CPU Loading很高。

IO密集型,此时大部分的状况是CPU在等I/O操作完成,此时CPU Loading并不高。

计算密集型任务的特点:
要进行大量的计算,消耗CPU资源,比如计算圆周率、对视频进行高清解码等等,全靠CPU的运算能力。这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以,要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数。

计算密集型任务由于主要消耗CPU资源,因此,代码运行效率至关重要。Python这样的脚本语言运行效率很低,完全不适合计算密集型任务。对于计算密集型任务,最好用C语言编写。

IO密集型特点:
涉及到网络、磁盘IO的任务都是IO密集型任务,这类任务的特点是CPU消耗很少,任务的大部分时间都在等待IO操作完成(因为IO的速度远远低于CPU和内存的速度)。对于IO密集型任务,任务越多,CPU效率越高,但也有一个限度。常见的大部分任务都是IO密集型任务,比如Web应用。

CPU密集型和IO密集型 设置线程数

CPU密集型和IO密集型分别该如何设置多少线程数呢?

其实只要把握住一条原则就可以了,这条原则就是:将硬件的性能发挥到极致。下面我们针对 CPU 密集型和 I/O 密集型计算场景给出理论上的最佳公式,这些公式背后的目标其实就是将硬件的性能发挥到极致。

1、对于 CPU 密集型计算
多线程本质上是提升多核 CPU 的利用率,所以对于一个 4 核的 CPU,每个核一个线程,理论上创建 4 个线程就可以了,再多创建线程也只是增加线程切换的成本。所以,对于 CPU 密集型的计算场景,理论上“线程的数量 =CPU 核数”就是最合适的。不过在工程上,线程的数量一般会设置为CPU 核数 +1

2、对于 I/O 密集型计算场景
最佳的线程数是与程序中 CPU 计算和 I/O 操作的耗时比相关的,我们可以总结出这样一个公式
最佳线程数 =1 +(I/O 耗时 / CPU 耗时)

不过上面这个公式是针对单核 CPU 的,至于多核 CPU,也很简单,只需要等比扩大就可以了,计算公式如下:

最佳线程数 =CPU 核数 * [ 1 +(I/O 耗时 / CPU 耗时)]

I/O 密集型计算场景
I/O 耗时和 CPU 耗时的比值是一个关键参数,不幸的是这个参数是未知的,而且是动态变化的,所以工程上,我们要估算这个参数,然后做各种不同场景下的压测来验证我们的估计。不过工程上,原则还是将硬件的性能发挥到极致,所以压测时,我们需要重点关注 CPU、I/O 设备的利用率和性能指标(响应时间、吞吐量)之间的关系。

你可能感兴趣的:(Linux操作系统,java,jvm,开发语言)