多进程和多线程的选择

一、多进程和多线程的基本概念
" 进程是资源分配的最小单位,线程是CPU调度的最小单位"
凡是用于完成操作系统的各种功能的进程就是系统进程,它们就是处于运行状态下的操作系统本身;   所有由用户启动的进程都是用户进程。 
在同一个时间里,同一个计算机系统中如果允许两个或两个以上的进程处于运行状态,这便是多任务。

进程是操作系统进行资源分配的单位, 进程拥有进程空间里面的文件句柄,堆内存,全局变量,静态变量,同步锁内核对象,数据库网络连接 .  
fork 后,子进程会复制父进程的 task_struct 结构;并为子进程的堆栈分配物理页(开始只是标记为只读的),延迟到当父或子线程尝试写这些区域,内核才为需要修改的那片内存拷贝副本
进程又被细化为线程,也就是一个进程下有多个能独立运行的更小的单位。

进行CPU分配是以线程为单位的,线程只是拥有自己的栈,寄存器,其它资源都属于进程的。一个进程可能由多个线程组成,这时情况更加复杂,
但简单地说,有如下关系:
总线程数<= CPU数量:并行运行(多个CPU并行)
总线程数> CPU数量:并发运行(一个CPU并发,这里的线程是可以属于不同的进程的)
多线程是将问题划分进入独立运行的程序片断中,使整个程序能更迅速地响应用户的请求。

二、多进程和多线程在各种情景下的优缺点

我们按照多个不同的维度,来看看多进程和多线程的对比(注:因为是感性的比较,因此都是相对的,不是说一个好得不得了,另一个差的无法忍受)

维度

多进程

多线程

总结

数据共享、同步

数据是分开的:共享复杂,需要用IPC;同步简单

多线程共享进程数据:共享简单;同步复杂

各有优势

内存、CPU

占用内存多,切换复杂,CPU利用率低

占用内存少,切换简单,CPU利用率高

线程占优

创建销毁、切换

创建销毁、切换复杂,速度慢 

创建销毁、切换简单,速度快 

线程占优 

编程调试

编程简单,调试简单

编程复杂,调试复杂

进程占优 

可靠性

进程间不会相互影响

一个线程挂掉将导致整个进程挂掉

进程占优

分布式 

适应于多核、多机分布 ;如果一台机器不够,扩展到多台机器比较简单

适应于多核分布

进程占优


三、多进程和多线程的选择
1)
需要频繁创建销毁的优先用线程
实例:web服务器。来一个建立一个线程,断了就销毁线程。要是用进程,创建和销毁的代价是很难承受的。
2)需要进行大量计算的优先使用线程
所谓大量计算,当然就是要消耗很多cpu,切换频繁了,这种情况先线程是最合适的。
实例:图像处理、算法处理
3)强相关的处理用线程,弱相关的处理用进程
什么叫强相关、弱相关?理论上很难定义,给个简单的例子就明白了。
一般的server需要完成如下任务:消息收发和消息处理。消息收发和消息处理就是弱相关的任务,而消息处理里面可能又分为消息解码、业务处理,这两个任务相对来说相关性就要强多了。因此消息收发和消息处理可以分进程设计,消息解码和业务处理可以分线程设计。

比如:游戏下载器和游戏客户端可以用进程,而游戏下载器里面自己的逻辑需要多线程,游戏客户端自己的逻辑(IO和网络)需要多线程。
4)
可能扩展到多机分布的用进程,多核分布的用线程
5)都满足需求的情况下,用你最熟悉、最拿手的方式。

至于”数据共享、同步“、“编程、调试”、“可靠性”这几个维度的所谓的“复杂、简单”应该怎么取舍,只能说:没有明确的选择方法。一般有一个选择原则:如果多进程和多线程都能够满足要求,那么选择你最熟悉、最拿手的那个。

你可能感兴趣的:(多进程和多线程的选择)