多线程编程(二) 线程和进程


  • 背景/简介
  • 线程和进程
  • 线程和Python
  • thread 模块
  • threading模块
  • 单线程和多线程对比
  • 多线程实践
  • 生产者-消费者问题和Queue/queue 模块
  • 线程的替代方案

进程

计算机程序只是存储在磁盘上的可执行的二进制文件。只有把它们加载到内存中并被操作系统调用,才拥有生命周期。进程(有时候称为重量级进程)则是一个执行中的程序。每个进程都拥有自己的地址空间,内存,数据栈以及其他用于跟踪执行的辅助程序,操作系统管理其上所有进程的执行,并为这些进程合理的分配时间。进程也可以通过派生新的进程来执行其它任务,不过因为每个新进程也都拥有自己的内存和数据栈等,所以只能采用进程间的通信(IPC)的方式共享信息。

线程

线程(有时候称为轻量级进程)与进程类似,不过他们是在同一个进程下执行的,共享相同的上下文。可以将它们认为是一个主进程或主“线程”中并行运行的一些“迷你进程”

线程包括开始、顺序执行和结束三个部分。它有一个指针指令,用于记录当前运行的上下文。当其他线程运行时,它可以被抢占(中断)和临时挂起(睡眠)----这种做法叫做让步

一个进程中的各个线程共享同一片数据空间,因此相比于独立的进程而言,线程间的信息共享和通信更加容易。线程一般是以并发方式执行的,正是由于这种并行和数据共享机制,使得多任务间的协作成为可能。当然,在单核 CPU 系统中,真正的并发是不可能的,所以线程的执行是这样规划的:每个线程运行一小会,然后让步给其他线程(再次排队等待更多的 CPU 时间)在整个进程的执行过程中,每个线程执行它自己特定的任务,必要时和其他线程进行结果通信。

当然,这种共享并不是没有风险的。如果两个或多个线程访问同一片数据,由于数据访问顺序不同,可能导致的结果不一样。这种情况通常称之为静态条件(race condition)。幸运的是,大多数线程库都有一些同步原语,以允许线程管理器控制执行和访问。

另一个需要注意的问题是,线程无法给予公平的执行时间,这是因为一些函数会在完成前保持阻塞状态,如果没有专门为多线程进行修改,会在导致CPU的时间分配向这些贪婪函数的倾斜。

你可能感兴趣的:(多线程编程(二) 线程和进程)