多线程-相关概念

一.同步(Synchronous)和异步(Asynchronous)

同步和异步通常用来形容一次方法调用,同步方法调用一旦开始,必须等待该方法返回结果后,才能执行后续的代码,而异步方法调用一旦开始,它便会立即返回(不一定会返回结果),调用者可以继续执行后续的代码,同时异步方法会在另外一个线程中“真实”地执行。同步和异步关注的是消息通信机制。
同步与异步的其他参考:https://www.zhihu.com/question/19732473/answer/20851256

二.并发(Concurrency)和并行(Parallelism)

并发:多个任务交替执行
并行:多个任务同时执行

从观察者角度来说并发和并行区别不大, 两者几乎都是同时执行的,因为cpu执行速度很快,所以任务的切换用肉眼是看不见的, 并发强调多个动作同时存在,而并行强调多个动作同时执行。

假设有线程A和线程B, 他们有各自的任务要执行,那么在单核cpu上,是交替执行的,那就是并发,在多核cpu上,如果每个线程都被分配到一个单独的核来执行,那就是并行的。

并发和并行的区别,图片来自Erlang 之父 Joe Armstrong


v2-674f0d37fca4fac1bd2df28a2b78e633_hd.jpg
三.临界区(critical section)

临界区:当两个线程竞争同一资源时,如果对资源的访问顺序敏感,就称存在竞态条件。导致竞态条件发生的代码块称作临界区。

临界区用来表示一种公众资源或者说是共享数据,可以被多个线程使用。但是每一次只能有一个线程使用它,一旦临界区资源被占用,其他线程想使用这个资源,就必须等待。

四.阻塞(Blocking)和非阻塞(Non-Blocking)

阻塞:
阻塞调用是指调用结果返回之前,当前线程会被挂起。函数只有在得到结果之后才会返回。
有人也许会把阻塞调用和同步调用等同起来,实际上他是不同的。
对于同步调用来说,很多时候当前线程还是激活的,只是从逻辑上当前函数没有返回而已。

非阻塞:
非阻塞和阻塞的概念相对应,指在不能立刻得到结果之前,该函数不会阻塞当前线程,而会立刻返回。

阻塞和非阻塞通常用来形容多线程间的相互影响。比如一个线程占用了临界区资源,那么其他所有需要这个资源的线程就必须在这个临界区中进行等待。等待会导致线程被挂起,这种情况就是阻塞。此时,如果占用资源的线程一直不肯释放资源,那么其他所有阻塞在这个临界区上的线程都不能工作。

非阻塞的意思与之相反,他强调没有一个线程可以妨碍其他线程执行。所有的线程都会尝试不断向前执行。

五.死锁(Deadlock) ,饥饿(Starvation)和活锁(Livelock)

死锁:多个线程竞争资源,在竞争过程中相互占用对方需要的资源,导致互相等待。
饥饿:一个或多个线程由于种种原因无法获得所需要的资源,导致一直无法执行。
活锁:多个线程互相礼让资源,导致不停的重试。

在死锁状态下,线程是阻塞的。死锁一旦发生,如果没有外力介入,这种等待将永远存在,从而对程序产生了严重的影响。

活锁就是指线程一直处于运行(RUNNABLE)状态,但却是在做无用功,而这个线程本身要完成的任务却一直无法进展。活锁的一个典型例子是某些重试机制(实现地有问题)导致一个交易(请求)被不断地重试,而每次重试都是失败的(线程在最无用功),这就导致其他失败的交易无法得到重试的机会(任务无法进展)

六.并发级别
阻塞(Blocking)

一个线程是阻塞的,那么在其他线程释放资源之前,当前线程无法继续执行。当我们使用synchronized关键字,或者重入锁时,我们得到的就是阻塞的线程。

无饥饿(Starvation-Free)

如果线程之间是有优先级的,那么线程调度的时候总是会倾向于满足高优先级的线程。也就是说,对于同一个资源的分配,是不公平的。对于非公平的锁来说,系统允许高优先级的线程插队。这样有可能导致低优先级线程产生饥饿。但如果锁是公平的,满足先来后到,那么饥饿就不会产生,不管新来的线程优先级多高,想要获得资源,就必须乖乖排队。那么所有得线程都有机会执行。

无障碍 (Obstruction-Free)

无障碍是一种最弱的非阻塞调度。两个线程如果是无障碍的执行,那么他们不会因为临界区的问题导致一方被挂起。换言之,大家都可以大摇大摆地进入临界区了,那么如果大家一起修改共享数据,把数据改坏了可怎么办呢?对于无障碍的线程
来说,一旦检测到这种情况的,他就会立即对自己所做的修改进行回滚,确保数据安全。但如果没有数据竞争发生,那么线程就可以顺利完成自己的工作,走出临界区。

如果说阻塞的控制方式是悲观策略。也就是说,系统认为两个线程之间很有可能发生不幸的冲突,因此,以保护共享数据为第一优先级。相对来说,非阻塞的调度就是一种乐观的策略。它认为多个线程之间很有可能不会发生冲突,或者说这种概率不大。因此大家都应该无障碍的执行,但是一旦检测到冲突,就应该进行回滚。

从这个策略中也可以看到,无障碍的多线程程序不一定能顺畅的运行。因为当临界区中存在严重的冲突时,所有的线程可能都会不断的回滚自己的操作,而没有一个线程可以走出临界区。这种情况会影响程序的正常运行。所以,我们可能会非常希望在这一堆线程中,至少可以有一个线程能够在有限的时间内完成自己的操作,而退出临界区。至少这样可以保证系统不会在临界区中进行无限的等待。

一种可行的无障碍实现可以依赖一个“一致性标记”来实现。线程在操作之前,先读取并保存这个标记,在操作完成之后,再次读取,检查这个标记是否被更改过,如果两者是一致的,则说明资源访问没有冲突。如果不一致,则说明资源可能在操作过程中与其他写线程冲突,需要重试操作,而任何对资源有修改操作的线程,则在修改数据前,都需要更新这个一致性标记,表示数据不再安全。

个人理解:多个线程可以无阻塞的访问临界区,并且修改临界区的资源的值,当修改之后,发现值不正确,那么就回滚之前的修改。

无锁(Lock-Free)

无锁的并行都是无障碍的。在无锁的情况下,所有的线程都能尝试对临界区进行访问,但不同的是,无锁的并发保证必然有一个线程能够在有限步内完成操作离开临界区。

在无锁的调用中,一个典型的特点是可能会包含一个无穷循环。在这个循环中,线程会不断尝试修改共享变量。如果没有冲突,修改成功,那么程序退出,否则继续尝试修改。但无论如何,无锁的并行总能保证有一个线程是可以胜出的,不至于全军覆没。至于临界区中竞争失败的线程,它们则必须不断重试,直到自己获胜。如果运气很不好,总是尝试不成功,则会出现类似饥饿的现象,线程会停止不前。

个人理解:在无锁的状态下,总能保证有一个线程能出临界区,紧接着会有第二个,第三个线程出临界区,这样所有的线程都会走出临界区。

无等待

无锁只要求有一个线程可以在有限步内完成操作,而无等待则在无锁的基础上更进一步进行扩展。它要求所有的线程都必须在有限步内完成,这样就不会引起饥饿问题。如果限制这个步骤上限,还可以进一步分解为有界无等待和线程无关的无等待几种,它们之间的区别只是对循环次数的限制不同。

一种典型到的无等待结构就是RCU(Read-Copy-Update)。它的基本思想是。对数据的读可以不加控制。因此,所有的读线程都是无等待的,它们既不会被锁定等待也不会引起任何冲突。但是在写数据的时候,先取得原始数据的副本,接着只修改副本数据(这就是为什么读可以不加控制),修改完成后,在合适的时机写回数据。

个人理解:无等待是并行最好的一种状态,它对临界区资源读写都是无阻塞的。但同时实现起来也是比较复杂的。

你可能感兴趣的:(多线程-相关概念)