- 多线程和并发的概念
- 上下文切换
- 如何减少上下文切换
- 无锁并发编程
- CAS算法
- 使用最少线程
- 协程
- 死锁
- 避免死锁的几个常见的方式
- 资源限制的挑战
- 1.资源限制
- 2.资源限制引发的问题
- 3.如何解决资源限制问题
- 4.在资源限制情况下进行并发编程
多线程和并发的概念
高并发:高并发是互联网分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计保证系统能够同事并行处理很多请求
基本概念:
- 并发:多个线程操作相同的资源,保障线程安全,合理使用资源。
- 多线程:服务能够同时处理很多请求 提升程序性能
并发编程的目的是为了让程序运行的更快,但是,并不是启动更多的线程就能让程序最大限度地并发执行行。在进行并发编程时,如果希望通过多线程执行任务让程序运行得更快,会面临非常多的挑战,比如上下文切换的问题、死锁的问题,以及受限于硬件和软件的资源限制问题.
上下文切换
多个线程不是同时运行的,即使是单核处理器也支持多线程执行代码,CPU通过给每个线程分配CPU时间片来实现这个机制。时间片是CPU分配给各个线程的时间,因为时间片非常短,所以CPU通过不停地切换线程执行,让我们感觉多个线程是同时执行的,时间片一般是几十毫秒(ms)。
CPU通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再加载这个任务的状态。所以任务从保存到再加载的过程就是一次上下文切换.这样的切换是会影响程序运行的效率的,上下文的切换会印象多线程的执行速度.
如何减少上下文切换
- 无锁并发编程
- CAS算法
- 使用最少线程
- 使用协程
无锁并发编程
多线程竞争锁时,会引起上下文切换,所以多线程处理数据时,可以用一些方法来避免使用锁,如将数据的ID按照本Hash算法取模分段,不同的线程处理不同段的数据。
CAS算法
Java的Atomic包使用CAS算法来更新数据,而不需要加锁.
使用最少线程
避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这样会造成大量线程都处于等待状态。
协程
在单线程里实现多任务的调度,并在单线程里维持多个任务之间的切换.
死锁
死锁是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程.
代码演示:
public class DeadLockDemo {
private static String A = "A";
private static String B = "B";
public static void main(String[] args) {
new DeadLockDemo().deadLock();
}
private void deadLock() {
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
synchronized (A) {
try { Thread.sleep(2000);
} catch (InterruptedException e) {
e.printStackTrace();
}
synchronized (B) {
System.out.println("1");
}
}
}
});
Thread t2 = new Thread(new Runnable() {
@Override
public void run() {
synchronized (B) {
synchronized (A) {
System.out.println("2");
}
}
}
});
t1.start();
t2.start();
}
}
这段代码会引起死锁,使线程t1和线程t2互相等待对方释放锁。
避免死锁的几个常见的方式
- 避免一个线程同时获取多个锁。
- 避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源。
- 尝试使用定时锁,使用lock.tryLock(timeout)来替代使用内部锁机制。
- 对于数据库锁,加锁和解锁必须在一个数据库连接里,否则会出现解锁失败的情况。
资源限制的挑战
1.资源限制
资源限制是指在进行并发编程时,程序执行速度受限于计算机硬件资源或软件资源.
2.资源限制引发的问题
在并发编程中,将代码执行速度加快的原则是将代码中的串行执行的部分,变成并发执行, 但是如果将某段串行的代码并发执行,因为受限于资源,仍然在串行执行,这时候程序不仅不会加快执行,反而会更慢,因为增加了上下文切换和资源调度的时间。(代码对资源的处理未完成).
3.如何解决资源限制问题
对于硬件资源的限制,可以考虑使用集群并行执行程序.既然单机的资源有限制,那么就让程序在多机上运行。比如使用ODPS、Hadoop或者自己搭建服务器集群,不同的机器处理不同的数据。可以通过“数据ID%机器数”,计算得到一个机器编号,然后由对应编号的机器处理这笔数据。
对于软件的资源限制,可以考虑使用资源池将资源复用.比如使用连接池将数据库和Socket连接复用,或者在调用对方webservice接口获取数据时,只建立一个连接。
4.在资源限制情况下进行并发编程
根据不同的资源限制调整程序的并发度,比如下载文件程序依赖于两个资源——带宽和硬盘读写速度。有数据库操作时,涉及数据库连接数,如果SQL语句执行非常快,而线程的数量比数据库连接数大很多,则某些线程会被阻塞,等待数据库连接。
参照书籍:《Java并发编程的艺术》