想要理解线程的含义,首先我们先看一下百度百科的定义:
线程(英语:thread)是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。
简单来讲,当你打开电脑中的一个应用程序,其实此时计算机就为你创建了一个进程,系统会为其进行资源分配并且对其进行调度。而线程就是比进程还要小的单位,多个线程完成不同的工作组成了我们宏观上能够得到响应的工作结果。
举个例子,进程就像一个大的工厂,工厂中有很多机床设备和场地。而不同的线程就像工厂中工作的工人,工厂为其分配不同的工作来完成一个最终的生产目标。我们可以指派不同的工人做不同的工作或增加工人提高我们的生产效率。
在编程中,线程可以由我们启用帮助我们完成不同的工作实现多线程并发,提高我们的代码效率。
在python中主要有两种实现多线程的方式:
通过threading.Thread () 方法创建线程
通过继承 threading.Thread 类的继承重写run方法
接下来我们分别说一下多线程的两种实现形式。
为了更直观的理解这个过程,首先我们先编写一个正常的函数,完成倒数5个数的功能,其中间隔一秒钟。
def fuc():
for i in range(5):
time.sleep(1)
在主函数中,我们调用Thread()来实例化两个线程,让他们同时运行。
if __name__ == '__main__':
t1 = threading.Thread(target=fuc, args=(1,), daemon=True)
t2 = threading.Thread(target=fuc, args=(2,), daemon=True)
t2.start()
t1.start()
整体代码如下所示:
import threading
import time
def fuc():
for i in range(5):
time.sleep(1)
if __name__ == '__main__':
t1 = threading.Thread(target=fuc)
t2 = threading.Thread(target=fuc)
t2.start()
t1.start()
我们先不讨论调用的函数以及传入的参数,先来看一下运行效果:
0
0
11
22
33
44
可以看到,两个打印的结果基本上是同时出现的,并且出现了混合的情况,证明两个打印的函数正在同时进行。
接下来我们就来介绍一下类的初始化参数以及我们调用的函数:
thread.Thread(group=Nore,targt=None,args=(),kwargs={},*,daemon=None)
在该类中主要由以下几个参数组成:
group:与ThreadGroup类相关,一般不使用。
target:线程调用的对象,就是目标函数,在上述的例子中我们传入的是我们编写的函数fuc。
name:线程的名字,默认是Tread-x。
args:为目标函数传递关键字参数,字典。
daemon:用来设置线程是否随主线程退出而退出,涉及到主线程相关知识,我们稍后介绍。
接下来介绍我们常用的几个方法:
run():表示线程启动的活动,在第二种继承写法中会用到。
start():激活线程,使其能够被调度。
join():等待至线程终止,这个方法涉及到主线程的知识,我们稍后介绍。
isAlive():返回线程是否活动。
getName():返回线程名称。
setName() : 设置线程名称。
接下来,我们使用上述参数更改示例,让函数获取一个参数,并为不同的线程设置名字。代码如下:
import threading
import time
def fuc(num):
for i in range(5):
print('接收到参数{}:'.format(num), i)
time.sleep(1)
if __name__ == '__main__':
# 传入参数及名字
t1 = threading.Thread(target=fuc, args=(1,), name='t1')
t2 = threading.Thread(target=fuc, args=(2,), name='t2')
t1.start()
print(t1.getName(), '开始运行...')
t2.start()
print(t2.getName(), '开始运行...')
运行结果如下:
接收到参数1:t1 开始运行...
0
接收到参数2: t20 开始运行...
接收到参数1:接收到参数2: 1
1
接收到参数1:接收到参数2: 2
2
接收到参数1:接收到参数2: 33
接收到参数1:接收到参数2: 4
4
可以看到,虽然结果很混乱,但是我们传入的参数以及获取的名字都被打印出来了。
另外,这里有两个注意:
在上面的例子中,我们已经理解了多线程的一种创建方法。接下来我们来介绍第二种方法,这也是众多大佬很喜欢的一种方法,通过继承 threading.Thread 类的线程创建。
class MyThread(threading.Thread):
def run(self) -> None:
for i in range(5):
print(i)
time.sleep(1)
if __name__ == '__main__':
t1 = MyThread(name='t1')
t2 = MyThread(name='t2')
t1.start()
t2.start()
运行结果如下:
0
0
11
22
33
44
注意:这里调用的是start方法而不是run方法,否则会编程单线程执行。
在了解了多线程的编程方法之后,我们来介绍一下主线程及相关参数和方法。
在我们执行多线程程序的过程中,存在一个主线程,而我们开辟的其他线程其实都是它的子线程。由主线程主导的工作有以下两种情况:
可以简单地理解为包工头,它是这些线程的头子!其从微观角度上讲掌管了一定的工作流程,它可以选择是否等待其它工人结束工作再结束整个工作。
而我们可以使用参数或者方法控制这个过程。
在上边的函数参数介绍中,提到了daemon参数,其为False时,线程不会随主线程结束而退出,主线程会等待其结束后再退出。而为True时则不论子线程是否完成了相关工作都会直接退出。
接下来我们看两个示例,我们修改刚才的示例代码的daemon参数为True,表示不论子线程是否完成了工作都强制退出。
import threading
import time
def fuc(num):
for i in range(5):
print('接收到参数{}:'.format(num), i)
time.sleep(1)
if __name__ == '__main__':
t1 = threading.Thread(target=fuc, args=(1,), name='t1', daemon=True)
t2 = threading.Thread(target=fuc, args=(2,), name='t2', daemon=True)
t1.start()
print(t1.getName(), '开始运行...')
t2.start()
print(t2.getName(), '开始运行...')
print("我是主线程,都给我停下!")
结果如下:
接收到参数1:t1 0
开始运行...
接收到参数2:t2 0
开始运行...
我是主线程,都给我停下!
可以看到,子线程的倒数还没有结束,由于主线程结束了,所有线程一起结束了。
这里要注意以下几点:
除此之外,我们还可以调用.join()方法阻塞线程,调用该方法的时候,该方法的调用者线程结束后程序才会终止。
#timeout参数表明等待的时长,不设置该参数则默认为一直等待。
join(timeout-=None)
我们来看下面这个示例,我们更改了两个函数的倒计时时间,使第一个线程的倒计时时间更长,并对第二个线程进行了阻塞操作。代码如下:
import threading
import time
def fuc1():
for i in range(10):
print(i)
time.sleep(1)
def fuc2():
for i in range(5):
print(i)
time.sleep(1)
if __name__ == '__main__':
t1 = threading.Thread(target=fuc1, name='t1', daemon=True)
t2 = threading.Thread(target=fuc2, name='t2', daemon=True)
t1.start()
print(t1.getName(), '开始运行...')
print('我是二儿子,等等我!')
t2.start()
print(t2.getName(), '开始运行...')
t2.join()
print("我是主线程,都给我停下!")
结果如下:
0t1
开始运行...
我是二儿子,等等我!
0t2
开始运行...
11
22
33
44
我是主线程,都给我停下!5
我们可以看到,上述代码中线程一还没有结束倒数十个数,程序就结束了。在此过程中,主线程只等待了第二个线程结束,整个程序就结束了。
在多个线程同步运行的情况下,会出现多个线程同时操作一个数据的情况。如果两个线程同时操作同一个变量的话,很容易出现混乱的情况。所以,我们需要一个工具来确保在同一时间只能有一个线程处理数据。
线程类提供了锁来解决问题,当线程申请处理某个数据时申请一个锁来控制住当前数据,结束处理时即将锁释放。
python的threading中为我们提供了RLock锁来解决多线程同时处理一个数据的问题。在某个时刻,我们可以让线程申请锁来保护数据此时只能供该线程使用。
为了更好的理解该过程,我们定义一个全局变量,让每一个线程都对其操作但不设置锁,观察变量的变化:
R_LOCK = threading.Lock()
COUNT = 100
class MyThread(threading.Thread):
def run(self) -> None:
global COUNT
#R_LOCK.acquire()
COUNT -= 10
time.sleep(1)
print(self.getName(), COUNT)
#R_LOCK.release()
if __name__ == '__main__':
threads = [MyThread() for i in range(10)]
for t in threads:
t.start()
结果如下:
Thread-3Thread-10 0Thread-8Thread-7 0Thread-6 0Thread-5Thread-9
Thread-1 0Thread-2 00 0
Thread-4 000
可以看到,我们的数据发生了异常,这并不是我们想要得到的结果,若把锁给关闭注释让其正常运行可以看到以下的正常结果:
Thread-1 90
Thread-2 80
Thread-3 70
Thread-4 60
Thread-5 50
Thread-6 40
Thread-7 30
Thread-8 20
Thread-9 10
Thread-10 0
多线程编程是一个非常重要的编程思想,理解多线程编程有助于我们更好的理解设计模式。
当然,python中的编程并不是真正的多线程执行,这涉及到GIL全局解释锁相关的知识。所以其针对CPU密集型任务来说并没有很好的效果,接下来我将会更新相关的内容进行更多的说明。
如果有什么问题可以私信我或者是在评论区留言与我一起交流,如果你觉得我写的不错,麻烦你帮我点个赞吧!