编写高质量的python代码(3): 使用threading模块编写多线程程序

GIL的存在使得多线程编程暂时无法充分利用多处理器的优势,这里说一下什么是GIL?
每一个interpreter进程,只能同时仅有一个线程来执行, 获得相关的锁, 存取相关的资源.
那么很容易就会发现,如果一个interpreter进程只能有一个线程来执行, 多线程的并发则成为不可能, 即使这几个线程之间不存在资源的竞争.
对于纯Python的代码也许使用多线程并不能提高运行效率,但在以下几种情况,如等待外部资源返回,或者为了提高用户体验而建立反应灵活的用户界面,或者多用户程序中,多线程仍然是一个比较好的解决方案。Python为多线程编程提供了两个非常简单明了的模块:thread和threading模块。那么,这两个模块在多线程处理上有什么区别呢?简单说:thread模块提供了多线程底层支持模块,以低级原始的方式来处理和控制线程,使用起来较为复杂;而threading模块基于thread进行包装,将线程的操作对象化,在语言层面提供了丰富的特性。Python多线程支持用两种方式来创建线程:一种是通过继承Thread类,重写它的run()方法(注意不是start()方法);另一种是创建一个threading.Thread对象,在他的初始化函数中将可调用对象作为参数传入。实际应用中,推荐优先使用threading模块而不是thread模块,下面具体分析一下这么做的原因。

  • threading模块对同步原语的支持更为丰富和完善。就线程的同步和互斥来说,thread模块只提供了一种锁类型thread.LockType,而threading模块中不仅有Lock指令锁.Rlock可重入指令锁,还支持条件变量Condition,信号量Semaphore,BoundedSemaphore以及Event事件等
  • threading模块在主线程和子线程交互上更为友好,threading中的join()方法能够阻塞当前上下文环境的线程,直到调用此方法的线程终止或者到达指定的timeout,利用该方法可以方便的控制主线程和子线程以及子线程之间的执行。来看一个简单示例:
import threading, time, sys
class test(threading.Thread):
       
      def __init__(self, name, delay):
            threading.Thread.__init__(self)
            self.name = name
            self. delay = delay
     
      def run(self):
            print "%s delay for %s" %(self.name, self.delay)
            time.sleep(self.delay)
            c = 0
            while True:
                  print "this is thread %s on line %s" %(self.name, c)
                  c = c+1
                  if c == 3:
                        print "End of thread %s" % self.name
                        break
t1 = test("thread 1", 2)
t2 = test("thread 2", 2)
t1.start()
print "wait t1 to end"
t1.join()
t2.start()
print 'end of main'

上面的例子中,主线程main在t1上使用join()的方法,主线程会等待t1结束后才继续运行后面的语句,由于线程t2的启动在join语句之后,t2会一直等到t1退出后才会开始运行

编写高质量的python代码(3): 使用threading模块编写多线程程序_第1张图片
Paste_Image.png
  • thread模块不支持守护线程。thread模块中主线程退出的时候,所有的子线程不论是否还在工作,都会被墙纸退出,并且没有任何警告,也没有任何推出前的清理工作,这是一种非常野蛮的主线程和子线程的额交互方式。如果把主线程和子线程组成的线程组比作一个团队的话,那么主线程应该是这个团队的管理者,它了解每个线程所做的事情,所需要的数据输入以及子线程结束时的输出,并把每个线程的输出组成有意义的结果。如果一个团队中管理者采取这种强硬的管理方式,相信很多下属都会苦不堪言。实际上很多情况下我们可能希望主线程能够等待所有子线程都完成时才退出,这时应该使用threading模块,它支持守护线程,可以通过setDaemon()函数来设定线程的daemon属性。当daemon属性设置为True的时候表明主线程的退出可以不用等待子线程完成。默认情况下,daemon标志为False,所有的费守护线程结束后主线程才会结束,来看具体的例子,当daemon属性设置为False,默认主线程会等待所有子线程结束才会退出。将t2的daemon属性设置为True之后即使t2运行未结束主线程也会直接退出
import threading
import time
def myfunc(a, delay):    
.     print "I will calculate square of %s after delay for %s" %(a, delay)
...   time.sleep(delay)
...   print "calculate begins..."
...   result = a**2   
...   print result 
...   return result
t1 = threading.Thread(myfunc, (2,5))
t2 = threading.Thread(myfunc, (2,4))
print t1.setDaemon()
print t2.setDaemon()
t2.setDaemon(True)
t1.start()
t2.start()

你可能感兴趣的:(编写高质量的python代码(3): 使用threading模块编写多线程程序)