为了保证多线程数据安全,python语言的设计中,有个全局解释锁GIL(global interpretor lock),每个线程在开始运行时必须获得锁,遇到I/O或sleep挂起时释放锁,从而保证同一时刻只有一个线程在运行,多个线程在不同的时间片上执行,达到多任务的目的,使python具有 并发 能力,使得python可以充分使用CPU的单个核心。多线程并发在python网络爬虫中使用普遍,可以一次性开启大量下载任务,而大部分任务都在等待I/O的状态,比单线程速度快很多倍,另外,使用协程也能达到到多线程的的效果。
很多时候我们希望提高效率,充分利用多核CPU的优势,同时执行多个任务,做到多任务 并行,应该怎样做呢?既然绕不开GIL,解决方案有:
ctypes
模块直接调用其中的代码;用python的C接口写拓展,或者用Boost.Python等。note: python2中单个线程每执行固定字节码后会主动释放GIL锁,python3中改为每隔固定时间主动释放GIL锁。
import time
from threading import Thread
def countdown(n):
while n > 0:
n -= 1
count = 2e7
start = time.time()
n_threads = 10 # 线程数
threads = [Thread(target=countdown, args=(count//n_threads,)) for i in range(n_threads)]
for t in threads: t.start() # 启动多个线程
for t in threads: t.join() # 等待线程结束
print(time.time() - start)
在多核CPU上运行上述代码,无论线程数是1还是10,运行时间几乎相同,多线程不能利用多核优势提高效率。
import time
import os
from multiprocessing import Pool
def countdown(n):
while n > 0:
n -= 1
if __name__ == "__main__":
count = 2e7
start = time.time()
# n_processes = os.cpu_count()
n_processes = 8 # 进程数
pool = Pool(processes=n_processes) # 进程池
for i in range(n_processes):
pool.apply_async(countdown, (count//n_processes,)) # 启动多进程
pool.close() # 使进程池不能添加新任务
pool.join() # 等待进程结束
print(time.time() - start)
在多核CPU上运行,两个进程明显比1个快,效率差异明显,但多进程的系统开销也更大。
note: 在windows上执行时,多进程代码一定要放在if __name__ == '__main__':
里面执行,否则,这些全局表达式在子进程中也会执行,从而导致不断生成大量进程,直到崩溃,这一点与linux中通过fork调用实现多进程是完全不同的。
多进程系统开销大,而且python这种动态语言执行效率不高,即使用多进程仍然可能面临性能瓶颈,这时候可以利用C/C++语言的优势,将关键部分重写,从python调用,通过C/C++还可以直接使用不受GIL制约的多线程,提高代码性能。
为了测试,用C语言写个简单死循环,发现只能利用1个核,为了最大化利用CPU,还得上多线程,创建多线程需要利用操作系统提供的内核方法,在linux和windows的实现上存在差异。
// mthread_linux.c
#include
#include
int thread_run(int thread_id)
{
int s = 0;
printf("thread %i started...\n", thread_id);
for (size_t i = 0; i < 4000000000; i++)
for (size_t j = 0; j < 5; j++)
s += j;
printf("%i: %d\n", thread_id, s);
int ret = thread_id;
return ret;
}
int main()
{
const size_t num_threads = 8;
// pthread_t threads[num_threads];
pthread_t threads[8];
for (size_t i = 0; i < num_threads; i++)
{
int t_id = i+1;
pthread_create(threads + i, NULL, (void *)&thread_run, (void *)t_id);
printf("thread %lu created\n", i + 1);
}
for (size_t i = 0; i < num_threads; i++)
{
void *ret_val;
int exit_code = pthread_join(threads[i], &ret_val);
printf("thread %lu exited with %d and returned %d.\n", i + 1, exit_code, (int)ret_val);
}
return 0;
}
// 编译命令 && 运行命令
// gcc mthreads_linux.c -lpthread && ./a.out
用gcc编译就好,8线程下来,家用机CPU接近100%了
// mthread_windows.cpp
#include
#include
DWORD WINAPI thread_run(LPVOID lp_thread_id)
{
int thread_id = *(int*)lp_thread_id;
int s = 0;
printf("thread %i started...\n", thread_id);
for (size_t i = 0; i < 4000000000; i++)
for (size_t j = 0; j < 5; j++)
s += j;
printf("%i: %d\n", thread_id, s);
int ret = thread_id;
return ret;
}
int main()
{
const size_t num_threads = 8;
// HANDLE threads[num_threads];
HANDLE threads[8];
for (size_t i = 0; i < num_threads; i++)
{
int t_id = i + 1;
threads[i] = CreateThread(NULL, 0, thread_run, &t_id, 0, NULL);
printf("thread %lu created\n", i + 1);
}
for (size_t i = 0; i < num_threads; i++)
{
int exit_code = WaitForSingleObject(threads[i], INFINITE);
printf("thread %lu exited with %d.\n", i + 1, exit_code);
}
getchar();
return 0;
}
用Visual Studio自带的MSVC编译运行,同样,跑起来CPU也接近100%了
cython是一种语言,语法是C语言和python的混合体,不能单独执行,代码文件后缀为.pyx
,.pyx
文件需要翻译成.c
文件,然后由C语言编译器生成目标文件,后缀为.so
(linux)或.pyd
(windows),在python解释器中可以直接import调用。
根据缩写代码的语法,会按照C模式运行或Python模式运行,完全按照C模式运行会有极高的效率,根据cython的官方文档,使用cython最简单的例子只需四步:
(1). 编写cython文件(hello.pyx
)
def say_hello_to(name):
print("Hello %s!" % name)
(2). 编写用来编译hello.pyx
的文件(setup.py
)
from distutils.core import setup
from Cython.Build import cythonize
setup(
name="hello module",
ext_modules=cythonize("hello.pyx")
)
(3). 执行python setup.py build_ext --inplace
,该步骤生成hello.cp36-win_amd64.pyd
文件(windows,python36,64bit)
不用理会中间这一串,编译要求电脑上装了Visual Studio(Windows)或gcc(linux)
(4). 打开python解释器中执行from hello import say_hello_to
如何利用上述windows下多线程代码充分使用cpu,同样是四步:
(1). 编写cython文件(demo.pyx
),引用mthread_windows.cpp
中的函数,将其包裹在python函数_main
内
cdef extern from "mthread_windows.cpp":
int main()
def _main():
main()
(2). 编写用来编译demo.pyx
的文件(setup.py
)
from distutils.core import setup
from Cython.Build import cythonize
setup(
name="demo module",
ext_modules=cythonize("demo.pyx")
)
(3). 执行python setup.py build_ext --inplace
,该步骤生成demo.cp36-win_amd64.pyd
文件(windows,python36,64bit)
(4). 打开python解释器中执行from demo import _main