前面写了一个多线程报数的功能,为了描述方便和代码简洁起见,只输出最后的报数结果来观察程序运行结果。这非常类似一个网站的客户访问统计,每个用户登录用一个线程模拟,线程运行时将一个表示计数的变量递增。程序在最后输出这个计数的值表示今天有多少用户登录。如果这个值不等于我们启动的线程个数,那这个程序就是有问题的。
#include <stdio.h> #include <process.h> #include <Windows.h> volatile long g_nLoginCount;//用一个全局变量记录登录的次数 unsigned int _stdcall Fun(PVOID PM); const int THREAD_NUM = 10;//启动的线程的数目 unsigned int _stdcall ThreadFun(PVOID PM) { Sleep(100); g_nLoginCount++; Sleep(50); return 0; } int main() { g_nLoginCount = 0; HANDLE handle[THREAD_NUM]; for(int i = 0; i < THREAD_NUM; i++) { handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL); } WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE); printf("有%d个用户登录后记录的结果是%d\n", THREAD_NUM, g_nLoginCount); return 0; }
程序执行结果:
这个程序的执行结果是不稳定的,多次执行发现有可能的结果是8、9、10等结果。
为了放大问题,能清除的看到问题,把线程数设置为50,程序执行20遍,看程序执行的结果:
#include <stdio.h> #include <process.h> #include <Windows.h> volatile long g_nLoginCount;//用一个全局变量记录登录的次数 unsigned int _stdcall Fun(PVOID PM); const int THREAD_NUM = 50;//启动的线程的数目 unsigned int _stdcall ThreadFun(PVOID PM) { Sleep(100); g_nLoginCount++; Sleep(50); return 0; } int main() { int num = 20; while(num--) { g_nLoginCount = 0; HANDLE handle[THREAD_NUM]; for(int i = 0; i < THREAD_NUM; i++) { handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL); } WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE); printf("有%d个用户登录后记录的结果是%d\n", THREAD_NUM, g_nLoginCount); } return 0; }
看程序的运行结果:
经过把问题放大,可以看到运行的结果很不稳定。下面分析一个原因。
要解决这个问题,先要分析一下g_nLoginCount++这个操作,在VC6.0编译器下对g_nLoginCount++这句话打个断点,然后F5进入调试状态,然后按下Debug工具栏的Disassembly按钮,这样就出现了汇编代码的窗口。可以返现在C\C++语言中一条简单的自增语句其实是由三条汇编代码组成的,如下图所示:
讲解下这三条汇编意思:
第一条汇编将g_nLoginCount的值从内存中读取到寄存器eax中。
第二条汇编将寄存器eax中的值与1相加,计算结果仍存入寄存器eax中。
第三条汇编将寄存器eax中的值写回内存中。
错误发生的原因分析前首先要知道两个知识点:
(1)线程在切换的时候是要保存线程的,把寄存器里的数据保存到线程自己的私有栈中。
(2)每个线程都有自己的私有的栈空间,一方面是用来存储一些数据,另一方面是用来作函数调用时的栈操作。
在多线程的环境下,假设A线程执行到了第二句话,线程B开始执行,打断了A的执行。这样线程A的现场就被保存在了A的私有的栈空间中,也就是图上面的eax这个寄存器的数据(当然还有其他的一些寄存器)被保存在了A的私有栈空间中。当B执行完了以后,A做线程恢复。然后继续执行,最后得到的结果就是两个线程只增加了一次。究其原因就是一个线程的读取数据的时间点不是在上一个线程计算完写回去之后。
因此在多线程环境中对一个变量进行读写时,我们需要有一种方法能够保证对一个值的递增操作是原子操作——即不可打断性,一个线程在执行原子操作时,其它线程必须等待它完成之后才能开始执行该原子操作。这种涉及到硬件的操作将会很复杂了,幸运的是,Windows系统为我们提供了一些以Interlocked开头的函数来完成这一任务(下文将这些函数称为Interlocked系列函数)。
下面列出一些常用的Interlocked系列函数:
//增减操作 LONG WINAPI InterlockedIncrement(LONG volatile * lpAddend); LONG WINAPI InterlockedDecrement(LONG volatile* lpAddend); //返回变量执行增减操作之后的值。 LONG WINAPI InterlockedExchangeAdd(LONG volatile* Addend, LONG Value);//返回运算后的值,注意!加个负数就是减。 //赋值操作 LONG WINAPI InterlockedExchange(LONG volatile* Target, LONG Value);//Value就是新值,函数会返回原先的值。
所以在原来的线程函数的代码中可以做下面的改动,就可以解决问题:
unsigned int _stdcall ThreadFun(PVOID PM) { Sleep(100); //g_nLoginCount++; InterlockedIncrement((LPLONG)&g_nLoginCount); Sleep(50); return 0; }
再次运行就可以发现结果唯一了:
因此,在多线程的环境下,我们队变量的自增自减这些简单的语句也要慎重的考虑,防止多个线程访问导致数据出错。
另外给个附加问题,程序中是用50个线程模拟用户登录,有兴趣的同学可以试下用100个线程来模拟一下(上机试试绝对会有意外发现)