0 概述
所谓同步,就是给多个线程规定一个执行的顺序(或称为时序),要求某个线程先执行完一段代码后,另一个线程才能开始执行。
第一种情况:多个线程访问同一个变量:
1. 一个线程写,其它线程读:这种情况不存在同步问题,因为只有一个线程在改变内存中的变量,内存中的变量在任意时刻都有一个确定的值;
2. 一个线程读,其它线程写:这种情况会存在同步问题,主要是多个线程在同时写入一个变量的时候,可能会发生一些难以察觉的错误,导致某些线程实际上并没有真正的写入变量;
3. 几个线程写,其它线程读:情况同2。
多个线程同时向一个变量赋值,就会出现问题,这是为什么呢?
我们编程采用的是高级语言,这种语言是不能被计算机直接执行的,一条高级语言代码往往要编译为若干条机器代码,而一条机器代码,CPU也不一定是在一个CPU周期内就能完成的。计算机代码必须要按照一个“时序”,逐条执行。
举个例子,在内存中有一个整型变量number(4字节),那么计算++number(运算后赋值)就至少要分为如下几个步骤:
1. 寻址:由CPU的控制器找寻到number变量所在的地址;
2. 读取:将number变量所在的值从内存中读取到CPU寄存器中;
3. 运算:由CPU的算术逻辑运算器(ALU)对number值进行计算,将结果存储在寄存器中;
4. 保存:由CPU的控制器将寄存器中保存的结果重新存入number在内存中的地址。
这是最简单的时序,如果牵扯到CPU的高速缓存(CACHE),则情况就更为复杂了。
图1 CPU结构简图
在多线程环境下,当几个线程同时对number进行赋值操作时(假设number初始值为0),就有可能发生冲突:
当某个线程对number进行++操作并执行到步骤2(读取)时(0保存在CPU寄存器中),发生线程切换,该线程的所有寄存器状态被保存到内存后后,由另一个线程对number进行赋值操作。当另一个线程对number赋值完毕(假设将number赋值为10),切换回第一个线程,进行现场恢复,则在寄存器中保存的number值依然为0,该线程从步骤3继续执行指令,最终将1写入到number所在内存地址,number值最终为1,另一个线程对number赋值为10的操作表现为无效操作。
看一个例子:
using System;
using System.Threading;
namespace Edu.Study.Multithreading.WriteValue {
class Program {
///
/// 多个线程要访问的变量
///
private static int number = 0;
///
/// 令线程随机休眠的随机数对象
///
private static Random random = new Random();
///
/// 线程入口方法, 这里为了简化编程, 使用了静态方法
///
private static void ThreadWork(object arg) {
// 循环1000次, 每次将number字段的值加1
for (int i = 0; i < 1000; ++i) {
// += 1操作比++操作需要更多的CPU指令, 以增加出现错误的几率
number += 1;
// 线程在10毫秒内随机休眠, 以增加出现错误的几率
Thread.Sleep(random.Next(10));
}
}
///
/// 主方法
///
static void Main(string[] args) {
do {
// 令number为0, 重新给其赋值
number = 0;
Thread t1 = new Thread(new ParameterizedThreadStart(ThreadWork));
Thread t2 = new Thread(new ParameterizedThreadStart(ThreadWork));
// 启动两个线程访问number变量
t1.Start();
t2.Start();
// 等待线程退出, Timeout.Infinite表示无限等待
while (t1.Join(Timeout.Infinite) && t2.Join(Timeout.Infinite)) {
Console.WriteLine(number);
break;
}
Console.WriteLine("请按按回车键重新测试,任意键退出程序......");
} while (Console.ReadKey(false).Key == ConsoleKey.Enter);
}
}
}
例子中,两个线程(t1和t2)同时访问number变量(初始值为0),对其进行1000次+1操作,在两个线程都结束后,在主线程显式number变量的最终值。可以看到,很经常的,最终显示的结果不是2000,而是1999或者更少。究其原因,就是发生了我们上面讲的问题:两个线程在进行赋值操作时,时序重叠了。
可以做实验,在CPU核心数越多的计算机上,上述代码出现问题的几率越小。这是因为多核心CPU可能会在每一个独立核心上各自运行一个线程,而CPU设计者针对这种多核心访问一个内存地址的情况,本身就设计了防范措施。
第二种情况:多个线程组成了生产者和消费者:
我们前面已经讲过,多线程并不能加快算法速度(多核心处理器除外),所以多线程的主要作用还是为了提高用户的响应,一般有两种方式:
所以,线程之间很容易就形成了生产者/消费者模式,即一个线程的某部分代码必须要等待另一个线程计算出结果后才能继续运行。目前存在两种情况需要线程间同步执行:
1 变量的原子操作
CPU有一套指令,可以在访问内存中的变量前,并将一段内存地址标记为“只读”,此时除过标志内存的那个线程外,其余线程来访问这块内存,都将发生阻塞,即必须等待前一个线程访问完毕后其它线程才能继续访问这块内存。
这种锁定的结果是:所有线程只能依次访问某个变量,而无法同时访问某个变量,从而解决了多线程访问变量的问题。
原子操作封装在Interlocked类中,以一系列静态方法提供:
例如:
Interlocked.Add方法演示
int n = 0;
// 将n加1
// 执行完毕后n的值变为1, 和返回值相同
int x = Interlocked.Add(ref n, 1);
// 将n减1
x = Interlocked.Add(ref n, -1);
Interlocked.Increment/Interlocked.Decrement方法演示
int n = 0;
// 对n进行自加操作
// 执行完毕后n的值变为1, 和返回值相同
int x = Interlocked.Increment(ref n);
// 对n进行自减操作
x = Interlocked.Decrement(ref n);
Interlocked.Exchange方法演示
string s = "Hello";
// 用另一个字符串对象"OK"为s赋值
// 操作完毕后s变量改变为引用到"OK"对象, 返回"Hello"对象的引用
string old = Interlocked.Exchange(ref s, "OK");
Interloceked.CompareExchange方法演示
string s = "Hello";
string ss = s;
// 首先用变量ss和s比较, 如果相同, 则用另一个字符串对象"OK"为s赋值
// 操作完毕后s变量改变为引用到"OK"对象, 返回"Hello"对象的引用
string old = Interlocked.CompareExchange(ref s, ss, "OK");
注意,原子操作中,要赋值的变量都是以引用方式传递参数的,这样才能在原子操作方法内部直接改变变量的值,才能完全避免非安全的赋值操作。
下面我们将前一节中出问题的代码做一些修改,修改其ThreadWork方法,在多线程下能够安全的操作同一个变量:
private static void ThreadWork(object arg) {
for (int i = 0; i < 1000; ++i) {
// 使用原子方式操作变量, 避免多个线程为同一变量赋值出现错误
Interlocked.Add(ref number, 1);
Thread.Sleep(random.Next(10));
}
}
上述代码解决了一个重要的问题:同一个变量同时只能被一个线程赋值。
2 循环锁、关键代码段和令牌对象
使用变量的原子操作可以解决整数变量的加减计算和各类变量的赋值操作(或比较后赋值操作)的问题,但对于更复杂的同步操作,原子操作并不能解决问题。
有时候我们需要让同一段代码同时只能被一个线程执行,而不仅仅是同一个变量同时只能被一个线程访问,例如如下操作:
double a = 10;
double b = 20;
c = Math.Pow(a, 2);
c += Math.Pow(b, 2);
c = Math.Sqrt(c);
c /= Math.PI;
假设变量c是一个类字段,同时被若干线程赋值,显然仅通过原子操作,无法解决c变量被不同线程同时访问的问题,因为计算c需要若干步才能完成计算,需要比较多的指令,原子操作只能在对变量一次赋值时产生同步,面对多次赋值,显然无能为力。无论c=Math.Pow(a, 2)这步如何原子操作后,这步结束后下步开始前,c的值都有可能其它线程改变,从而最终计算出错误的结果。
所以锁定必须要施加到一段代码上才能解决上述问题,这就是关键代码段:
关键代码段需要两个前提条件:
令牌对象有个状态属性:具备两个属性值:挂起和释放。可以通过原子操作改变这个属性的属性值。规定:所有线程都可以访问同一个令牌对象,但只有访问时令牌对象状态属性为释放状态的那个线程,才能执行被锁定的代码,同时将令牌对象的状态属性更改为挂起。其余线程自动进入循环检测代码(在一个循环中不断检测令牌对象的状态),直到第一个对象访问完锁定代码,将令牌对象状态属性重新设置为释放状态,其余线程中的某一个才能检测到令牌对象已经释放并接着执行被锁定的代码,同时将令牌对象状态属性设置为挂起。
语法如下:
lock (对象引用) {
// 关键代码段
}
其中lock称为循环锁,访问的引用变量所引用的对象称为令牌对象,一对大括号中的代码称为关键代码段。如果同时有多个线程访问同一关键代码段,则可以保证每次同时只有一个线程可以执行这段代码,一个线程执行完毕后另一个线程才能解开锁并执行这段代码。
所以前面的那段代码可以改为:
double a = 10;
double b = 20;
lock (某对象引用) {
c = Math.Pow(a, 2);
c += Math.Pow(b, 2);
c = Math.Sqrt(c);
c /= Math.PI;
}
在.net Framework中,任意引用类型对象都可以作为令牌对象。
锁定使用起来很简单,关键在使用前要考虑锁定的颗粒度,也就是锁定多少行代码才能真正的安全。锁定的代码过少,可能无法保证完全同步,锁定的代码过多,有可能会降低系统执行效率(导致线程无法真正意义上的同时执行),我们举个例子,解释一下锁定的颗粒度:
程序界面设计如下:
图2 循环锁程序设计界面
程序运行效果图如下:
图3 程序运行效果图
源代码摘录如下:
FormMain.cs
using System;
using System.Drawing;
using System.Threading;
using System.Windows.Forms;
namespace Edu.Study.Multithreading.Lock {
///
/// 更新PictureBox背景色的委托
///
/// 要更改背景色的PictureBox对象在数组中的索引
/// 背景色
public delegate void ChangeRadioButtonHandler(int index, Color color);
///
/// 主窗体
///
public partial class FormMain : Form {
///
/// RadioButton的数组
///
private PictureBox[] picboxes = new PictureBox[10];
///
/// 线程1, 将picboxes数组中的PictureBox对象背景色逐个设置为红色
///
private Thread thread1 = null;
///
/// 线程1, 将picboxes数组中的PictureBox对象背景色逐个设置为绿色
///
private Thread thread2 = null;
///
/// 主窗体构造器
///
public FormMain() {
InitializeComponent();
// 初始化picboxes数组, 向其中存放PictureBox对象引用
for (int i = 0; i < this.picboxes.Length; ++i) {
PictureBox rb = new PictureBox();
// 设置PictureBox对象大小
rb.Size = new Size(50, 50);
// 设置PictureBox边框样式
rb.BorderStyle = BorderStyle.Fixed3D;
// 设置PictureBox背景色初始为白色
rb.BackColor = Color.White;
this.picboxes[i] = rb;
// 将PictureBox控件对象放置在流式布局面板上
this.mainFlowLayoutPanel.Controls.Add(rb);
}
// 根据控件的数量重新计算窗体宽度
this.Width =
this.mainFlowLayoutPanel.Padding.Left +
this.mainFlowLayoutPanel.Padding.Right +
this.picboxes.Length * (50 + this.picboxes[0].Margin.Left + this.picboxes[0].Margin.Right);
}
///
/// 实现ChangeRadioButtonHandler委托, 转换设置某个PictureBox控件背景色
///
/// 要更改背景色的PictureBox在数组中的索引
/// 背景色
private void ChangeRadioButton(int index, Color color) {
// 操作如下: 从this.picboxes数组中, 每次将index参数指定的PictureBox对象设置为参数color指定的颜色
// 并将前一个PictureBox对象背景色设置为白色
if (index == 0) { // 如果index参数为零, 表示数组中第一个PictureBox对象
// 将数组最后一个PictureBox对象背景色设置为白色
this.picboxes[this.picboxes.Length - 1].BackColor = Color.White;
} else { // 如果index参数不为零
// 将 index-1指定的PictureBox背景色设置为白色
this.picboxes[index - 1].BackColor = Color.White;
}
// 将index指定的PictureBox对象背景色设置为color参数指定的颜色
this.picboxes[index].BackColor = color;
}
///
/// 线程方法1, 展示颗粒度较小的锁定
///
/// 传入的参数对象, 这里为一个Color类的对象, 表示背景色
private void ThreadWorkTest1(object arg) {
try { // 用于退出线程的异常捕获结构
while (true) {
// 遍历this.picboxes数组
for (int i = 0; i < this.picboxes.Length; ++i) {
// 以当前Form类对象为令牌对象, 这次锁定发生在循环内
lock (this) {
// 执行ChangeRadioButton方法, 更改PictureBox的背景色
this.BeginInvoke(new ChangeRadioButtonHandler(this.ChangeRadioButton), i, arg);
Thread.Sleep(500);
}
}
}
} catch (ThreadAbortException) {
}
}
///
/// 线程方法2, 展示颗粒度较大的锁定
///
/// 传入的参数对象, 这里为一个Color类的对象, 表示背景色
private void ThreadWorkTest2(object arg) {
try { // 用于退出线程的异常捕获结构
while (true) {
// 以当前Form类对象为令牌对象, 这次锁定锁定整个循环
lock (this) {
// 遍历this.picboxes数组
for (int i = 0; i < this.picboxes.Length; ++i) {
// 执行ChangeRadioButton方法, 更改PictureBox的背景色
this.BeginInvoke(new ChangeRadioButtonHandler(this.ChangeRadioButton), i, arg);
Thread.Sleep(500);
}
}
}
} catch (ThreadAbortException) {
}
}
///
/// 退出线程
///
private void AbortThreads() {
// 如果线程1对象存在, 终止线程1对象
if (this.thread1 != null) {
// 取消线程运行
this.thread1.Abort();
// 等待线程结束
this.thread1.Join();
}
// 如果线程2对象存在, 终止线程2对象
if (this.thread2 != null) {
this.thread2.Abort();
this.thread2.Join();
}
}
///
/// "测试1"按钮事件
///
private void test1StartButton_Click(object sender, EventArgs e) {
// 终止上一次启动的线程
this.AbortThreads();
// 初始化线程1, 使用ThreadWorkTest1方法作为入口方法
this.thread1 = new Thread(new ParameterizedThreadStart(this.ThreadWorkTest1));
// 初始化线程2, 使用ThreadWorkTest1方法作为入口方法
this.thread2 = new Thread(new ParameterizedThreadStart(this.ThreadWorkTest1));
// 启动线程1, 参数为红色, 表示线程1将picboxes数组中的对象改为红色
this.thread1.Start(Color.Red);
// 启动线程2, 参数为绿色, 表示线程1将picboxes数组中的对象改为绿色
this.thread2.Start(Color.Green);
}
///
/// "测试2"按钮事件
///
private void test2StartButton_Click(object sender, EventArgs e) {
// 终止上一次启动的线程
this.AbortThreads();
// 初始化线程1, 使用ThreadWorkTest2方法作为入口方法
this.thread1 = new Thread(new ParameterizedThreadStart(this.ThreadWorkTest2));
// 初始化线程2, 使用ThreadWorkTest2方法作为入口方法
this.thread2 = new Thread(new ParameterizedThreadStart(this.ThreadWorkTest2));
// 启动线程1, 参数为红色, 表示线程1将picboxes数组中的对象改为红色
this.thread1.Start(Color.Red);
// 启动线程2, 参数为绿色, 表示线程1将picboxes数组中的对象改为绿色
this.thread2.Start(Color.Green);
}
///
/// 窗体关闭事件
///
private void FormMain_FormClosing(object sender, FormClosingEventArgs e) {
// 终止并等待所有的辅助线程
AbortThreads();
}
}
}
几点说明:
通过上述的例子,一方面思考循环锁的作用;一方面考虑调整循环锁的锁定颗粒度对程序带来的影响。将104行线程休眠代码移出关键代码段(即移动到lock结束大括号之后),运行代码,查看运行结果,思考原因。