数据并行是指对源集合或数组中的元素同时(并行)执行相同操作的情况。数据进行并行操作过程中,将对源集合进行分区,以便多个线程能够同时对不同的片段进行操作。
使用线程本地变量存储和检索有For循环创建的每个单独任务中的状态。通过使用线程本地数据,您可以避免将大量的访问同步为共享状态的开销。 在任务的所有迭代完成之前,您将计算和存储值,而不是写入每个迭代上的共享资源。 然后,您可以将最终结果一次性写入共享资源,或将其传递到另一个方法。
class Program
{
static void Main()
{
int[] nums = Enumerable.Range(0, 1000000).ToArray();
long total = 0;
Parallel.For<long>(0, nums.Length, () => 0, //线程本地变量初始值
(j, loop, subtotal) =>
{
subtotal += nums[j];
return subtotal;//线程本地变量返回值
},
(x) => Interlocked.Add(ref total, x)//当此线程上的所有迭代均已完成后,将调用该方法一次
);
Console.WriteLine("The total is {0}", total);
Console.WriteLine("Press any key to exit");
Console.ReadKey();
}
}
当 For 循环的循环体很小时,它的执行速度可能比等效的顺序循环更慢。 对数据进行分区所涉及的开销以及调用每个循环迭代上的委托的开销导致了性能降低。 为了解决类似情况,Partitioner
类提供 Partitioner.Create
方法,该方法使您可以为委托体提供顺序循环,以便每个分区只调用一次委托,而不是每个迭代调用一次委托。
static void Main()
{
var source = Enumerable.Range(0, 100000).ToArray();
var rangePartitioner = Partitioner.Create(0, source.Length);
double[] results = new double[source.Length];
System.Diagnostics.Stopwatch watch = new System.Diagnostics.Stopwatch();
watch.Start();
Parallel.ForEach(rangePartitioner, (range, loopState) =>
{
for (int i = range.Item1; i < range.Item2; i++)
{
results[i] = source[i] * Math.PI;
}
});
watch.Stop();
Console.WriteLine("优化并行后需要时间:"+watch.Elapsed);
results = new double[source.Length];
watch.Restart();
Parallel.ForEach(source, (i, loopState) =>
{
results[i] = source[i] * Math.PI;
});
watch.Stop();
Console.WriteLine("并行需要时间:" + watch.Elapsed);
results = new double[source.Length];
watch.Restart();
for (int i = 0; i < source.Length; i++)
{
results[i] = source[i] * Math.PI;
}
watch.Stop();
Console.WriteLine("正常时间:" + watch.Elapsed);
Console.ReadKey();
}