KayChanGeek

OpenMP并行程序设计—for循环并行化详解

转载请声明出处http://blog.csdn.net/zhongkejingwang/article/details/40018735

在C/C++中使用OpenMP优化代码方便又简单，代码中需要并行处理的往往是一些比较耗时的for循环，所以重点介绍一下OpenMP中for循环的应用。个人感觉只要掌握了文中讲的这些就足够了，如果想要学习OpenMP可以到网上查查资料。

工欲善其事，必先利其器。如果还没有搭建好omp开发环境的可以看一下OpenMP并行程序设计——Eclipse开发环境的搭建

首先，如何使一段代码并行处理呢？omp中使用parallel制导指令标识代码中的并行段，形式为：

#pragma omp parallel

{

每个线程都会执行大括号里的代码

}

比如下面这段代码：

[cpp]  view plain  copy 
     
#include   
#include "omp.h"  
using namespace std;  
int main(int argc, char **argv) {  
    //设置线程数，一般设置的线程数不超过CPU核心数，这里开4个线程执行并行代码段  
    omp_set_num_threads(4);  
#pragma omp parallel  
    {  
        cout << "Hello" << ", I am Thread " << omp_get_thread_num() << endl;  
    }  
}  

omp_get_thread_num()是获取当前线程id号

以上代码执行结果为：

[plain]  view plain  copy 
     
Hello, I am Thread 1  
Hello, I am Thread 0  
Hello, I am Thread 2  
Hello, I am Thread 3  

可以看到，四个线程都执行了大括号里的代码，先后顺序不确定，这就是一个并行块。

带有for的制导指令：

for制导语句是将for循环分配给各个线程执行，这里要求数据不存在依赖。

使用形式为：

（1）#pragma omp parallel for

for()

（2）#pragma omp parallel

{//注意：大括号必须要另起一行

#pragma omp for

for()

}

注意：第二种形式中并行块里面不要再出现parallel制导指令，比如写成这样就不可以：

#pragma omp parallel

{

#pragma omp parallel for

for()

}

第一种形式作用域只是紧跟着的那个for循环，而第二种形式在整个并行块中可以出现多个for制导指令。下面结合例子程序讲解for循环并行化需要注意的地方。

假如不使用for制导语句，而直接在for循环前使用parallel语句：（为了使输出不出现混乱，这里使用printf代替cout）

[cpp]  view plain  copy 
     
#include   
#include   
#include "omp.h"  
using namespace std;  
int main(int argc, char **argv) {  
    //设置线程数，一般设置的线程数不超过CPU核心数，这里开4个线程执行并行代码段  
    omp_set_num_threads(4);  
#pragma omp parallel  
    for (int i = 0; i < 2; i++)  
        //cout << "i = " << i << ", I am Thread " << omp_get_thread_num() << endl;  
        printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
}  

输出结果为：

[plain]  view plain  copy 
     
i = 0, I am Thread 0  
i = 0, I am Thread 1  
i = 1, I am Thread 0  
i = 1, I am Thread 1  
i = 0, I am Thread 2  
i = 1, I am Thread 2  
i = 0, I am Thread 3  
i = 1, I am Thread 3  

从输出结果可以看到，如果不使用for制导语句，则每个线程都执行整个for循环。所以，使用for制导语句将for循环拆分开来尽可能平均地分配到各个线程执行。将并行代码改成这样之后：

[cpp]  view plain  copy 
     
#pragma omp parallel for  
    for (int i = 0; i < 6; i++)  
        printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  

输出结果为：

[cpp]  view plain  copy 
     
i = 4, I am Thread 2  
i = 2, I am Thread 1  
i = 0, I am Thread 0  
i = 1, I am Thread 0  
i = 3, I am Thread 1  
i = 5, I am Thread 3  

可以看到线程0执行i=0和1，线程1执行i=2和3，线程2执行i=4，线程3执行i=5。线程0就是主线程

这样整个for循环被拆分并行执行了。上面的代码中parallel和for连在一块使用的，其只能作用到紧跟着的for循环，循环结束了并行块就退出了。

上面的代码可以改成这样：

[cpp]  view plain  copy 
     
#pragma omp parallel  
    {  
#pragma omp for  
        for (int i = 0; i < 6; i++)  
            printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
    }  

这写法和上面效果是一样的。需要注意的问题来了：如果在parallel并行块里再出现parallel会怎么样呢？回答这个问题最好的方法就是跑一遍代码看看，所以把代码改成这样：

[cpp]  view plain  copy 
     
#pragma omp parallel  
    {  
#pragma omp parallel for  
        for (int i = 0; i < 6; i++)  
            printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
    }  

输出结果：

[cpp]  view plain  copy 
     
i = 0, I am Thread 0  
i = 0, I am Thread 0  
i = 1, I am Thread 0  
i = 1, I am Thread 0  
i = 2, I am Thread 0  
i = 2, I am Thread 0  
i = 3, I am Thread 0  
i = 3, I am Thread 0  
i = 4, I am Thread 0  
i = 4, I am Thread 0  
i = 5, I am Thread 0  
i = 5, I am Thread 0  
i = 0, I am Thread 0  
i = 1, I am Thread 0  
i = 0, I am Thread 0  
i = 2, I am Thread 0  
i = 1, I am Thread 0  
i = 3, I am Thread 0  
i = 2, I am Thread 0  
i = 4, I am Thread 0  
i = 3, I am Thread 0  
i = 5, I am Thread 0  
i = 4, I am Thread 0  
i = 5, I am Thread 0  

可以看到，只有一个线程0，也就是只有主线程执行for循环，而且总共执行4次，每次都执行整个for循环！所以，这样写是不对的。

当然，上面说的for制导语句的两种写法是有区别的，比如两个for循环之间有一些代码只能有一个线程执行，那么用第一种写法只需要这样就可以了：

[cpp]  view plain  copy 
     
#pragma omp parallel for  
    for (int i = 0; i < 6; i++)  
        printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
    //这里是两个for循环之间的代码，将会由线程0即主线程执行  
    printf("I am Thread %d\n", omp_get_thread_num());  
#pragma omp parallel for  
    for (int i = 0; i < 6; i++)  
        printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  

离开了for循环就剩主线程了，所以两个循环间的代码是由线程0执行的，输出结果如下：

[cpp]  view plain  copy 
     
i = 0, I am Thread 0  
i = 2, I am Thread 1  
i = 1, I am Thread 0  
i = 3, I am Thread 1  
i = 4, I am Thread 2  
i = 5, I am Thread 3  
I am Thread 0  
i = 4, I am Thread 2  
i = 2, I am Thread 1  
i = 5, I am Thread 3  
i = 0, I am Thread 0  
i = 3, I am Thread 1  
i = 1, I am Thread 0  

但是如果用第二种写法把for循环写进parallel并行块中就需要注意了！

由于用parallel标识的并行块中每一行代码都会被多个线程处理，所以如果想让两个for循环之间的代码由一个线程执行的话就需要在代码前用single或master制导语句标识，master由是主线程执行，single是选一个线程执行，这个到底选哪个线程不确定。所以上面代码可以写成这样：

[cpp]  view plain  copy 
     
#pragma omp parallel  
    {  
#pragma omp for  
        for (int i = 0; i < 6; i++)  
            printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
#pragma omp master  
        {  
            //这里的代码由主线程执行  
            printf("I am Thread %d\n", omp_get_thread_num());  
        }  
#pragma omp for  
        for (int i = 0; i < 6; i++)  
            printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
    }  

效果和上面的是一样的，如果不指定让主线程执行，那么将master改成single即可。

到这里，parallel和for的用法都讲清楚了。接下来就开始讲并行处理时数据的同步问题，这是多线程编程里都会遇到的一个问题。

为了讲解数据同步问题，先由一个例子开始：

[cpp]  view plain  copy 
     
#include   
#include "omp.h"  
using namespace std;  
int main(int argc, char **argv) {  
    int n = 100000;  
    int sum = 0;  
    omp_set_num_threads(4);  
#pragma omp parallel  
    {  
#pragma omp for  
        for (int i = 0; i < n; i++) {  
            {  
                sum += 1;  
            }  
        }  
    }  
    cout << " sum = " << sum << endl;  
}  

期望的正确结果是100000，但是这样写是错误的。看代码，由于默认情况下sum变量是每个线程共享的，所以多个线程同时对sum操作时就会因为数据同步问题导致结果不对，显然，输出结果每次都不同，这是无法预知的，如下：

[cpp]  view plain  copy 
     
第一次输出sum = 58544  
第二次输出sum = 77015  
第三次输出sum = 78423  

那么，怎么去解决这个数据同步问题呢？解决方法如下：

方法一：对操作共享变量的代码段做同步标识

代码修改如下：

[cpp]  view plain  copy 
     
#pragma omp parallel  
    {  
#pragma omp for  
        for (int i = 0; i < n; i++) {  
            {  
#pragma omp critical  
                sum += 1;  
            }  
        }  
    }  
    cout << " sum = " << sum << endl;  

critical制导语句标识的下一行代码，也可以是跟着一个大括号括起来的代码段做了同步处理。输出结果100000

方法二：每个线程拷贝一份sum变量，退出并行块时再把各个线程的sum相加

并行代码修改如下：

[cpp]  view plain  copy 
     
#pragma omp parallel  
    {  
#pragma omp for reduction(+:sum)  
        for (int i = 0; i < n; i++) {  
            {  
                sum += 1;  
            }  
        }  
    }  

reduction制导语句，操作是退出时将各自的sum相加存到外面的那个sum中，所以输出结果就是100000啦~~

方法三：这种方法貌似不那么优雅

代码修改如下：

[cpp]  view plain  copy 
     
int n = 100000;  
    int sum[4] = { 0 };  
    omp_set_num_threads(4);  
#pragma omp parallel  
    {  
#pragma omp for  
        for (int i = 0; i < n; i++) {  
            {  
                sum[omp_get_thread_num()] += 1;  
            }  
        }  
    }  
    cout << " sum = " << sum[0] + sum[1] + sum[2] + sum[3] << endl;  

每个线程操作的都是以各自线程id标识的数组位置，所以结果当然正确。

数据同步就讲完了，上面的代码中for循环是一个一个i平均分配给各个线程，如果想把循环一块一块分配给线程要怎么做呢？这时候用到了schedule制导语句。下面的代码演示了schedule的用法：

[cpp]  view plain  copy 
     
#include   
#include "omp.h"  
#include   
using namespace std;  
int main(int argc, char **argv) {  
    int n = 12;  
    omp_set_num_threads(4);  
#pragma omp parallel  
    {  
#pragma omp for schedule(static, 3)  
        for (int i = 0; i < n; i++) {  
            {  
                printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());  
            }  
        }  
    }  
}  

上面代码中for循环并行化时将循环很多很多块，每一块大小为3，然后再平均分配给各个线程执行。

输出结果如下：

[cpp]  view plain  copy 
     
i = 6, I am Thread 2  
i = 3, I am Thread 1  
i = 7, I am Thread 2  
i = 4, I am Thread 1  
i = 8, I am Thread 2  
i = 5, I am Thread 1  
i = 0, I am Thread 0  
i = 9, I am Thread 3  
i = 1, I am Thread 0  
i = 10, I am Thread 3  
i = 2, I am Thread 0  
i = 11, I am Thread 3  

从输出结果可以看到：线程0执行i=0 1 2，线程1执行i=3 4 5，线程2执行i=6 7 8，线程3执行i=9 10 11，如果后面还有则又从线程0开始分配。

OK，for循环并行化的知识基本讲完了，还有一个有用的制导语句barrier，用它可以在并行块中设置一个路障，必须等待所有线程到达时才能通过，这个一般在并行处理循环前后存在依赖的任务时使用到。

RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
iOS线程安全数组
iOS-SDK只提供了非线程安全的数组。如果要多线程并发的使用一个数组对象就必须要加锁，平凡的加锁使得代码的调用非常的麻烦。我们需要多线程的读写锁在类的内部实现，所以需要对NSMutableArray进行封装，封装后的对象负责接受所有事件并将其转发给真正的NSMutableArrayiOS-SDK只提供了非线程安全的数组。如果要多线程并发的使用一个数组对象就必须要加锁，平凡的加锁使得代码的调用非常
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
Qualcomm Hexagon DSP 与 AI Engine 架构深度分析：从微架构原理到 Android 部署实战观熵国产 NPU ×Android 推理优化人工智能架构 android
QualcommHexagonDSP与AIEngine架构深度分析：从微架构原理到Android部署实战关键词QualcommHexagon、AIEngine、HTA、HVX、HMX、Snapdragon、DSP推理加速、AIC、QNNSDK、Tensor编排、AndroidNNAPI、异构调度摘要HexagonDSP架构是QualcommSnapdragonSoC平台中长期演进的异构计算核心之一
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
c++中如何排查死锁三月微风 c++java 开发语言
排查死锁（deadlock）是多线程C++开发中的一项核心调试技能，死锁通常是因为多个线程交叉持有资源而相互等待导致程序卡死。下面详细讲讲如何排查和预防死锁：一、死锁的常见成因锁获取顺序不一致（最常见）多个互斥量之间相互等待一个线程尝试多次加锁同一个非递归互斥锁忘记释放锁条件变量使用错误（如wait时未持锁）二、排查死锁的方法✅1.日志调试法在加锁和解锁前后打日志，确认：哪些线程获取了锁哪个线程卡
C#常见面试题 rapLiu java 开发语言
1.i++中为什么用到锁在C#中，i++通常不需要用锁，因为i++操作本身是一个原子操作。原子操作是指一个操作要么完全执行，要么完全不执行，不会被中断。因此，在单线程环境下，i++操作是安全的。然而，在多线程环境下，如果多个线程同时对i进行++操作，就可能会出现竞争条件（racecondition），导致数据不一致或错误的结果。为了避免这种情况，需要使用锁来保护i的操作，确保在同一时刻只有一个线程
使用内联汇编实现CAS操作（含详细讲解）（Charon）汇编
在多线程环境下，如何安全地更新共享变量，一直是一个重要的话题。今天，我们通过一段使用内联汇编实现的CAS（CompareAndSwap）代码，深入学习它的原理和用法。完整示例代码如下：#include//标准输入输出头文件#include//pthread多线程编程相关头文件#include//usleep函数需要的头文件#defineTHREAD_COUNT10//定义线程数量为10volati
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
UDP并发服务器之多进程并发
一、常见的服务器类型在网络程序里面，通常都是一个服务器处理多个客户端。为了处理多个客户端的请求,服务器端程序有不同的处理方式。1.迭代服务器大多数UDP都是迭代运行，服务器等待客户端的数据，收到数据后处理该数据，送回其应答，在等待下一个客户端请求。2.并发服务器并发服务器是指在同一个时刻可以响应多个客户端的请求本质是创建多进程/多线程，对多数用户的信息进行处理UDP协议一般默认是不支持多线程并发的
【医学影像】无痛安装mamba 周树皮医学影像 python
去年编辑的一个帖子。摆了一段时间后重新回归，发送一下作为状态分界线。很癫狂的体验，man，whatcanisay！issue查看我的狗急跳墙状态1.确定版本cudanvcc-Vpythonpython--versiontorchpipshowtorch2.下载对应版本wheelcausal-conv1d：https://github.com/Dao-AILab/causal-conv1d/rele
Java多线程吴鹰飞侠 java 开发语言
多线程是指一个程序中有多个执行路径（线程），每个线程并发运行，彼此独立，执行不同的任务。一个线程是程序中的基本执行单位。创建和启动线程1.通过继承Thread类classMyThreadextendsThread{@Overridepublicvoidrun(){System.out.println("线程正在执行...");}}publicclassMain{publicstaticvoidma
Python 实战：构建本地多线程定时任务调度器 xiaocainiao881 python 开发语言
引言在企业自动化流程、数据周期更新、本地脚本执行等场景中，定时任务调度器是不可或缺的一类工具。尽管Linux有crontab，Windows有任务计划，但它们不够灵活，缺乏图形界面，不适合动态启停、可视化控制等需求。本文将带你实现一个本地运行的多线程定时任务调度器，具备以下功能：一、项目功能说明1.1功能亮点多任务并行运行（非阻塞）每个任务支持独立间隔设置支持任务启动/停止/删除/修改支持即时日志
多线程学习
文章目录程序、进程、线程线程的创建和使用继承Thread类实现Runnable接口比较创建线程的两种方式Thread类的有关方法线程的优先级获取和设置当前线程的优先级说明线程的生命周期线程的同步Synchronized的使用方法同步机制中的锁释放锁的操作线程的死锁问题synchronized与Lock的异同线程的通信JDK5.0新增线程创建方式创建线程的方式三:实现Callable接口创建线程的方
【操作系统】线程 Brookty JavaEE linux java java-ee 学习服务器操作系统后端
JavaEE—线程一、进程与线程1.包含管理2.资源布局2.1公共资源2.2私有资源二、并发编程1.多线程优势1.1创建1.1.1多线程1.1.2多进程1.2通信1.2.1多线程1.2.2多进程1.3调度1.3.1多线程1.3.2多进程1.4销毁1.4.1多线程1.4.2多进程2.多进程优势2.1安全性2.1.1多进程2.1.2多线程2.2稳定性2.2.1多进程2.2.2多线程三、线程数量1.调度
多线程在Java项目中的使用案例(笔记) 车车不吃香菇 java基础 java
多线程在Java项目中的使用案例(笔记)实现runnable接口@OverridepublicBooleanaddMeetingExpertIds(MeetAddExpertDtomeetAddExpertDto,LonguserId){//会议关联到专家//如果需要发给专家newThread(newRunnable(){@Overridepublicvoidrun(){try{if(meetAd
HTTP性能压测工具wrk应用实战
背景:wrk是当今最流行的HTTP压测工具，用于模拟高并发情况下的HTTP请求。wrk使用Lua作为脚本语言，可以通过编写Lua脚本来自定义请求的参数和逻辑。它支持多线程并发请求，并提供了丰富的统计信息和报告，可以帮助你评估服务器的性能和承受能力。本贴致力于最快速让你上手wrk。看完本贴，你将学会使用wrk对http接口进行压测,并计算其TPS指标。安装wrk(需要在linux系统上)命令行输入一
jetson agx orin 刷机、cuda、pytorch配置指南【亲测有效】
jetsonagxorin刷机指南注意事项刷机具体指南cuda环境配置指南Anconda、Pytorch配置注意事项1.使用设备自带usbtoc的传输线时，注意c口插到orin左侧的口，右侧的口不支持数据传输；2.刷机时需准备ubuntu系统，可以是虚拟机，注意安装SDKManager刷机时，JetPack版本要选对，JetPack6.0的对应ubuntu22，cuda12版本，对应pytorch
SQL Server通过CLR连接InfluxDB实现异构数据关联查询技术指南 Favor_Yang SQL调优及高级SQL语法编写 SQL Server InfluxDB
一、背景与需求场景在工业物联网和金融监控场景中，实时时序数据（InfluxDB）需与业务元数据（SQLServer）联合分析：工业场景：设备传感器每秒采集温度、振动数据（InfluxDB），需关联工单状态、设备型号（SQLServer）金融场景：交易流水时序数据（每秒万条）需实时匹配客户风险等级、账户余额（SQLServer）核心痛点：传统ETL延迟高，无法满足实时风控/故障诊断需求，需实现毫秒级
Yolov5-obb(旋转目标poly_nms_cuda.cu编译bug记录及解决方案)
关于在执行pythonsetup.pydevelop#or"pipinstall-v-e."时poly_nms_cuda.cu报错问题。前面步骤严格按照install.md环境1.pytorch版本较低时（我的是1.10）：poly_nms_cuda.cu文件添加”#defineeps1e-8“，删除“constdoubleeps=1E-8;”这句2.pytorch版本较高时（我用的是1.27）h
每天一个前端小知识 Day 28 - Web Workers / 多线程模型在前端中的应用实践蓝婷儿前端面试前端
WebWorkers/多线程模型在前端中的应用实践一、为什么前端需要多线程？单线程JS的瓶颈：浏览器主线程不仅负责执行JS，还要负责：UI渲染（DOM/CSS）用户事件处理（点击、输入）一旦JS执行耗时任务（如大数组处理、加密运算），会阻塞页面响应多线程的意义：✅把计算密集型或IO密集型任务移出主线程，防止“卡死”✅实现离线计算、并发执行、后台数据同步✅提升用户体验、增强系统鲁棒性二、前端中的“线
异步进阶：C#的Task.WhenAll——如何开启多个异步任务
Task.WhenAll是.NET中用于并行等待多个异步任务的核心方法。它可以让多个异步操作同时执行，然后一次性等待所有任务完成，而不是逐个等待。asyncvoidMain(){//准备数据：[1,2,3,4,5,6,7,8,9,10]varinputs=Enumerable.Range(1,10).ToArray();varoutputs=newList();//❌错误方式：串行执行（一个接一个
TestNG-自动化测试框架
一、TestNG简介TestNG是一套开源的单元测试框架，它的灵感来源于JUnit，但其功能比JUnit强大，它支持更多的注解、并行测试、更多的参数化方法等。TestNG和JUnit都是java中常用的单元测试框架，二者的共同点有：都是基于注解的测试框架都可以对java代码进行单元测试都支持断言机制TestNG相较于JUnit有如下特点：TestNG支持更多的注解；TestNG支持并行测试，在测试
Go从入门到精通（19）-协程（goroutine）与通道（channel）
Go从入门到精通（19）协程（goroutine）与通道（channel）文章目录Go从入门到精通（19）前言并发、并行和协程什么是协程使用GOMAXPROCS基本概念如何设置GOMAXPROCS适用场景性能调优建议示例：对比不同GOMAXPROCS的性能小结协程间的信道概念通信操作符synchronous,unbuffered(阻塞）value>0->asynchronous,buffered（
使用 Docker 搭建 Python（Flask/CUDA AI）开发环境——AI教你学Docker
使用Docker搭建Python（Flask/CUDAAI）开发环境及常用中间件配置详解本指南适用于用Docker快速搭建Python（FlaskWeb应用或包含CUDA的AI开发环境）开发环境，并集成常用中间件服务如MySQL、Redis、Kafka。适合个人开发、本地测试和小团队协作。一、项目目录结构建议project-root/├──app/#Python应用源码目录│├──Dockerfi
显卡GPU的架构和工作原理 InnoLink_1024 芯片人工智能 AGI 架构硬件架构人工智能
显卡GPU（图形处理单元）是专为并行计算和图形处理设计的芯片，广泛应用于游戏、科学计算、人工智能和数据中心等领域。以下详细介绍GPU的架构和工作原理，涵盖核心组件、计算流程和关键技术，尽量简洁清晰。一、GPU架构概述GPU架构与CPU不同，专注于高并行计算，适合处理大量简单、重复的任务。其核心设计目标是最大化吞吐量，而非单任务的低延迟。主流GPU厂商（如NVIDIA、AMD、Intel）架构虽有差
解决ptmalloc2内存过大的三种方案迎风追日 JVM linux c语言
除了JVM负责管理的堆内存外，Java还拥有一些堆外内存，由于它不使用JVM的垃圾回收机制，所以更稳定、持久，处理IO的速度也更快。这些堆外内存就会由C库内存池负责分配，这是Java受到C库内存池影响的原因。进程申请内存的速度，以及总内存空间都受到C库内存池的影响，JVM的堆外内存会先走内存池，内存池选择策略：如果主要分配256KB以下的内存，特别是在多线程环境下，应当选择TCMalloc；否则应
java多线程pdf_Java多线程编程实战指南(核心篇) 中文pdf扫描版[172MB] art Scien java多线程pdf
随着现代处理器的生产工艺从提升处理器主频频率转向多核化，即在一块芯片上集成多个处理器内核(Core)，多核处理器(MulticoreProcessor)离我们越来越近了——如今就连智能手机这样的消费类设备都已配备了4核乃至8核的处理器，更何况商用系统！在此背景下，以往靠单个处理器自身处理能力的提升所带来的软件计算性能提升的那种“免费午餐”已不复存在，这使得多线程编程在充分利用计算资源、提高软件服务
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

OpenMP并行程序设计—for循环并行化详解

你可能感兴趣的:(异构并行,CUDA,OpenCL,OpenMP,OpenMP,多线程)