张小殊.

AMD HIP并行编程语言及其矢量相加实例——一文带你快速入门

　　✍️写在前面：随着计算的应用场景变得日益复杂多样，为了跟上人工智能算法对算力的需求，GPU硬件架构快速走向多样化，GPU生产厂家众多，且在商业和市场等因素的影响下，GPU通用计算编程模型也日益多元化。因此，并行编程语言的种类也变得繁杂，AMD作为一家在CPU和GPU领域都有较大影响力的企业，自然有属于自己成熟的计算生态，而HIP就是一个像CUDA一样的并行编程语言，但是目前网上关于HIP的资料并不是很多，所以我决定写一篇关于HIP并行编程基础的文章，希望这篇文章可以带大家快速入门。

　　这里先沾上目录：

概述&背景

HIP编程模型

HIP编程结构

内存和线程管理

核函数的启动和编写

基于HIP的并行程序设计步骤

HIP程序示例-基于HIP的并行矢量相加

HIP时间计时API

概述&背景

　　AMD 的 GPU 早期主要使用 OpenCL 来开发，后来为了提高开发效率，借鉴了很多 CUDA 的设计理念，推出了支持HIP（ Heterogeneous-Computing Interface for Portability ）和 OpenCL 编程的 ROCm 框架。ROCm在设计风格上类似于CUDA，提供了非常丰富的开发工具，包括 HCC编译器，性能分析工具rocProf，数学库如rocBLAS、rocFFT、rocSOLVER、rocSPARSE、rocRand、深度学习库MIopen等。

　　HIP 是一个C++运行时API和内核语言，使用HIP编程模型编写的异构程序可以同时在类GPU加速卡平台和 NVIDIA GPU上运行。AMD HIP API接口与CUDA API相似。如图1所示。当涉及在 NVIDIA GPU 编译时HIP充当了CUDA之上的一个精简代理层，且其 Runtime API 兼容 CUDA runtime API。 ROCm 还提供了将CUDA应用程序通过使用HIPIFY工具自动转换为HIP内核语言及运行API的功能，当然，这种转码一般还需要手动进一步调整和优化代码。

图1 HIP栈和CUDA栈的比较

其中，HIP具有以下特点：

　　1. 是开源的

　　2. 为应用程序提供 API，以利用AMD和CUDA设备的GPU加速。

　　3. 在语法上类似于CUDA。大多数CUDA API调用都可以就地转换：cuda -> hip

　　4. 支持强大的 CUDA 运行时功能子集。

HIP编程模型

　　HIP是一种基于AMD ROCm生态的并行计算平台和编程语言。你可以像编写C或C++语言程序一样实现算法和程序的并行性。同时，你也可以在类GPU加速平台和NVIDIA GPU上运行，本文将通过向量加法这个简单的例子来展示如何编写一个HIP程序，让你快速上手。

HIP编程结构

　　通常在主机（CPU）端以串行代码为主，主要控制程序的逻辑。在设备（GPU）端通常以并行代码为主，主要实现代码的快速并行计算，而在设备（GPU）端设计和开发的代码被称之为内核代码，它是运行在设备端（GPU）上的。

一个典型的HIP程序实现流程应该遵循以下模式：

把数据从CPU内存拷贝到GPU显存；
调用和核函数对储存在GPU显存中的数据进行操作；
将数据从GPU显存传送回CPU内存；

　　如图2所示。串行代码通常在主机CPU上执行，而并行代码在设备GPU上执行。用户可以将所有的代码统一的放在一个源文件中，然后通过HIP的编译器HCC为主机端和设备端生成可执行的代码。

图2 HIP程序执行流程

　　HIP程序实现流程首先要把数据从CPU内存拷贝到GPU显存，数据在GPU操作结束后，又要将数据从GPU显存传送回CPU内存。因此首先要了解的就是内存和显存的管理，即如何将数据在主机和设备端进行传输和通信。以及内存和显存的分配方式。

内存和线程管理

　　HIP并行编程语言的内存分配和管理与标准C函数基本相同，只是前面需要加上hip前缀。下面具体的来看一下内存分配和释放API的一个实例，假设要为一个有N个浮点类型元素的数组分配内存，主机端和设备端的分配方式如下代码所示：

size_t size = N * sizeof(float);
float *h_A= NULL, *d_A = NULL;
float *h_A = (float *)malloc(size);  //分配主机端内存h_A
hipMalloc((void **)&d_A, size);  //分配设备端显存d_A

　　除了为主机端和设备端的数据分配内存和显存。在执行设备端代码的过程中，往往需要将主机端的数据传输到设备端预先分配好的显存之中。这一操作通过hipMemcpy进行实现，其定义如下所示：

hipError_t hipMemcpy(void *dist, const void* src,size_t count, hipMemcpyKind kind)

　　其中此函数从src指向的源储存区复制一定数量的字节到dist指定的目标储存区，复制的方向由kind指定，其中数据传输和通信对应四种kind类型为：

数据通信方向	kind
主机端到设备端	hipMemcpyHostToDevice
设备端到主机端	hipMemcpyDeviceToHost
主机端到主机端	hipMemcpyHostToHost
设备端到设备端	hipMemcpyDeviceToDevice

　　将数据从主机端传到设备端和从设备端传到主机端是不同的kind。因此在具体使用的过程中，注意不能混淆顺序。数据从主机端传到设备端和从设备端传到主机端的具体代码示例如下所示：

hipMemcpy(d_A,h_A,size,hipMemcpyHostToDevice)
hipMemcpy(h_A,d_A,size,hipMemcpyDeviceToHost);

　　上述代码的第一句将h_A中的数据从CPU端传输到设备端的显存d_A上，而第二句将将显存中d_A的数据从GPU端传输到设备端的h_A上，通过以上的数据传输API，便可以很容易的控制数据在主机端与设备端的通信和传输。

　　另外，在一个并行HIP程序中，有关内存的操作除了内存分配以及数据传输，程序的最后一定不能忘记释放在程序中申请的内存和显存空间，其中，主机端内存和设备端的显存释放如下代码所示：

hipFree(d_A);
free(h_A);

　　当你设计的内核函数在设备端进行计算时，设备中会产生大量的线程，并且每个线程都会按照之前设计好的核函数语法进行计算和控制，HIP沿用了CUDA的线程层次结构设计。将线程的层次进行抽象以便开发者组织线程。具体的，主要是一个三层的线程层次结构。从大到小依次是线程块网络，线程块，线程。其结构如图3所示。

图3 HIP的线程组织结构

　　当启动内核函数在设备端进行计算时所产生的所有线程组成线程块网络。线程块网络中的所有线程共享相同的全局内存空间。线程块网络的维度大小由参数hipGirdDim定义。用于表示一个线程块网络中线程块的维度信息。它是一个dim3类型变量，dim3是基于uint定义的整数行向量，用来表示维度。当定义一个dim类型的变量时，所有未制定的元素都被初始化为1。Dim3类型变量中的每个组件可以通过它的x、y、z字段获得，如下所示：

hipGirdDim.x, hipGirdDim.y, hipGirdDim.z

　　线程块网络是由线程块组成的。线程块的维度由hipBlockDim参数定义。用于表示一个线程块中线程的维度信息。它和girdDim一样是一个dim3类型变量，因此，对于hipBlockDim中的每个组件同样可以通过它的x、y、z字段获得，如下所示：

bhpBlockDim.x, hipBlockDim.y, hipBlockDim.z

　　另外，并行程序的开发过程中通常需要确定线程块在线程网络中的位置信息，HIP为此提供了相应的API方法，它在线程块中的索引由参数hipBlockIdx决定。该坐标变量是基于uint3定义的内置的向量类型，它是一个包含三个无符号整数的结构，可以通过x、y、z三个字段来指定。即线程块在线程网络中的位置信息由以下三个变量所组合成的坐标确定：

(hipBlockIdx.x, hipBlockIdx.y, hipBlockIdx.z)

　　而线程块是由多线程组成的。和参数hipBlockIdx类似，一个线程在线程块中的索引由参数hipThreadIdx决定。即线程在线程块中的位置信息由以下三个变量所组合成的坐标确定：

(hipThreadIdx.x, hipThreadIdx.y, hipThreadIdx.z)

　　另外，在上述的示例中，都是以三维的网络和块进行说明。在实际并行程序开发过程中，可以根据实际情况组织二维的网络和块或一维的网络和块。

　　同时，在具体的并行程序开发过程中。通常需要事先指定需要开辟的线程网络的维度和大小以及线程块的维度和大小信息。可以通过以下的方式进行定义。

dim3 blockDim（10）；
dim3 gridDim（10）；

　　上述示例代码定义了一个一维的网络和块，共有10个Block，每个Block有10个Thread，同样的二维和三维可以通过增加（）中的数据维度进行定义，例如dim3 block（10，10）表示每个Block有100个（10× 10）Thread。

核函数的启动和编写

　　在传统的C语言编程中，假如你定义了一个函数Function_name（argument list）。那么之后在需要用到这个函数功能的时候，只需要调用即可。调用的形式如下代码所示。

Function_name（argument list）

　　而对于HIP来说。它是基于C语言的延伸。因此它的调用语句和C函数相似，具体如下所示。

hipLaunchKernelGGL(argument list);

　　其中，参数列表包括核函数名、网络和块布局、共享内存的大小以及核函数所带的参数，在上述的调用语句代码的参数列表中。需要指定girdDim、blockDim这两个参数。第1个参数是网络的维度和大小，也就是需要启动的线程块的数量。第2个参数是线程块的维度和大小，也就是需要启动的每个块中的线程的个数。正如上面提到的在进行实际的并行应用程序开发时，需要事先指定这两个参数的维度和大小。这样可以方便开发者调用和管理线程。
　　同一个线程块中的线程往往可以相互协作，不同块之间的线程不能协作。对于一个给定的实际问题，可以使用不同的网络和块布局来组织线程。例如。需要实现256× 4096个元素的计算。每256个元素一个块，启动4096个块。图4表明了上述配置的线程分布。以及线程组织结构中各个参数大小。

图4 线程配置和结构分布图

　　在设备端的全局内存中，因为数据是线性存储的。通常使用线程的全局索引来表示线程的全局位置，对于二维网络和块布局来说，此位置的数值可以由下式推出

Index_x= hipBlockIdx.x* hipBlockDim.x+ hipThreadIdx.x
Index_y= hipBlockIdx.y* hipBlockDim.y+ hipThreadIdx.y

　　得到上述线程的全局位置索引后，便可以使用这一索引信息来进行并行程序的算法控制。

　　核函数通常是在设备端运行的代码。因此在算法的设计过程中，通常将需要高度并行的相同计算操作设计成核函数。当核函数被调用时，不同的线程同步执行这一过程，从而达到提高计算效率的目的。核函数的定义通常需要用声明。同时核函数必须有一个void返回类型，如下所示：

__global__ void KernelFunction_name (argument list)

　　下面来考虑一个简单的例子。假如要实现两个大小为numElements的向量相加。如果使用CPU进行串行程序设计。其代码如下所示：

void vectorAdd(float *h_A,float  *h_B,float  *h_C,int numElements)
{
     for(int i = 0; i < numElements; i++)
　　　    　h_C[i] = h_A[i] + h_B[i];
}

如果使用HIP进行并行程序设计。核函数如下所示：

__global__ void vectorAdd(float *d_A,float  *d_B,float  *d_C,int numElements)
{
	 int i = hipBlockIdx_x * hipBlockDim_x + hipThreadIdx_x;
	 if(i

 
  　　观察上述两个函数的代码，可以发现在GPU上设计的核函数没有了循环体，向量的索引通过不同线程的全局索引来进行确定，另外，如向量相加GPU核代码第4行所示，当所开辟出来的线程数大于所要计算的数组元素时，需要用if语句来进行判断。否则会导致数组越界的错误。 
  基于HIP的并行程序设计步骤 
  　　经过上文对HIP编程模型的理解，总结一下，HIP并行程序设计主要可分为以下5个步骤： 
  （1）分配内存（host和device） 
  　　Host：malloc() 
  　　Device：hipMalloc () 
  （2）从host将数据拷贝到device上 
  　　hipMemcpy（device_data,host_data,size_data,hipMemcpyHosttoDevice） 
  （3）调用Hip的核函数在device上完成指定的运算； 
  　　调用：hipLaunchKernelGGL(参数); 
  　　核函数：_global_void 核函数名(参数){函数体} 
  （4）将device上的运算结果拷贝到host上； 
  　　hipMemcpy（host_data,device_data, size_data,hipMemcpyDevicetoHost） 
  （5）释放分配的内存（device和host） 
  　　Host：free() 
  　　Device：hipFree() 
  HIP程序示例-基于HIP的并行矢量相加 
  　　根据前文中的内容，编写一个完整的矢量相加HIP并行代码，实现两个大小为numElements的向量相加的完整HIP并行代码。另外，由于HIP许多调用是异步进行的，所以有时可能很难确定某个错误是由哪一步的程序引起的。所以在代码开发的过程中，可以定义一个错误处理宏CHECK封装所有的HIP API调用。这可以简化错误检查的过程。编写完程序后，将程序文件命名为hip_vectorAdd.cpp，对这个代码文件进行编译和执行，具体的编译指令为hipcc hip_vectorAdd.cpp -o hip_vectorAdd。 
  　　代码如下所示： 
  #include 
#include 
#include 
#include 

__global__ void vectorAdd(float *d_A,float  *d_B,float  *d_C,int numElements)
 {
     int i = hipBlockIdx_x * hipBlockDim_x + hipThreadIdx_x;
     if(i 1e-8)
        {
            fprintf(stderr, "Result verification failed at element %d!\n", i);
            exit(EXIT_FAILURE);
        }
    }
 
//5.释放内存
      hipFree(d_A);
      hipFree(d_B);
      hipFree(d_C);
      free(h_A);
      free(h_B);
      free(h_C);
 
     return 0;
 }
 
  HIP时间计时API 
  　　最后，再提一下HIP中的异步记使API，帮助分析程序性能。在并行程序的开发中，往往需要对并行程序的运行时间进行测量从而验证和进一步开发性能，然而对于并行程序来说它是异步执行的，因此，单纯使用标准C语言的time计时往往不准确，HIP为此提供了专门的事件和计时API，HIP事件是hipEvent_t类型，通过hipEventCreate()和hipEventDestroy()进行事件的创建和销毁。事件创建后，就可以使用事件来记录并行程序的运行时间，具体有以下三个过程。 
  　　1. hipEventRecord()记录默认流事件。 
  　　2. hipEventSynchronize ()用来阻塞CPU执行直到指定的事件被记录。 
  　　3. hipEventElapsedTime()的第一个参数返回默认流事件start和默认流事件stop两个记录之间消逝的毫秒时间。 
   
  最后的最后，希望本文能为你带来帮助，如果你觉得有用，希望能三连支持，你的鼓励是我持续创作的动力！

初探Linux CPU动态调频与实测 He11o_Liu 操作系统 Linux CPUFreq CPU调频 Linux
关于本文主要涉及LinuxCPUFreq子系统是什么，为什么需要，怎么用。并解决在实际测试中遇到的三个问题：scaling_governor没有userspace的问题。/proc/cpuinfo与cpuinfo_cur_freq显示频率不同。无法针对单个核心调频并使一个CPU下的不同的核心运行在不同的频率下。参考资料Linux2.6内核中的最新电源管理技术综述_CPUFreqLinux动态频率调
【linux】linux缺少tar命令/-bash: tar：未找到命令乙卯年QAQ linux bash 运维
问题：-bash:tar：未找到命令原因这错误信息"-bash:tar:未找到命令"表示系统无法找到tar命令。tar命令是一个Linux/Unix系统下的打包压缩工具，它用于将多个文件合并为一个文件。如果系统报错找不到tar命令，可能是由于以下原因之一造成的：没有安装tar：在某些系统上，默认情况下并没有安装tar命令。你可以通过运行以下命令来安装tar：在Debian/Ubuntu上：sudo
Java 在包管理与模块化中的优势：与其他开发语言的比较 nbsaas-boot 开发语言 java
在开发复杂的、规模庞大的软件系统时，包管理和模块化设计起着至关重要的作用。它们不仅决定了代码的组织和可维护性，还直接影响到团队协作效率、扩展性和性能。在众多编程语言中，Java凭借其成熟的生态系统、强类型系统和标准化的包管理机制，成为了大型企业级应用开发的首选之一。本文将探讨Java在包管理和模块化方面的优势，并与其他流行语言（如Rust、Go、Python、JavaScript和C#）进行对比，
【新春特辑】2025年1月科技浪潮中的AI最新时事与科技趋势我的青春不太冷科技最新时事 AI大爆炸学习
2025年1月科技浪潮中的AI最新时事与科技趋势一、AI科技时事人工智能代理（AIAgent）的发展最新进展：人工智能代理正逐步成为科技领域的新热点。这些代理能够自主执行特定任务，如管理日程、回复邮件等。然而，它们仍面临可靠性、可访问性和安全性等方面的挑战。随着技术的不断进步，这些挑战有望逐步得到解决。未来展望：未来，AI代理将更加智能化，能够更好地理解用户需求并提供个性化服务。同时，它们也将成为
咱们一起学C++第四十篇：之C++递归与运算符基础一杯年华@编程空间咱们一起学习C++c++struts kafka intellij-idea spring cloud spring boot java-ee
咱们一起学C++第四十篇：之C++递归与运算符基础在C++学习的征程中，我们共同努力，不断探索这门语言的深度与广度。此前，我们学习了switch语句和goto关键字，今天，我们将深入研究递归这一有趣且实用的编程技巧，以及C++运算符的基础知识，包括运算符的优先级和自增自减运算符。这些知识是构建复杂程序逻辑和高效代码的重要基石。一、递归：函数自身的奇妙调用（一）递归的概念与原理递归是一种编程技巧，允
python建模的步骤_python基础教程之Python 建模步骤|python基础教程|python入门|python教程... 谭俊云 python建模的步骤
#%%#载入数据、查看相关信息importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportLabelEncoderprint('第一步：加载、查看数据')file_path=r'D:\train\201905data\liwang.csv'band_data=pd.read_csv(file_path,encoding='UTF-8'
python简单入门---time库的使用不停--- Python入门
time库函数-时间获取：time()ctime()gmtime()-时间格式化：strftime()strptime()-程序计时：sleep(),perf_counter()version1函数描述time()获取当前时间戳即计算机内部时间值，浮点数ctime()获取当前时间并且以易读方式表示，返回字符串––gmtime()获取当前时间，表示为计算机可处理的时间格式>>>time.time()
基于python的天气预报系统的设计与实现桃宝护卫队 python 开发语言
基于python的天气预报系统的设计与实现DesignandImplementationofaWeatherForecastSystembasedonPython完整下载链接:基于python的天气预报系统的设计与实现文章目录基于python的天气预报系统的设计与实现摘要第一章引言1.1研究背景1.2研究目的1.3研究意义第二章相关技术和方法2.1Python编程语言2.2天气预报接口2.3数据获
pip升级之后出现：/usr/bin/pip: No such file or directory jiangjiane Python Python
这是因为缓存的问题造成的，解决方案：1.whichpip/usr/local/bin/pip2.pip-bash:/usr/bin/pip:Nosuchfileordirectory3.typepippipishashed(/usr/bin/pip)Sopipisdefinintelyin/usr/local/bin/pipbutitisbeencachedasin/usr/bin/pip,tha
Jenkins部署前后端分离项目最全图文教程（手把手教学）黄团团运维 Jenkins Tomcat jenkins 运维 linux 华为云 nginx tomcat maven
前言：最近Jenkins部署的热度比较高，于是就想出一篇关于我是如何使用Jenkins部署前后端分离项目的，本篇记录了我是如何一步一步去配置、搭建和部署的完整流程，每一行代码都进行了实测和讲解，通过图文的教学写成博客分享给大家！博主的其他部署教程：1、Docker部署前后端分离项目：手把手通过Docker部署前后端分离项目（亲测可用）2、Linux系统部署Tomcat：Linux系统部署Tomca
算法竞赛的头文件选择（＜iostream＞和＜bits/stdc++.h＞） Tech007号研究员算法(C++)自学笔记算法 c++
1.#include功能：是C++标准库中的一个头文件，主要用于输入输出操作。它包含了`cin`、`cout`、`cerr`和`clog`等标准输入输出流对象。使用场景：当只需要进行基本的输入输出操作时，可以使用`#include`。优点：只包含必要的输入输出功能，编译速度较快；代码更清晰，只引入需要的功能；可移植性高，所有C++编译器都支持。缺点：如果需要使用其他标准库（如`vector`、`a
CAPL与外部接口闲人编程 CAPL编程核心25讲 microsoft 服务器运维 CAPL 外部接口 python CANoe
CAPL与外部接口目录CAPL与外部接口1.引言2.CAPL与C/C++交互2.1CAPL与C/C++交互简介2.2CAPL与C/C++交互实现3.CAPL与Python交互3.1CAPL与Python交互简介3.2CAPL与Python交互实现4.CAPL与MATLAB交互4.1CAPL与MATLAB交互简介4.2CAPL与MATLAB交互实现5.案例说明5.1案例1：CAPL与C/C++交互实
第18章 ARM Linux设备树之二（设备树的组成和结构）静能生悟 Linux驱动开发
18.2设备树的组成和结构整个设备树牵涉面比较广，即增加了新的用于描述设备硬件信息的文本格式，又增加了编译这个文本的工具，同时Bootloader（U-boot）也需要支持将编译后的设备树传递给Linux内核。18.2.1DTS、DTC和DTB等1.DTS文件.dts是一种ASCII文本格式的设备树描述，此文本格式非常人性化，适合人类的阅读习惯。在ARMLinux中，一个.dts文件对应一个ARM
【代码随想录训练营】【Day01】第一章｜数组｜数组理论基础｜704.二分查找｜27.移除元素蚝油菜花算法 leetcode 代码随想录
数组理论基础数组是在编程中非常常见的数据存储结构，主要有以下几个特点：数组的存储地址是一片连续的空间数组中存储的元素都是相同类型的修改数组中某一元素的值时，只能覆盖（重新赋值）更多有关数组的理论基础可查阅：《代码随想录》数组理论基础704.二分查找题目详细：LeetCode.704注意：二分查找对数据样本有明确的要求，即数组中的元素是有序的，所以在今后遇到类似于“在有序的数据样本中查找某一目标数据
Go语言面向对象编程网友阿贵 Go语言 golang 后端 vscode intellij-idea eclipse
Go语言在设计时虽然没有采用传统面向对象编程（OOP）中的类、继承等概念，但它通过结构体（struct）、方法和接口等方式支持了面向对象的编程风格。以下是Go语言中实现面向对象编程的一些核心概念和特性：结构体（Struct）在Go中，结构体是用户自定义的数据类型，它可以将不同类型的数据组合在一起，类似于其他语言中的类。结构体可以包含字段（属性），也可以拥有与之关联的方法。typeAnimalstr
量化交易系统中+如何实现实时数据分析和决策支持？ openwin_top 量化交易系统开发数据分析数据挖掘数据库架构量化交易机器学习人工智能
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在量化交易系统中，实现实时数据分析和决策支持是至关重要的。以下是详细的步骤和示例，说明如何实现这一目标。1.数据收集首先，需要收集实时市场数据。这些数据通常来自交易所、市场数据供应商或其他金融数据服
linux——基础命令合集潘儿er Linux linux 服务器编辑器开源软件
linux下，文件编辑等基础命令合集文本编辑器命令sed命令——sed删除文件中的内容文本编辑器命令sed命令——sed删除文件中的内容sed命令可以通过正则表达式来删除指定内容。具体如下：删除指定行：使用sed命令的d选项，eg:删除第5行:sed‘5d’file.txt删除指定字符串：使用sed命令的s选项，eg:删除所有“hello”字符串:sed‘s/hello//g’file.txt删除
java -Xms -XX 这些参数该咋写？5 分钟带你快速入门！后端java
前言java-Xms4G-Xmx4G-XX:MaxMetaspaceSize=512m-XX:MetaspaceSize=512m-XX:MaxDirectMemorySize=256m-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=./.hprof-Dfile.encoding=UTF-8-jardemo.jar上面是典型的启动Java程序时会携带
c++ STL函数对象飞yu流星 c++学习笔记 c++算法开发语言
1.函数对象1.1函数对象概念概念：重载函数调用符号（）的类，其对象常被称为函数对象函数对象使用重载的（）时，行为类似函数调用，也叫仿函数本质：函数对象（防函数）是一个类，不是一个函数1.2函数对象使用：特点：函数对象在使用时，可以像普通函数那样调用，可以有参数，可以有返回值函数对象可以有自己的状态，可以做一些状态记录工作函数对象可以做为参数传递#include#include#include#i
代码随想录训练营Day3|Leetcode 203.移除链表元素 Leetcode 707.设计链表 Leetcode 206.反转链表 ?��?? leetcode 链表算法
编程语言：C#链表定义*publicclassListNode{*publicintval;*publicListNodenext;*publicListNode(intval=0,ListNodenext=null){*this.val=val;*this.next=next;*}*}Leetcode203.移除链表元素题目链接：203.移除链表元素-力扣（LeetCode）题意：删除链表中等于
chatgpt赋能python：初学者指南：用Python进行股票买卖 laingziwei ChatGpt python chatgpt 人工智能计算机
初学者指南：用Python进行股票买卖股票市场是一个复杂的世界，但是有一些简单的工具可以帮助你进入这个市场。Python是一个流行的编程语言，在金融领域也广泛应用。在本文中，我们将介绍如何使用Python进行股票交易。Python如何支持股票买卖Python可以通过第三方库来实现股票交易。Python有许多开源库如twsapi,alpaca-trade-api,td-ameritrade-pyth
探索数据库交互新境界：Rustorm，以Rust之力重塑ORM新篇章马兰菲
探索数据库交互新境界：Rustorm，以Rust之力重塑ORM新篇章old-rustormAnORMforrust项目地址:https://gitcode.com/gh_mirrors/ol/old-rustorm在现代软件开发的洪流中，一款高效、灵活且易于理解的ORM（对象关系映射）框架，无疑是连接应用程序与数据库之间的桥梁。今日，让我们一同探索基于Rust编程语言的明星项目——Rustorm，
cpp--实战练习：日期类，加强练习！ ※DX3906※ c++开发语言 c++
日期类相信大家在看完构造函数与析构函数cpp–构造函数与析构函数拷贝构造函数cpp–拷贝构造函数详解赋值运算符重载cpp–赋值运算符重载,浅显易懂!这三篇文章后对c++中的类和对象都会有一定的了解下面我们通过日期类Date来加强一下对上述知识的理解Date.h存放头文件以及函数的声明Date.cpp存放函数的定义test.cpp存放主函数以及调用函数Date.h#pragmaonce#includ
cpp--内存管理（new/delete的用法），超详细讲解，一看就会！ ※DX3906※ c++开发语言 c++
cpp--内存管理（new/delete的用法），超详细讲解，一看就会！c/c++内存管理1.c语言中动态内存管理方式2.c++的内存管理方式2.1new/delete操作内置类型2.2new/delete操作自定义类型3.malloc/free和new/delete的区别c/c++内存管理1.c语言中动态内存管理方式voidTest(){int*p1=(int*)malloc(sizeof(in
c++ list 飞yu流星 c++学习笔记 c++list 开发语言
1.构造函数构造函数//listlst;//list(beg,end);//区间构造//list(n,elem);//元素构造//list(constlist&lst);//拷贝构造#include#include#include#includeusingnamespacestd;voidprintList(constlist&L){for(list::const_iteratorit=L.beg
Python能否实现股票的自动买卖？需要具备哪些技术和条件股票程序化交易接口量化交易股票API接口 Python股票量化交易 python 股票自动买卖技术条件券商接口股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>Python在股票交易中的基础Python是一种高级编程语言，在股票交易中有诸多优势。它具有简洁的语法，易于学习和编写代码。使用几行简单的Python代码就可以实现数据的读取和初步分析。其丰富的库，如pandas用于数据处理，nump
Linux中chmod用法我和simple五五开 Linux linux
Linux中chmod用法chmod：对文件权限进行修改。1、chmod语法chmodmodefile其中mode可以设定为字符串[ugoa][+-=][rwx]其中[ugoa]代表的是： u(owner)：表示文件所有者，即创建文件的人； g(group)：表示和文件所有者相同组的用户； o(other)：表示非文件所有者和相同group的用户； a(all)：表示所有用户；[±=]表示： +：
计算机视觉：解锁智能时代的钥匙与实战案例我的运维人生计算机视觉人工智能运维开发技术共享
计算机视觉：解锁智能时代的钥匙与实战案例在人工智能的浩瀚星空中，计算机视觉无疑是最为璀璨的星辰之一。它不仅让机器拥有了“看”的能力，更是推动了自动驾驶、安防监控、医疗影像分析、智能制造等多个领域的革新。本文将深入探讨计算机视觉的核心技术、最新进展，并通过一个具体的代码案例，展示如何在实际项目中应用这些技术。一、计算机视觉概述计算机视觉，简而言之，是指让计算机系统从数字图像或视频中提取有用信息的过程
linux 破-风网络基础 linux 运维服务器
LinuxLinux常用的命令以及英文表达式序号命令对应英文作用1lslist查看当前文件夹下的内容2pwdprintworkdirectory查看当前所在文件夹3cd[目录名]changedirectory切换文件夹4touch[文件名]touch如果文件不存在则创建文件5mkdir[目录]makedirectory创建目录6rm[文件名]remove删除指定文件7clearclear清屏8fi
C++ 交换变量的四种方法 HASHMOTO 编程 c++算法
请听题：#includeusingnamespacestd;voidswap_variables(int&n,int&m);intmain(){intn,m;cin>>n>>m;swap_variables(n,m);coutvoidswap_variables(int&n,int&m){swap(n,m);}
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

AMD HIP并行编程语言及其矢量相加实例——一文带你快速入门

概述&背景

HIP编程模型

HIP编程结构

内存和线程管理

核函数的启动和编写

基于HIP的并行程序设计步骤

HIP程序示例-基于HIP的并行矢量相加

HIP时间计时API

你可能感兴趣的:(并行编程模型-入门,c++,HIP编程,并行编程,人工智能,linux,bash)