STRUGGLE_xlf

【2023CANN训练营第二季】——通过一份入门级算子开发代码了解Ascend C算子开发流程

本次博客讲解的代码是Gitee代码仓的Ascend C加法算子开发代码，代码地址为：
quick-start

打开Add文件，可以看到文件结构如下：

其中add_custom.cpp是算子开发的核心文件，包括了核函数的实现，展示了如何在Ascend平台上使用Ascend C编写算子以及如何在CPU和NPU上运行算子。
main.cpp的作用是用于调用名为 add_custom 的算子进行向量相加操作，根据定义的宏 CCE_KT_TEST 来选择执行哪个部分。
CMakeLists.txt是编译cpu侧或npu侧运行的算子的编译工程文件
run.sh 编译运行算子的脚本

下面我们重点看add_custom.cpp文件和main.cpp文件，以此了解核函数的开发流程和进行CPU侧和NPU侧验证
在进行核函数开发之间，我们先分析算子的表达式：

1.算子分析

Add算子的算子分析如下：

数学表达式：
Add算子的数学表达式为 z = x + y，即将输入x和y逐元素相加，得到输出z。

输入和输出：

算子有两个输入：x和y。

输入数据类型为half（float16）。

输入数据形状（shape）为(8, 2048)，即一个8x2048的二维数组。

输入数据格式（format）为ND（N-Dimensional），表示通用的多维数组格式。

算子有一个输出：z。

输出数据类型与输入数据类型相同，为half（float16）。

输出数据形状与输入形状相同，为(8, 2048)。

核函数名称和参数：

核函数的名称为 add_custom。
核函数有三个参数：x、y、z。
x和y是输入在全局内存（Global Memory）上的内存地址。
z是输出在全局内存上的内存地址。
实现所需接口：

数据搬移接口：需要使用 DataCopy 来实现输入数据的搬运，将数据从全局内存搬移到AI Core的局部内存。
矢量计算接口：通过使用矢量双目指令接口 Add 来完成x和y的逐元素相加。
内存管理接口：使用 AllocTensor 和 FreeTensor 来申请和释放Tensor数据结构，用于存储中间变量和计算结果。
队列管理接口：通过队列管理接口 EnQue 和 DeQue 来进行并行流水任务之间的通信和同步。
计算逻辑：

Add算子采用一种分块计算策略，用于在AI Core上执行向量加法操作。主要的计算逻辑包括以下步骤：
初始化核函数 add_custom，其中核函数初始化包括获取每个核的起始索引和初始化队列等。
执行计算过程，计算过程由多个循环组成，每次循环处理一个小块数据。
在每个循环中，分为以下三个步骤：
数据拷贝（CopyIn）：将输入数据x和y从全局内存搬移到本地队列（Local Queue）。
计算（Compute）：执行向量加法操作，将x和y逐元素相加得到z。
数据拷贝（CopyOut）：将计算得到的z从本地队列搬回到全局内存。
循环处理完所有小块数据后，完成整个向量相加操作。

2.核函数开发

2.1核函数定义

这个核函数的主要作用是创建 KernelAdd 类对象，初始化并执行向量相加的计算过程，调用 Process 方法来实际执行向量相加的操作。

extern "C" __global__ __aicore__ void add_custom(GM_ADDR x, GM_ADDR y, GM_ADDR z)
{
    KernelAdd op;
    op.Init(x, y, z);
    op.Process();
}

extern “C”: 这是一个C++编译指示，用于告诉编译器要使用C链接规范，以便在C/C++混编时，能够正确链接核函数。

__global__: 这是一个GPU编程的关键字，表示核函数可以在GPU上执行。这个关键字通常用于CUDA编程，表明这是一个全局函数，可以在GPU上调用。

__aicore__: 这是针对AI Core的编程关键字，表示这是AI Core上的核函数，用于AI Core的编程模型。

void add_custom(GM_ADDR x, GM_ADDR y, GM_ADDR z): 这是核函数的定义，它接受三个参数 x、y 和 z，分别代表输入向量 x、输入向量 y 和输出向量 z 的内存地址。这些内存地址是在全局内存中的，而不是在核函数的局部内存中。

KernelAdd op;: 在核函数的开头，创建了一个名为 op 的 KernelAdd 类的对象，用于执行向量相加的计算。

op.Init(x, y, z);: 调用 KernelAdd 类的 Init 方法，初始化 op 对象，将输入向量 x 和 y 的内存地址传递给 op 对象，以及将输出向量 z 的内存地址传递给 op 对象。

op.Process();: 调用 KernelAdd 类的 Process 方法，执行向量相加的计算。这一步会根据Add算子的计算逻辑，将输入数据从全局内存拷贝到本地队列，执行向量加法操作，再将计算结果从本地队列拷贝回全局内存。

2.2算子类定义

KernelAdd 类是用于执行Add算子计算的核心类。

class KernelAdd {
public:
    __aicore__ inline KernelAdd() {}
    __aicore__ inline void Init(GM_ADDR x, GM_ADDR y, GM_ADDR z)
    {
        // get start index for current core, core parallel
        xGm.SetGlobalBuffer((__gm__ half*)x + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);
        yGm.SetGlobalBuffer((__gm__ half*)y + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);
        zGm.SetGlobalBuffer((__gm__ half*)z + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);
        // pipe alloc memory to queue, the unit is Bytes
        pipe.InitBuffer(inQueueX, BUFFER_NUM, TILE_LENGTH * sizeof(half));
        pipe.InitBuffer(inQueueY, BUFFER_NUM, TILE_LENGTH * sizeof(half));
        pipe.InitBuffer(outQueueZ, BUFFER_NUM, TILE_LENGTH * sizeof(half));
    }
    __aicore__ inline void Process()
    {
        // loop count need to be doubled, due to double buffer
        constexpr int32_t loopCount = TILE_NUM * BUFFER_NUM;
        // tiling strategy, pipeline parallel
        for (int32_t i = 0; i < loopCount; i++) {
            CopyIn(i);
            Compute(i);
            CopyOut(i);
        }
    }

Init方法

Init 方法通过 GM_ADDR 类型的参数 x、y 和 z，将输入向量和输出向量的地址传入该方法。

首先，通过 GetBlockIdx() 方法获取当前AI Core的起始索引，这是为了在AI Core并行处理中计算每个核心需要处理的数据范围。

接下来，使用 xGm、yGm 和 zGm 对象，通过 SetGlobalBuffer 方法将输入向量 x、y 和输出向量 z 与AI Core的局部内存进行关联。这确保了每个核心的计算都在局部内存中进行，提高了计算效率。

然后，通过 pipe 对象，使用 InitBuffer 方法初始化了 inQueueX、inQueueY 和 outQueueZ 队列，这些队列将用于数据的输入和输出。BUFFER_NUM 和 TILE_LENGTH 用于确定队列的深度和每个队列的大小。

Process方法

Process 方法用于执行Add算子的计算逻辑。在该方法中：

通过循环处理数据，loopCount 表示循环的次数。TILE_NUM 和 BUFFER_NUM 的乘积决定了总共有多少次循环。因为采用了双缓冲策略，所以需要循环两次。

CopyIn 方法用于将数据从全局内存拷贝到本地队列，执行输入操作。

Compute 方法执行Add算子的计算，将数据从 inQueueX 和 inQueueY 队列中取出，执行相加操作。

CopyOut 方法用于将计算结果从本地队列拷贝回全局内存，执行输出操作。

CopyIn函数实现

__aicore__ inline void CopyIn(int32_t progress)
    {
        // alloc tensor from queue memory
        LocalTensor xLocal = inQueueX.AllocTensor();
        LocalTensor yLocal = inQueueY.AllocTensor();
        // copy progress_th tile from global tensor to local tensor
        DataCopy(xLocal, xGm[progress * TILE_LENGTH], TILE_LENGTH);
        DataCopy(yLocal, yGm[progress * TILE_LENGTH], TILE_LENGTH);
        // enque input tensors to VECIN queue
        inQueueX.EnQue(xLocal);
        inQueueY.EnQue(yLocal);
    }

它用于将数据从全局内存（Global Memory）复制到局部内存（Local Memory）并将数据放入输入队列，为Add算子的计算做准备。以下是对该方法的解释：

CopyIn 方法接受一个整数参数 progress，表示当前执行的迭代进度。这个参数在循环中用于确定从全局内存复制的数据位置。

首先，使用 inQueueX 和 inQueueY 队列的 AllocTensor 方法，为每个输入数据创建一个 LocalTensor 对象 xLocal 和 yLocal。这些 LocalTensor 对象用于在局部内存中存储全局内存中的部分数据。

接下来，使用 DataCopy 方法，将全局内存中的数据从 xGm 和 yGm 复制到 xLocal 和 yLocal 中。这里 progress * TILE_LENGTH 用于确定要复制的全局内存数据的位置。

然后，使用 EnQue 方法，将 xLocal 和 yLocal 放入输入队列 inQueueX 和 inQueueY 中，以便后续的计算操作可以从这些队列中获取数据。

Compute函数实现

__aicore__ inline void Compute(int32_t progress)
    {
        // deque input tensors from VECIN queue
        LocalTensor xLocal = inQueueX.DeQue();
        LocalTensor yLocal = inQueueY.DeQue();
        LocalTensor zLocal = outQueueZ.AllocTensor();
        // call Add instr for computation
        Add(zLocal, xLocal, yLocal, TILE_LENGTH);
        // enque the output tensor to VECOUT queue
        outQueueZ.EnQue(zLocal);
        // free input tensors for reuse
        inQueueX.FreeTensor(xLocal);
        inQueueY.FreeTensor(yLocal);
    }

Compute 方法接受一个整数参数 progress，表示当前执行的迭代进度。这个参数在循环中用于确定从输入队列中获取数据以及将结果放入输出队列的位置。

首先，使用 inQueueX 和 inQueueY 队列的 DeQue 方法，从输入队列中获取 LocalTensor 对象 xLocal 和 yLocal，这些对象包含了之前在 CopyIn 方法中准备好的输入数据。

接下来，使用 outQueueZ 队列的 AllocTensor 方法，创建一个 LocalTensor 对象 zLocal，用于存储计算结果。

然后，使用 Add 方法，对 xLocal 和 yLocal 中的数据执行加法操作，将结果存储在 zLocal 中。TILE_LENGTH 参数表示每次计算的元素数量。

使用 outQueueZ 队列的 EnQue 方法，将计算结果 zLocal 放入输出队列中，以便后续的步骤可以从输出队列中获取计算结果。

最后，使用 inQueueX 和 inQueueY 队列的 FreeTensor 方法，释放 xLocal 和 yLocal 对象，以便它们可以在后续的迭代中被重用。

CopyOut函数实现

__aicore__ inline void CopyOut(int32_t progress)
    {
        // deque output tensor from VECOUT queue
        LocalTensor zLocal = outQueueZ.DeQue();
        // copy progress_th tile from local tensor to global tensor
        DataCopy(zGm[progress * TILE_LENGTH], zLocal, TILE_LENGTH);
        // free output tensor for reuse
        outQueueZ.FreeTensor(zLocal);
    }

首先，从 outQueueZ 队列中出队（DeQue）一个 LocalTensor 对象 zLocal，这是之前计算的结果存储在本地内存中的对象。

然后，使用 DataCopy 函数将 zLocal 中的数据复制到全局内存中的 zGm 中，复制的数据长度为 TILE_LENGTH。

最后，通过 outQueueZ.FreeTensor(zLocal) 释放 zLocal 对象，以便在下一个迭代中重新使用。

3.核函数运行验证

通过对__CCE_KT_TEST__宏定义的判断来区分CPU和NPU侧的运行程序。

3.1CPU侧运行验证

完成算子核函数CPU侧运行验证的步骤如下：

分配共享内存，并进行数据初始化；
调用ICPU_RUN_KF调测宏，完成核函数CPU侧的调用；
释放申请的资源。

#ifdef __CCE_KT_TEST__
    uint8_t* x = (uint8_t*)AscendC::GmAlloc(inputByteSize);
    uint8_t* y = (uint8_t*)AscendC::GmAlloc(inputByteSize);
    uint8_t* z = (uint8_t*)AscendC::GmAlloc(outputByteSize);

    ReadFile("./input/input_x.bin", inputByteSize, x, inputByteSize);
    ReadFile("./input/input_y.bin", inputByteSize, y, inputByteSize);

    AscendC::SetKernelMode(KernelMode::AIV_MODE);
    ICPU_RUN_KF(add_custom, blockDim, x, y, z); // use this macro for cpu debug

    WriteFile("./output/output_z.bin", z, outputByteSize);

    AscendC::GmFree((void *)x);
    AscendC::GmFree((void *)y);
    AscendC::GmFree((void *)z);

内存分配：首先，分配了三块内存，x、y 和 z，这些内存用于存储输入数据和输出数据。这些内存分配使用 AscendC::GmAlloc 函数。

数据读取：使用 ReadFile 函数，从外部文件（如 “./input/input_x.bin” 和 “./input/input_y.bin”）读取输入数据（x 和 y）。

核函数模式设置：调用 AscendC::SetKernelMode 函数，将核函数执行模式设置为 KernelMode::AIV_MODE。这表明代码将在AI Core上执行。

核函数运行：通过宏 ICPU_RUN_KF 来运行核函数，add_custom 核函数将被执行。此核函数将输入数据 x 和 y 作为参数传递，并计算结果存储在 z 中。这一步是在AI Core上执行的。

结果写入文件：使用 WriteFile 函数，将计算的结果 z 写入输出文件（如 “./output/output_z.bin”），以便进一步分析和验证。

内存释放：最后，使用 AscendC::GmFree 函数，释放之前分配的内存，包括输入数据 x 和 y，以及输出数据 z。这是为了确保不会发生内存泄漏。

3.2NPU侧验证

在NPU侧验证主要分为以下步骤：
1.初始化Device设备；
2.创建Context绑定设备；
3.分配Host内存，并进行数据初始化；
4.分配Device内存，并将数据从Host上拷贝到Device上；
5.用内核调用符<<<>>>调用核函数完成指定的运算；
6.将Device上的运算结果拷贝回Host；
7.释放申请的资源。

代码如下：

#else
    CHECK_ACL(aclInit(nullptr));
    aclrtContext context;
    int32_t deviceId = 0;
    CHECK_ACL(aclrtSetDevice(deviceId));
    CHECK_ACL(aclrtCreateContext(&context, deviceId));
    aclrtStream stream = nullptr;
    CHECK_ACL(aclrtCreateStream(&stream));

    uint8_t *xHost, *yHost, *zHost;
    uint8_t *xDevice, *yDevice, *zDevice;
    CHECK_ACL(aclrtMallocHost((void**)(&xHost), inputByteSize));
    CHECK_ACL(aclrtMallocHost((void**)(&yHost), inputByteSize));
    CHECK_ACL(aclrtMallocHost((void**)(&zHost), outputByteSize));
    CHECK_ACL(aclrtMalloc((void**)&xDevice, inputByteSize, ACL_MEM_MALLOC_HUGE_FIRST));
    CHECK_ACL(aclrtMalloc((void**)&yDevice, inputByteSize, ACL_MEM_MALLOC_HUGE_FIRST));
    CHECK_ACL(aclrtMalloc((void**)&zDevice, outputByteSize, ACL_MEM_MALLOC_HUGE_FIRST));

    ReadFile("./input/input_x.bin", inputByteSize, xHost, inputByteSize);
    ReadFile("./input/input_y.bin", inputByteSize, yHost, inputByteSize);
    CHECK_ACL(aclrtMemcpy(xDevice, inputByteSize, xHost, inputByteSize, ACL_MEMCPY_HOST_TO_DEVICE));
    CHECK_ACL(aclrtMemcpy(yDevice, inputByteSize, yHost, inputByteSize, ACL_MEMCPY_HOST_TO_DEVICE));

    add_custom_do(blockDim, nullptr, stream, xDevice, yDevice, zDevice);
    CHECK_ACL(aclrtSynchronizeStream(stream));

    CHECK_ACL(aclrtMemcpy(zHost, outputByteSize, zDevice, outputByteSize, ACL_MEMCPY_DEVICE_TO_HOST));
    WriteFile("./output/output_z.bin", zHost, outputByteSize);

    CHECK_ACL(aclrtFree(xDevice));
    CHECK_ACL(aclrtFree(yDevice));
    CHECK_ACL(aclrtFree(zDevice));
    CHECK_ACL(aclrtFreeHost(xHost));
    CHECK_ACL(aclrtFreeHost(yHost));
    CHECK_ACL(aclrtFreeHost(zHost));

    CHECK_ACL(aclrtDestroyStream(stream));
    CHECK_ACL(aclrtDestroyContext(context));
    CHECK_ACL(aclrtResetDevice(deviceId));
    CHECK_ACL(aclFinalize());

总结：以上就是整个Ascend C算子开发的流程，接下来就可以执行一键式编译运行脚本，编译和运行应用程序。总的来说，通过这个简单的例子，可以知道Ascend C算子开发的工作主要分为：环境准备、算子分析、核函数开发、核函数运行验证、编译运行脚本这就几个步骤，核函数开发和核函数验证运行需要重点掌握，里面涉及到了算子开发核心知识。

Python爬虫实战：研究pycurl库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 pycurl
1.引言1.1研究背景与意义随着互联网数据量的爆炸式增长，传统爬虫框架在处理大规模数据采集任务时面临性能瓶颈。特别是在需要处理大量并发请求、高频率数据更新的场景下，提升爬虫的效率和稳定性成为关键挑战。Python作为最流行的爬虫开发语言，提供了多种网络请求库，其中pycurl因其基于C语言的libcurl库而具有出色的性能表现。1.2相关技术概述Python爬虫生态系统中的主要网络请求库包括：标准
C语言内存的“禁区”：为何不能返回局部变量的地址？ web安全工具库 2025C++学习 c语言开发语言
资料合集下载链接：https://pan.quark.cn/s/472bbdfcd014在C语言编程中，指针和内存管理是两大核心，也是许多新手甚至有经验的开发者容易踩坑的地方。一个经典的问题就是：“为什么我的函数返回一个指针，有时候能用，有时候程序就崩溃了？”答案往往藏在C语言的内存分区模型中。今天，我们就根据一份课堂笔记，深入探讨一个关键的“禁区”：从函数返回局部变量的地址，并搞清楚为什么有些地
c语言程序开发全局变量控制生存期 Bing2100 c语言算法开发语言
在C语言中，全局变量的生存期与程序一致，若管理不当易引发初始化顺序混乱、资源泄漏等问题。以下是针对C语言的全局变量优化方案，结合设计模式与语言特性规避生存期风险：一、模块化设计：用文件作用域替代全局作用域1.静态全局变量（文件内可见）适用场景：变量仅在单个源文件中使用，避免被其他文件意外修改。示例（module.c）：c运行//module.cstaticintmoduleState=0;//仅在
【数据结构】排序算法：冒泡与快速 nanguochenchuan 数据结构排序算法数据结构算法
引言：排序算法的重要性排序算法是计算机科学的基础核心，直接影响程序性能和资源消耗。在C语言开发中，理解不同排序算法的特性对编写高效代码至关重要。本文将深入分析两种经典排序算法：简单直观的冒泡排序和高效快速的快速排序，并提供完整的C语言实现。冒泡排序：简单但低效基本思想冒泡排序通过相邻元素比较交换，使较大元素逐渐移动到数组末端，如同气泡上浮。C语言实现#includevoidbubbleSort(i
C++：指向类的成员的指针是席木木啊 C/C++c++指针 c语言
引：想必接触过C的朋友们对C语言中指针的概念已经有了深入的了解(如果初步进行了解的朋友可以看一下**C语言基础学习笔记**)。指针展开来讲的基本知识点包括：指针的概念、指针的定义和初始化及简单使用、指针函数和函数指针（有关指针函数和函数指针的内容上面的链接中也有介绍）。不得不说，C++作为C语言的扩展，在面向对象这一主体部分处处体现着指针的思想，好比：指针和引用。之所以这么说，是因
C语言与工业自动化控制：PLC编程、Modbus/TCP协议与OPC UA接口（三） JJJ69 学习C语言吧自动化 tcp/ip 网络
目录一、C语言与OPCUA接口1.1OPCUA接口简介1.2C语言实现OPCUA客户端/服务器1.3C语言在OPCUA高级特性的支持二、结论2.1总结C语言在工业自动化控制中的关键角色2.2展望未来一、C语言与OPCUA接口1.1OPCUA接口简介OPCUA（OpenPlatformCommunicationsUnifiedArchitecture）是一种开放的、跨平台的工业通信标准，专为实现工业
力扣网C语言编程题：快慢指针来解决 “寻找重复数” 魏劭 C语言逻辑编程题算法 c语言 leetcode
一.简介上一篇文章解决力扣网上"查找重复数"的题目，提供了两种思路：哈希表和二分法。文章如下：力扣网C语言编程题：寻找重复数-CSDN博客本文提供另外两种解决思路：快慢指针和位运算。二.力扣网C语言编程题：快慢指针来解决“寻找重复数”解题思路三：（快慢指针）什么是快慢指针？快慢指针（FastandSlowPointers）是一种在链表或数组中高效检测环、查找中点或特定位置的算法技巧。其核心思想是使
Effective C 中文版资源下载史剑咪Nessa
EffectiveC中文版资源下载去发现同类优质开源项目:https://gitcode.com/欢迎来到本仓库！这里提供了一个非常实用的资源——EffectiveC中文版.pdf。这本书深入浅出地介绍了C语言编程中的各种技巧和最佳实践，无论你是C语言的新手还是有一定基础的程序员，都能从中获得宝贵的知识。本书详细讲解了C语言的各个方面，包括基础语法、高级特性、内存管理、效率优化等。通过阅读本书，你
HDU杭电OJ基础100题2010-2019（C语言版）雁于飞算法专栏 c语言开发语言
文章目录@[TOC](文章目录)[原题出处](https://acm.hdu.edu.cn/listproblem.php?vol=11)前言p2010.水仙花数问题描述解题思路代码核心思想：p2011多项式求和问题描述代码p2003求绝对值问题描述解题思路代码扩展p2004成绩转换问题描述解题思路代码重点p2005第几天问题描述解题思路代码扩展p2006求奇数的乘积p2007平方和与立方和问题描
C语言控制结构深度解析：从底层原理到高效实战技巧 Bryan Ding c语言开发语言
一、程序逻辑的核心密码程序设计的本质是对现实问题的抽象和逻辑表达。C语言作为结构化编程语言的典范，其控制结构构成了程序逻辑的骨架。三大基本结构构成所有程序的逻辑基础：顺序结构：代码的自然执行顺序选择结构：if/else语句实现分支判断循环结构：for/while实现重复操作二、选择结构的底层实现1.if语句的机器级实现if (condition){ //代码块}编译后的汇编代码示例： cmp
【Linux】环境变量——干货讲解代码程序猿RIP Linux linux
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、环境变量核心概念1.什么是环境变量？2.环境变量的存储结构3.常见环境变量及作用二、环境变量管理命令1.查看环境变量2.设置环境变量3.删除环境变量4.变量操作技巧三、环境变量在编程中的应用1.C语言获取环境变量的三种方式方法1：main函数参数方法2：extern声明environ方法3：getenv获取特定变量2.环境
数据结构day5——队列和树 LZA185 数据结构数据结构
目录一、队列：先进先出的数据缓冲区队列的核心概念队列的典型应用场景队列的基本操作队列的两种C语言实现方式1.顺序队列（基于数组的实现）2.循环队列（解决假溢出问题）二、树：一对多的层次结构树的基本概念树的存储方式二叉树：最常用的树结构二叉树的定义二叉树的特点特殊的二叉树二叉树的重要特性二叉树的C语言实现与遍历三、总结在数据结构的世界里，队列和树是两种截然不同却又同样重要的结构。队列以其"先进先出"
数据结构day2 LZA185 数据结构数据结构
目录一、Makefile二、检测内存泄漏工具：valgrind2.1valgrind介绍2.2具体使用：valgrind./a.out三、顺序存储的优缺点3.1优点3.2缺点四、线性表的链式存储：4.1链式存储简介4.2关于单向链表的c语言描述4.3单项列表的功能函数一、Makefile关于makefile介绍请查看这篇文章：https://blog.csdn.net/weixin_7208634
数据结构day7——文件IO LZA185 数据结构数据结构
一、标准IO的起源与概念标准IO（StandardInput/Output）是由DennisRitchie在1975年设计的一套IO库，后来成为C语言的标准组成部分，并被ANSIC所采纳。它是对底层文件IO的封装，提供了更便捷、可移植的文件操作接口。核心特点：设备抽象：将输入输出设备抽象为文件操作标准输入设备：默认是键盘（/dev/input）标准输出设备：默认是显示器跨平台性：任何支持标准C的系
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
C语言强制类型转换事后不诸葛编程语言（C）c++c语言强制转换
目录整数提升常用的算术转换强制类型转换是把变量从一种类型转换为另一种数据类型。例如，如果想存储一个long类型的值到一个简单的整型中，需要把long类型强制转换为int类型。可以使用强制类型转换运算符来把值显式地从一种类型转换为另一种类型，如下所示：(type_name)expression请看下面的实例，使用强制类型转换运算符把一个整数变量除以另一个整数变量，得到一个浮点数：#includein
C语言教学大变革！DeepSeek如何改变高职院校编程课堂？武汉唯众智创 c语言开发语言程序设计 Deepseek
一、引言在当今数字化转型的浪潮中，程序设计与分析能力已成为高职教育中不可或缺的核心竞争力。作为编程语言的基础，C语言不仅训练学生的计算思维，还培养其算法实现能力。然而，当前高职院校的C语言教学面临诸多挑战，如实践环节薄弱、学生创新能力不足等。DeepSeek等新一代智能编码支持系统的出现，为这一现状带来了转机。该系统融合了深度神经网络与语义解析技术，能够智能生成代码、优化缺陷检测、解构程序逻辑，并
c语言创建对象变量,对象的建立和使用 Damien丶 c语言创建对象变量
大家还记得上节课的“类是对象的抽象和概括，而对象是类的具体和实例。”这句话吗，学会类的定义之后，下一步就是对象的创建和使用了1.对象的创建类就是包含函数的结构体，是一种自定义数据类型，用它定义出来变量，就是对象，这就是所谓的“对象是类的具体和实例”，定义了一个这个类的对象，也可以说实例化了一个对象，就是这个意思！而对象的使用，和结构体的使用也一样，都是主要访问里面的成员，也都是用过.的方式来访问，
代码制作数字流星雨_C语言实现流星雨初酿乖乖代码制作数字流星雨
#include/***********************宏定义**********************/#definePI3.1415926//圆周率#defineWIDTH200//屏幕宽度，流星出生区域#defineHEIGHT150//屏幕高度，流星出生区域#defineV20//流星速度，单次移动的像素数#defineLENGTH20//流星字符数#defineDELAY30/
Github 2024-11-01 开源项目月报 Top19 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本月(2024-11-01统计)共有19个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目9TypeScript项目3JavaScript项目3Svelte项目1JupyterNotebook项目1Ruby项目1HTML项目1Rust项目1Java项目1C++项目1Go项目1Python中的算法实现集合创建周期：2831天
C语言main函数的原理：程序入口的奥秘 kaikaile1995 java 开发语言
在C语言的世界里，main函数扮演着无比重要的角色，它是每个C程序的起点和终点。每当一个C程序被编译并运行时，main函数都是第一个被执行的函数。理解main函数的原理，对于深入学习C语言乃至整个计算机科学的底层机制都至关重要。本文将深入探讨main函数的原理，包括其定义、参数、返回值，并通过示例代码来展示其在实际应用中的工作方式。一、main函数的定义在C语言中，main函数通常被定义为一个不接
嵌入式C语言常用的代码模块库 kaikaile1995 网络
在嵌入式系统开发中，C语言因其高效性、可移植性和对硬件的直接控制能力而广泛应用。随着嵌入式技术的不断发展，为了提高开发效率和软件质量，开发者们积累并共享了大量的代码模块库。这些库不仅涵盖了从底层硬件访问到高级应用开发的各个方面，还提供了丰富的功能组件和工具，极大地简化了嵌入式软件的开发过程。本文将介绍一些嵌入式C语言常用的代码模块库，并探讨它们在嵌入式开发中的应用。1.底层硬件访问库1.1GPIO
数据结构之顺序表（C语言版本）雾里看山数据结构数据结构 c语言开发语言
欢迎拜访：雾里看山-CSDN博客本篇主题：数据结构之顺序表（C语言版本）发布时间：2025.6.27隶属专栏：数据结构目录顺序表的概念核心特点：顺序表的优缺点分析优点：缺点：顺序表的使用场景具体实现（以动态为例）创建结构体静态顺序表动态顺序表基本功能接口实现初始化销毁打印扩容检查接口实现增删查改接口实现增头插尾插指定位置插入删头删尾删指定位置删除查改整体代码展示顺序表的概念顺序表（Sequence
HoRain云--Java集合框架：从入门到精通 HoRain云小助手 java 开发语言
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
java初学习（-2025.6.30小总结） kim_puppy java学习 java 学习开发语言
直接总结目前学习的内容吧。先罗列。1.java中包含的数据类型2.java中的方法3.了解java中数组的使用方法，和C语言略微有些区别，比如在输出数组，拷贝数组方面，可以更加快捷。4.类和对象。在初学习的时候，要理解类和对象的含义，因为java是面向对象的编程。4.1.类的格式：（类名一般采用大驼峰命名）class类名{属性（在方法外，在类内）行为/方法}4.2.类的实例化：和C语言不同，我们要
【华为OD机试真题 2025B卷】767、寻找最大价值的矿堆 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KJ.JK OJ+最新华为OD机试 (C++Java Py C JS)华为od c++java 华为OD机试真题 2025B卷 javascript c语言寻找最大价值的矿堆
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码C语言思路C代码JS语言思路JS代码作者：KJ.JK订阅本专栏后即可解锁在线OJ刷题权限专栏介绍：最新的华为OD机试题目总结，使用C++、Java、Python、C语言、JS五种语言进行解答，每个题目的思路分析都非常详细，支持在线OJ评测刷题！！！！订阅后
2023年JAVA面试题【Redis/Elasticsearch】 GJH-JAVA java redis elasticsearch
1.什么是Redis？Redis是一个使用C语言写成的，开源的高性能key-value非关系缓存数据库。它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash（哈希类型）。Redis的数据都基于缓存的，所以很快，每秒可以处理超过10万次读写操作，是已知性能最快的Key-ValueDB。Redis也可以实
C语言数据类型 kim_puppy c语言算法开发语言
数据类型1.1.定义何为类型，即类似事物共同特征。数据类型：类似数据的共同特征。例如：整数为整型类型，小数则为浮点型...丰富的数据类型能够让我们在C语言中描述好各种数据。1.2数据类型分类总体的数据类型分类可以概括为下面这张图：上图错误更正：布尔类型的正确写法：b为大写，即_Bool这里需要对布尔类型做出注意：C语言原来是使用整数0表示假，非零表示真。而之后出现了布尔类型，专门用来表示真假使用时
Golang CGO 跨平台开发：一次编写，多平台运行 Golang编程笔记 Golang开发实战 Golang编程笔记 golang 开发语言后端 ai
GolangCGO跨平台开发：一次编写，多平台运行关键词：Golang、CGO、跨平台开发、交叉编译、多平台兼容摘要：本文将带你探索Golang中CGO（C语言交互工具）的跨平台开发奥秘。通过通俗易懂的比喻和实战案例，你将学会如何用CGO调用C语言代码，结合条件编译和交叉编译技术，实现“一次编写，多平台运行”的目标。无论是系统工具开发、底层驱动对接，还是复用已有C库，本文都将为你提供清晰的技术路径
C语言经典题目2 一支闲人 C语言 c语言基础知识适用新手小白
1.字符串长度计算一个字符串的长度并输出本体主要运用了strlen库函数的应用#include#includeintmain(){charste[100];intlen;printf("Enterastring");scanf("%s",str);len=strlen(str);printf("Lengthof'%s'=%d",str,len);return0;}2.字符串反转将一个字符串反转并输
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f