回到唐朝当王爷

昇腾Ascend C算子开发学习笔记

2024年7月18日华为上研院培训笔记记录，感觉老师讲的还是很不错的

昇腾Ascend C算子开发学习笔记

昇腾处理器的常用算子库

核心融合算子库：核心融合算子库是华为昇腾AI处理器提供的基本算子库，包含了各种常用的深度学习算子，可以高效地执行各种神经网络计算任务。该库的设计旨在充分发挥昇腾AI芯片的计算能力，优化计算性能和资源利用率。FlashAttention类，MOE FFN类
NN算子库：NN（Neural Network）算子库是专门为神经网络设计的算子库，包含了常见的神经网络操作，例如卷积、池化、全连接层等。该库提供了高度优化的实现，可以显著提升神经网络模型的推理和训练速度。
DVPP算子库：DVPP（Data Video Pre-Processing）算子库用于视频和图像的预处理。它包含了一系列高效的视频编解码、图像处理等算子，可以在昇腾AI处理器上高效地执行视频和图像的预处理任务，为后续的深度学习模型推理提供高质量的输入数据。
AIPP算子库：AIPP（Artificial Intelligence Pre-Processing）算子库专注于人工智能数据预处理。该库提供了一系列图像预处理算子，例如图像归一化、调整图像尺寸等，以确保输入到深度学习模型的数据在格式和质量上符合模型的要求。
BLAS算子库：BLAS（Basic Linear Algebra Subprograms）算子库是一个基本线性代数子程序库，包含了各种矩阵和向量操作算子。这些算子是许多高性能计算和机器学习算法的基础，可以在昇腾AI处理器上高效地执行各种线性代数计算任务。
HCCL算子库：HCCL（Huawei Collective Communication Library）算子库是华为提供的分布式通信库，用于在多个昇腾AI处理器之间进行高效的数据传输和通信。该库包含了一系列分布式计算中的通信算子，例如广播、聚合等，旨在优化分布式深度学习的性能。

Ascend C编程常用API

计算类 API

计算类 API 主要用于执行各种计算任务，如张量操作、矩阵计算、神经网络推理等。这些 API 能够充分利用 Ascend 芯片的硬件加速特性，提升计算效率。常见的计算类 API 包括：

张量操作：用于执行张量的创建、赋值、维度变换等操作。
矩阵运算：包括矩阵乘法、矩阵转置、矩阵求逆等。
神经网络推理：执行神经网络模型的前向和反向传播计算。

同步类 API

同步类 API 用于在多线程或分布式环境中协调任务的执行，确保计算过程中的数据一致性和正确性。常见的同步类 API 包括：

互斥锁（Mutex）：用于保护共享资源，防止多个线程同时访问导致的数据竞争。
信号量（Semaphore）：用于控制多个线程对有限资源的访问。
屏障（Barrier）：用于使多个线程在某一点上同步，确保所有线程在继续执行之前都达到该同步点。

搬运类 API

搬运类 API 主要用于在内存之间或设备之间移动数据。这些 API 能够高效地进行数据传输和复制，支持大规模数据的快速搬运。常见的搬运类 API 包括：

内存复制（Memory Copy）：将数据从一个内存位置复制到另一个内存位置。
DMA 传输（Direct Memory Access）：用于在主存和设备存储之间直接传输数据，减少 CPU 的干预。
数据加载与保存（Data Load/Store）：将数据从存储设备加载到内存中，或将数据从内存保存到存储设备中。

Ascend C的SPMD并行计算模式

SPMD 是一种并行计算模型，在这种模型中，每个处理单元（例如 CPU 核或 GPU 核）运行相同的程序代码，但处理不同的数据子集。这种模式非常适合在硬件上具有多处理单元的系统中进行大规模数据并行计算。华为 Ascend AI 处理器就是使用该种并行计算模型。

AI Core

华为昇腾AI处理器的计算核心主要由AI Core构成，可以看作一个简化版的现代微处理器架构。其核心包括三种基础计算资源：

矩阵计算单元（Cube Unit）：
- 负责矩阵计算操作，适用于大规模矩阵运算。
- 支持不同精度和类型的计算模式。
向量计算单元（Vector Unit）：
- 负责向量计算操作，适用于并行处理多个数据元素的运算。
- 提供多种精度和计算模式。
标量计算单元（Scalar Unit）：
- 负责标量计算操作，适用于处理单个数据元素的运算。

这三种计算单元各自承担不同的计算任务，形成三条独立的执行流水线。在系统软件的统一调度下，这些单元互相配合，以优化计算效率。矩阵和向量计算单元内部还提供了多种精度和类型的计算模式，以适应不同的计算需求。

AI Core中的计算单元主要包括：Cube Unit（矩阵计算单元）、Vector Unit（向量计算单元）和Scalar Unit（标量计算单元），完成AI Core中不同类型的数据计算。

算子的概念

在计算机科学和数学中，算子（Operator）是指一种特定的操作或函数，它接受一个或多个输入（操作数）并产生输出。在编程和计算中，算子通常用于描述各种计算操作，比如加法、乘法、矩阵变换等。在不同的上下文中，算子可以具有不同的含义和作用。

算子在神经网络中的含义

在神经网络和深度学习中，算子是指用于执行各种神经网络层和数据处理操作的基本计算单元。每个算子通常代表一个特定的操作，例如卷积、池化、激活函数、矩阵乘法等。这些算子在神经网络的训练和推理过程中起着关键作用。以下是一些常见的神经网络算子：

卷积算子（Convolution Operator）：
- 用于卷积神经网络（CNN）中的卷积层。
- 通过滑动滤波器（卷积核）在输入特征图上进行卷积操作，提取局部特征。
池化算子（Pooling Operator）：
- 用于卷积神经网络中的池化层。
- 通过下采样减少特征图的空间维度，同时保留重要的特征。
- 常见的池化操作包括最大池化（Max Pooling）和平均池化（Average Pooling）。
激活函数算子（Activation Function Operator）：
- 用于神经网络层之间的激活操作。
- 通过非线性变换引入非线性，使得神经网络能够学习复杂的模式。
- 常见的激活函数包括ReLU（Rectified Linear Unit）、Sigmoid和Tanh等。

张量和算子的关系

数据与操作的关系：
- 张量是数据的载体，存储输入数据、模型参数和中间计算结果。
- 算子是操作单元，定义如何处理张量，实现数据的变换和计算。
神经网络的构建：
- 神经网络可以视为张量和算子的组合。输入数据被表示为张量，通过一系列算子的操作，逐层传递并变换，最终输出结果。
- 每一层神经网络都涉及张量的操作，例如卷积层对输入图像张量进行卷积操作，池化层对张量进行下采样操作，全连接层对张量进行矩阵乘法操作。
计算图（Computational Graph）：
- 深度学习模型可以表示为计算图，图中的节点表示算子，边表示张量。计算图描述了数据流和计算过程。
- 前向传播过程中，张量在计算图中传递并通过各个算子进行计算，生成输出。
- 反向传播过程中，误差通过计算图向后传播，通过算子的反向计算更新张量（模型参数）。

张量的属性：形状、数据排布格式（NHWC）

常见的算子属性：轴

Ascend C 的优势

1. C/C++ 原语编程

开发者可以使用熟悉的 C/C++ 语言编写高性能的 AI 应用程序，而无需掌握底层的硬件细节。

屏蔽硬件差异

开发者无需关心底层硬件的差异，能够编写跨平台的应用程序。

多层级 API 封装

提供多层次的 API，满足不同开发者的需求，从高层次的框架接口到底层的硬件操作接口。

孪生调试（CPU 测模拟 NPU 侧的行为）

开发者可以在 CPU 上调试和模拟 NPU 上的行为，大大提高开发和调试效率。

自定义算子开发

在深度学习和高性能计算中，虽然现有的框架（如TensorFlow、PyTorch等）提供了丰富的内置算子，但某些特定场景下，开发者可能需要自定义算子以满足特殊需求。

核函数（Kernel Function）是指在AI处理器（如华为Ascend AI处理器）上执行的函数，它通常负责在设备侧进行高效的并行计算。核函数是算子实现的核心部分，主要用于执行实际的计算任务。

核函数——Ascend C算子设备侧实现的入口

声明：

 extern "C" __global__ __aicore__ void add_custom(__gm__ uint8_t* x, __gm__ uint8_t* y, __gm__ uint8_t* z);

__global__ 标识核函数，可以被 <<<...>>> 调用。
__aicore__ 标识该核函数在设备端 AI Core 上执行。

格式

 __global__ __aicore__ void kernel_name(argument list);

核函数必须具有 void 返回类型。
仅支持入参为指针或 C/C++ 内置数据类型（如 half* s0、float* s1、int32_t c）。

为了统一表达，可以使用 GM_ADDR 宏来修饰入参

 #define GM_ADDR __gm__ uint8_t* __restrict__

调用

 kernel_name<<>>(argument list);

blockDim：规定核函数将在几个核上执行。
l2ctrl：保留参数，暂时设置为固定值 nullptr。
stream：是一个任务队列，应用程序通过 stream 管理任务的并行。

流水线编程范式

Ascend C 编程范式：一种流水线式的编程范式，把算子核内的处理程序分成多个流水任务，通过队列（Queue）完成任务间通信和同步，并通过统一的内存管理模块（Pipe）管理任务间通信内存。

流水任务设计

流水任务：单核处理程序中主程序调度的并行任务，在核函数内部实现数据的并行处理，提升性能。
任务划分：将单核处理程序的功能拆分为多个独立任务（例如：Stage1、Stage2、Stage3），每个任务专注于完成单一功能，并依赖于前一个任务的完成。
并行调度：相同时间点，不同的数据切片可以有多个任务并行处理，提高性能。

矢量编程范式

CopyIn：负责搬入操作：
- 使用 DataCopy 接口将 GlobalTensor 数据拷贝到 LocalTensor。
- 使用 EnQue 将 LocalTensor 放入 VECIN 的 Queue 中。
Compute：负责矢量计算操作。
- 使用 DeQue 从 VECIN 中取出 LocalTensor。
- 使用 Ascend C 接口完成矢量计算。
- 使用 EnQue 将计算结果 LocalTensor 放入到 VECOUT 的 Queue 中。
CopyOut：负责搬出操作。
- 使用 DeQue 接口从 VECOUT 的 Queue 中取出 LocalTensor。
- 使用 DataCopy 接口将 LocalTensor 拷贝到 GlobalTensor 上。

任务间通信和同步

Queue 队列：用于完成任务之间的数据通信和同步，提供 EnQue、DeQue 等基础 API。
逻辑位置（QuePosition）

：抽象各级别存储，代替物理存储，简化开发者对硬件架构的感知。
- 矢量编程 Queue 类型：
  - VECIN：搬入数据的存放位置。
  - VECCALC：计算中间变量的位置。
  - VECOUT：搬出数据的存放位置。
- 矩阵编程 Queue 类型：
  - A1/B1：存放整块 A/B 矩阵（类比二级缓存）。
  - A2/B2：存放切分后的小块 A/B 矩阵（类比一级缓存）。
  - CO1：存放小块结果 C 矩阵。
  - CO2：存放整块结果 C 矩阵。

内存管理

Pipe 模块

：统一管理任务间数据传递使用的内存。

InitBuffer：对外提供 Queue 内存初始化功能。
AllocTensor：为 LocalTensor 分配内存。
FreeTensor：回收 LocalTensor 的内存。

临时变量内存管理：

TBuf 数据结构：用于申请指定 QuePosition 上的存储空间，参与计算，但无法执行 Queue 队列的入队出队操作。

核函数定义

核心过程就是调用算子类的Init和Process函数。Process函数是算子的核心代码

 extern "C" __global__ __aicore__ void add_custom(GM_ADDR x, GM_ADDR y, GM_ADDR z)
 {
     KernelAdd op;
     op.Init(x, y, z);
     op.Process();
 }

此外还可以对核函数的调用进行封装，便于主程序调用

 #ifndef __CCE_KT_TEST__
 // call of kernel function
 void add_custom_do(uint32_t blockDim, void* l2ctrl, void* stream, uint8_t* x, uint8_t* y, uint8_t* z)
 {
     add_custom<<>>(x, y, z);
 }
 #endif

算子类实现

 class KernelAdd {
 public:
     __aicore__ inline KernelAdd() {}
     // 初始化函数，完成内存初始化相关操作
     __aicore__ inline void Init(GM_ADDR x, GM_ADDR y, GM_ADDR z){}
     // 核心处理函数，实现算子逻辑，调用私有成员函数CopyIn、Compute、CopyOut完成矢量算子的三级流水操作
     __aicore__ inline void Process(){}
 
 private:
     // 搬入函数，完成CopyIn阶段的处理，被核心Process函数调用
     __aicore__ inline void CopyIn(int32_t progress){}
     // 计算函数，完成Compute阶段的处理，被核心Process函数调用
     __aicore__ inline void Compute(int32_t progress){}
     // 搬出函数，完成CopyOut阶段的处理，被核心Process函数调用
     __aicore__ inline void CopyOut(int32_t progress){}
 
 private:
     TPipe pipe;  //Pipe内存管理对象
     TQue inQueueX, inQueueY;  //输入数据Queue队列管理对象，QuePosition为VECIN
     TQue outQueueZ;  //输出数据Queue队列管理对象，QuePosition为VECOUT
     GlobalTensor xGm, yGm, zGm;  //管理输入输出Global Memory内存地址的对象，其中xGm, yGm为输入，zGm为输出
 };

Init函数实现

设置输入输出 Global Tensor 的 Global Memory 内存地址。
获取该核函数需要处理的输入输出在 Global Memory 上的内存偏移地址。
为输入输出 Queue 分配内存。

constexpr int32_t TOTAL_LENGTH = 8 * 2048;
 constexpr int32_t USE_CORE_NUM = 8;
 constexpr int32_t BLOCK_LENGTH = TOTAL_LENGTH / USE_CORE_NUM;
 constexpr int32_t TILE_NUM = 8;
 constexpr int32_t BUFFER_NUM = 2;
 constexpr int32_t TILE_LENGTH = BLOCK_LENGTH / TILE_NUM / BUFFER_NUM;
 
 __aicore__ inline void Init(GM_ADDR x, GM_ADDR y, GM_ADDR z) {
     xGm.SetGlobalBuffer((__gm__ half*)x + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);
     yGm.SetGlobalBuffer((__gm__ half*)y + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);
     zGm.SetGlobalBuffer((__gm__ half*)z + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);
     pipe.InitBuffer(inQueueX, BUFFER_NUM, TILE_LENGTH * sizeof(half));
     pipe.InitBuffer(inQueueY, BUFFER_NUM, TILE_LENGTH * sizeof(half));
     pipe.InitBuffer(outQueueZ, BUFFER_NUM, TILE_LENGTH * sizeof(half));
 }

Process 函数实现

调用三个基本任务：CopyIn、Compute、CopyOut

 __aicore__ inline void Process() {
     constexpr int32_t loopCount = TILE_NUM * BUFFER_NUM;
     for (int32_t i = 0; i < loopCount; i++) {
         CopyIn(i);
         Compute(i);
         CopyOut(i);
     }
 }

Kernel侧算子实现

动态 Shape 与固定 Shape 的区别

动态 Shape：输入的 Shape 是未知的，与输入 Shape 相关的变量（如 TilingData）需要通过 Tiling 函数计算。
固定 Shape：变量（如 TILE_NUM、BLOCK_LENGTH、TILE_LENGTH）是固定的数值，不需要在运行时计算。

Tiling 函数

Host 侧实现：Tiling 函数在 host 侧实现，并在 kernel 侧算子中通过 GET_TILING_DATA 获取 TilingData 结构体参数。
获取 TilingData：核函数中调用 GET_TILING_DATA 获取 Tiling 参数，然后基于这些参数进行计算。

Host 侧算子实现

Tiling 实现：计算数据切分相关参数，比如每次计算的数据量大小。
Shape 推导
算子原型注册

Tiling实现

在大多数情况下，由于Local Memory的容量不足以容纳完整的输入和输出数据，需要将数据分块计算，这个过程称为Tiling。Tiling实现会根据算子的shape等信息确定切分算法的相关参数，如每次搬运的块大小和循环次数。

Tiling实现的输入是算子的shape等信息，输出是切分算法的相关参数，这些参数通过TilingContext结构传递。开发者可以通过TilingContext获取算子的输入输出信息，进行计算并设置TilingData、block_dim、TilingKey和workspace size等输出。

TilingData存储切分算法相关参数，如每次搬运的块大小和循环次数。block_dim表示算子数据切分的份数，TilingKey用于选择不同的kernel实现分支，workspace size表示设备侧Global Memory的内存大小。

对于非对齐shape的算子，需要特殊处理，例如对齐到最小数据块单位，并根据对齐后的总数据量分配核的数量。通过模计算确定分配较多和较少数据量的核心数，完成大块和小块的数据切分。

对于包含属性信息的算子，如ReduceMax，属性信息可以通过TilingData传递到kernel侧参与计算。例如，通过TilingContext获取reduceDim属性值，根据该值获取对应轴的长度，并设置到TilingData中传递到kernel函数。

Shape推导

网络模型生成过程中，会先进行Tensor shape以及dtype的推导。这样可以让我们在图执行之前，就知道各Tensor的数据类型和形状，提前校验其正确性；同时提前推理出算子的输出张量描述，包括张量的形状、数据类型及数据排布格式等信息，算子构图准备阶段就可以为所有的张量静态分配内存，避免动态内存分配带来的开销。

AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
每天40min，我们一起用70天稳扎稳打学完《JavaEE初阶》——1/70 第一天【进程和线程】【虚拟地址空间】 _蓝天IT_ 70天学完JavaEE初阶 java-ee java
专注效率记忆预习笔记复习做题欢迎观看我的博客，如有问题交流，欢迎评论区留言，一定尽快回复！（大家可以去看我的专栏，是所有文章的目录）文章字体风格：红色文字表示：重难点★✔蓝色文字表示：思路以及想法★✔如果大家觉得有帮助的话，感谢大家帮忙点赞！收藏！转发！本系列通过70天学习完JavaEE初阶，我们不图快，只求稳扎稳打。由于我高三是在家自学的，经验告诉我，学习一定要长期积累，并且及时复习，由于现在课
基于深度学习的草莓成熟度检测系统：YOLOv5 + UI界面 + 数据集 YOLO实战营深度学习YOLO实战项目深度学习 YOLO ui 人工智能目标跟踪
引言随着农业科技的发展，智能化的农业生产方式正逐步替代传统农业。果实的成熟度检测对于农业生产的管理至关重要，尤其是在果蔬的采摘、分拣和运输过程中。草莓作为一种广泛种植且受消费者喜爱的水果，其成熟度检测一直是农业智能化的重要研究方向。传统的草莓成熟度检测方法大多依赖人工经验，劳动强度大且容易出现误差，因此，基于计算机视觉和深度学习的草莓成熟度自动检测系统成为了一种理想选择。深度学习技术，尤其是卷积神
JavaEE导读1 薯条不要番茄酱 java-ee java
1.JavaEE发展历程JavaEE(JavaPlatformEnterpriseEdition),Java平台企业版.是JavaSE的扩展,⽤于解决企业级的开发需求,所以也可以称之为是⼀组⽤于企业开发的Java技术标准.所以,学习JavaEE主要是学习Java在企业中如何应⽤.1.最早的时候,Java企业扩展还是核⼼JDK的⼀部分(核⼼JDK通常指JavaSE).2.到了1999年,Java企业
c++实现TCP&UDP
做网络通信作业之前的学习!(>。#include#include#pragmacomment(lib,"ws2_32.lib")intmain(){//windows上使用网络功能需要开始网络权限WSADATAwsaData;WSAStartup(MAKEWORD(2,2),&wsaData);//1.创建socket套接字/*socket(intaf,//协议地址簇ipv4/ipv6对应AF_I
C++：指向类的成员的指针是席木木啊 C/C++c++指针 c语言
引：想必接触过C的朋友们对C语言中指针的概念已经有了深入的了解(如果初步进行了解的朋友可以看一下**C语言基础学习笔记**)。指针展开来讲的基本知识点包括：指针的概念、指针的定义和初始化及简单使用、指针函数和函数指针（有关指针函数和函数指针的内容上面的链接中也有介绍）。不得不说，C++作为C语言的扩展，在面向对象这一主体部分处处体现着指针的思想，好比：指针和引用。之所以这么说，是因
数字人矩阵源码--基于深度学习的数字人面部表情合成我~18339948121 数字人源码数字人矩阵源码 123数字人源码矩阵深度学习线性代数人工智能 flask tornado python
AI正在席卷全球，数字人市场需求增长，用AI数字分身一天就能生产出几十条高质量短视频，你只需要上传一段视频，甚至都不用开口说话，直接复制粘贴文案，就能得到一个属于你的数字分身。深度学习数字人面部表情合成的关键技术3D面部建模与参数化建立高精度3D面部模型是表情合成的基础，常用Blendshape或面部动作编码系统（FACS）作为参数化控制方法。Blendshape通过线性组合基础表情形状生成新表情
碰一碰发视频源码开发部署--开发要点解析微~18339948121 碰一碰发视频碰一碰源码碰碰贴源码网络 php java python javascript c#ruby
一、什么是碰一碰发视频？碰一碰发视频系统是结合NFC通讯技术的全新门店互动物料。顾客手机解锁后，无需打开APP扫码，碰一下即可快速完成各种互动，例如去小红书发1篇门店种草笔记(AI帮写又好又快)、大众点评收藏打卡等✅怎么用？只需要在店里或者外卖包装上贴上碰碰贴，顾客通过扫描二维码或碰一下NFC感应区，就能直接跳转到你的抖音，视频号、小红书号，给你的视频点赞、分享二、通讯技术的选择与应用近场通信技术
数字人视频剪辑与数字人分身源码开发的的核心技术解析微~18339948121 数字人分身源码数字人剪辑源码数字人源码 django pygame virtualenv plotly scikit-learn flask tornado
数字人视频剪辑与分身的核心技术解析数字人视频剪辑和分身技术是近年来人工智能与计算机视觉领域的热点，涉及虚拟形象生成、动作驱动、语音合成等多项技术。以下从技术实现、应用场景和工具选择三个方面展开分析。数字人视频剪辑的关键技术视频剪辑中数字人的核心在于动态形象的生成与编辑。基于深度学习的生成对抗网络（GAN）和3D建模技术可实现高保真虚拟形象构建。典型流程包括：人物建模：通过多视角图像或视频数据重建3
代码探秘人工智能万能小贤哥人工智能
当你在手机上用语音发送消息，当短视频平台精准推送你感兴趣的内容，当智能音箱陪你聊天解闷，背后都有一位“隐形伙伴”——人工智能。它就像从科幻电影中走出的神奇力量，正悄然改变着我们的生活。今天，就让我们借助简单的Python代码，开启一场探索人工智能奥秘的奇妙之旅！人工智能：计算机的“超能力大脑”想象一下，如果给计算机装上“大脑”，让它学会像人类一样思考、学习和解决问题，会发生什么？这就是人工智能（A
C语言与工业自动化控制：PLC编程、Modbus/TCP协议与OPC UA接口（三） JJJ69 学习C语言吧自动化 tcp/ip 网络
目录一、C语言与OPCUA接口1.1OPCUA接口简介1.2C语言实现OPCUA客户端/服务器1.3C语言在OPCUA高级特性的支持二、结论2.1总结C语言在工业自动化控制中的关键角色2.2展望未来一、C语言与OPCUA接口1.1OPCUA接口简介OPCUA（OpenPlatformCommunicationsUnifiedArchitecture）是一种开放的、跨平台的工业通信标准，专为实现工业
嵌套列表与二维列表的遍历方法
在Python的世界中，列表（list）是最为基础而强大的数据结构之一。而当一个列表的元素本身又是列表时，我们便进入了嵌套列表（NestedList）或更通用的二维列表（2DList）的语境中。无论是在软件开发、测试数据构造、数据分析、机器学习、自动化运维还是教育教学场景中，嵌套结构的遍历与处理都是工程能力的一项基本功。本文将系统剖析Python中处理嵌套列表和二维列表的常用遍历方式，从基础语法到
React 学习（一） COLDEHY react.js 学习前端
1.b/s架构是浏览器的形式，就是通过网页的方式访问2.是构建用户界面的javascript库，react是用来替代dom的，原本使用ajax结合dom实现页面局部刷新的方式需要频繁的操作dom不方便，所以我们可以使用前端框架来解决，不再直接操作dom，而是操作react，react去操作dom3.react特点虚拟dom，不用原生dom，原生dom存在兼容性问题，可能这个浏览器能用下一个就不能用
跟着AI学习C#之项目实战-电商平台 Day7 蓝胖子不会敲代码 C#学习 c#开发语言
Day7：部署准备与优化✅今日目标：添加静态资源（CSS、JS、图片）优化页面样式与交互体验添加分页功能（商品、订单列表）配置生产环境设置（appsettings.Production.json）准备发布部署（dotnetpublish）功能概览类型内容静态资源wwwroot/css,wwwroot/js,wwwroot/images页面样式优化使用Bootstrap+自定义CSS增强用户体验分页
自学黑客技术多长时间能达到挖漏洞的水平？～小羊没烦恼～网络安全黑客技术黑客网络安全 web安全人工智能学习
作为一名白帽黑客，自学黑客技术是一种既刺激又实用的技能。然而，很多初学者都好奇，自学这门技术需要多长时间才能达到挖掘漏洞的水平。本文将从黑客的角度详细探讨这个问题，包括学习路径、实践方法和一些个人经验分享。自学路径概览黑客技术的自学可以分为几个阶段：基础知识学习、工具与技术掌握、实战演练和专业深造。每个阶段的时间长度可以根据个人的学习速度和投入时间的多少而有所不同。1.基础知识学习（1-3个月）初
Rust 学习笔记：比较数值 UestcXiye Rust Rust
Rust学习笔记：比较数值Rust学习笔记：比较数值整数类型浮点类型NANRust学习笔记：比较数值整数类型在Rust中，可以用以下运算符比较数值：>、=、i32。但要注意从范围大的类型转换成范围小的类型，编译不会报错，但结果可能不对。解决方法2：使用try_into()进行类型转换try_into()方法：导入std::convert::TryIntotrait。该方法返回Result类型。us
大神之路-起始篇 | 第13章.计算机科学导论之【文件结构】学习笔记全栈工程师修炼指南从业必看书籍专栏学习笔记
欢迎关注「WeiyiGeek」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：
Redis学习总结（15）——Redis 基本数据类型使用场景一杯甜酒 Redis Redis基本数据类型使用场景
一、StringStrings数据结构是简单的key-value类型，value其实不仅是String，也可以是数字.常用命令:set,get,decr,incr,mget等。应用场景：String是最常用的一种数据类型，普通的key/value存储都可以归为此类.即可以完全实现目前Memcached的功能，并且效率更高。还可以享受Redis的定时持久化，操作日志及Replication等功能。除
力扣网C语言编程题：快慢指针来解决 “寻找重复数” 魏劭 C语言逻辑编程题算法 c语言 leetcode
一.简介上一篇文章解决力扣网上"查找重复数"的题目，提供了两种思路：哈希表和二分法。文章如下：力扣网C语言编程题：寻找重复数-CSDN博客本文提供另外两种解决思路：快慢指针和位运算。二.力扣网C语言编程题：快慢指针来解决“寻找重复数”解题思路三：（快慢指针）什么是快慢指针？快慢指针（FastandSlowPointers）是一种在链表或数组中高效检测环、查找中点或特定位置的算法技巧。其核心思想是使
pytorch官方文档60分钟入门笔记 xiaodidadada 机器学习
文章目录1.张量（Tensors）定义张量张量操作2.自动求导（autograd）变量Variable3.神经网络4.训练一个分类器载入数据5.数据并行day63参考：官方文档https://blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU加快
笔记本安装linux系统_“老笔记本”操作系统的安装彭英韬笔记本安装linux系统
现在科技发展电脑更新速度很很，有很多人已经换了几台电脑了。一是工作需要电脑满足不了需求；二是经济条件好经常更换满足心里需求；三是只会使用电脑不会维修，修不好就换等情况。现在电脑出现问题比较多的操作系统，由于经常上网有一些软件自动就安装了，使用一段时间电脑速度就慢了，有时自己清理电脑就出现进不了系统。还有时候安装自己需要系统时，由于不匹配等因素，导致电脑死机或出现蓝屏现象。虽然上网关系系统安装的软件
Prompt 精通之路（四）- AI 赋能：10 个超实用的 Prompt 模板，覆盖写作、编程、学习和办公程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt 学习 Prompt模板 AI工作流 ChatGPT应用生产力工具
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
微调 || RAG，项目落地怎么选？LLM应用选型指南，适用场景全解析认知超载 AI 人工智能
基本定义微调：是指利用更小、更具针对性的数据集对经过预先训练的大语言模型进一步训练的过程。在这个过程中，模型基于新数据集修改权重和参数，学习特定于任务的模式，同时保留来自最初预训练模型的知识。RAG：即检索增强生成，是将检索大量外部知识的过程与文本生成结合在一起的一种方法。它会从大型外部数据库中检索与输入问题相关的信息，将这些信息作为上下文提供给大语言模型，辅助其生成回答。微调适用场景1.特定领域
Linux操作系统笔记3 wu2790 笔记
接口管理命令：ip命令字符终端nmcli命令字符终端nmtui命令可视化终端ip命令：使用ip命令可以配置临时网络的连接信息，相关命令如下：iplink：显示网络设备运行状态ip-slink：显示更详细的设备信息iplinkshow[网络设备名]：仅显示指定的网络设备名的信息iplinkshowup：仅显示当前处于激活状态的设备信息iplinkset[网络设备名]down：将指定的网络设备下线ip
linux操作系统笔记1 wu2790 linux 笔记服务器
基本命令格式[redhat@localhost~]$$:使用的shell，$表示普通用户，#表示root（管理员）用户redhat：表示当前登录的用户，su(-)切换用户，whoami查看当前登录的用户localhost：表示主机名称，hostname查看主机名称，还可以临时修改（hostname英文名称）,永久修改（hostnamectlset-hostname英文名称）~：表示当前的工作目录,
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
Gartnet《Solution Path for Implementing Hybrid Cloud Applications With On-Premises Data》学习心得架构师学习成长之路大数据架构
一、引言随着企业数字化转型的深入，混合云架构逐渐成为一种中长期的现实选择。软件架构师们在将应用逻辑迁移到云端的同时，往往面临着数据层难以同步迁移的困境。Gartner的这份报告《SolutionPathforImplementingHybridCloudApplicationsWithOn-PremisesData》为我们提供了一条实施混合云应用的清晰路径，涵盖了从迁移策略的确定、应用与数据层的整
Prompt 精通之路（五）- 构建你的“AI 指令系统”：超越简单提问的 CRISPE 与 APE 框架
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
Liunx 操作系统笔记4 wu2790 笔记
进程管理命令ps命令：功能是显示当前系统的进程状态使用ps命令可以查看到进程的所有信息，例如进程的号码，发起者，系统资源使用占比，运行状态等，ps命令可帮助我们及时发现哪些进程出现“僵死”或“不可中断”等异常情况。ps命令经常会与kill命令搭配使用，以中断和删除不必要的服务进程，避免服务器的资源浪费语法格式：ps参数常用参数：-a显示所有进程信息-t显示属于指定终端主机的程序状态-c不显示程序路
C#学习日志 future1412 c#学习 java
构造函数和析构函数知识点一构造函数基本概念在实例化对象时会调用的用于初始化的函数如果不写默认存在一个无参构造函数构造函数的写法1.没有返回值2.函数名和类名必须相同3.没有特殊需求时一般都是public的classPerson{publicstringname;publicintage;类中是允许自己申明无参构造函数的结构体是不允许publicPerson(){name="怪盗基德";age=18
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

昇腾Ascend C算子开发学习笔记

昇腾Ascend C算子开发学习笔记

昇腾处理器的常用算子库

Ascend C编程常用API

计算类 API

同步类 API

搬运类 API

Ascend C的SPMD并行计算模式

AI Core

算子的概念

算子在神经网络中的含义

张量和算子的关系

Ascend C 的优势

1. C/C++ 原语编程

屏蔽硬件差异

多层级 API 封装

孪生调试（CPU 测模拟 NPU 侧的行为）

自定义算子开发

核函数——Ascend C算子设备侧实现的入口

声明：

格式

调用

流水线编程范式

流水任务设计

矢量编程范式

任务间通信和同步

内存管理

核函数定义

算子类实现

Init函数实现

Process 函数实现

Kernel侧算子实现

动态 Shape 与固定 Shape 的区别

Tiling 函数

Host 侧算子实现

Tiling实现

Shape推导

你可能感兴趣的:(c语言,学习,笔记)