NLP工程化

CUDA C编程权威指南：1.1-CUDA基础知识点梳理

主要整理了N多年前（2013年）学习CUDA的时候开始总结的知识点，好长时间不写CUDA代码了，现在LLM推理需要重新学习CUDA编程，看来出来混迟早要还的。

1.CUDA
解析：2007年，NVIDIA推出CUDA（Compute Unified Device Architecture，统一计算设备架构）这个编程模型，目的是为了在应用程序中充分利用CPU和GPU各自的优点，实现CPU/GPU联合执行。这种联合执行的需要已经在最新的集中编程模型（OpenCL，OpenACC，C++ AMP）中体现出来了。

2.并行编程语言和模型
解析：使用比较广泛的是为可扩展的集群计算设计的消息传递接口（Message Passing Interface，MPI）和为共享存储器的多处理器系统设计的OpenMP。目前，很多HPC（High-Performance Computing）集群采用的都是异构的CPU/GPU节点模型，也就是MPI和CUDA的混合编程，来实现多机多卡模型。目前，支持CUDA的编程语言有C，C++，Fortran，Python，Java [2]。CUDA采用的是SPMD（Single-Program Multiple-Data，单程序多数据）的并行编程风格。

3.数据并行性，任务并行性
解析：任务并行性通常对应用进行任务分解得到。例如，对一个需要做向量加法和矩阵-向量乘法的简单应用来说，每个操作可以看作一个任务。如果这两个任务可以独立地执行，那么就能得到任务并行性。

4.CUDA对C中函数声明的扩展
解析：

（1）__device__ float DeviceFunc()：在设备上执行，并且只能从设备上调用。
（2）__global__ float KernelFunc()：在设备上执行，并且只能从主机上调用。
（3）__host__ float HostFunc()：在主机上执行，并且只能从主机上调用。

说明：如果在函数声明时没有指定CUDA扩展关键字，则默认的函数是主机函数。

5.thread，block，grid，warp，sp，sm
解析：
（1）grid、block、thread：在利用CUDA进行编程时，一个grid分为多个block，而一个block分为多个thread。
（2）sp：最基本的处理单元，最后具体的指令和任务都是在sp上处理的。
（3）sm：多个sp加上其它的一些资源（比如，存储资源、共享内存、寄储器等）组成一个sm。
（4）warp：GPU执行程序时的调度单位。目前CUDA的warp大小32，同在一个warp的线程，以不同数据资源执行相同指令。

6.CUDA核函数
解析：kernel函数完整的执行配置参数形式是<<>>，如下所示：
（1）参数Dg用于定义整个grid的维度和尺寸，即一个grid有多少个block。
（2）参数Db用于定义一个block的维度和尺寸，即一个block有多少个thread。
（3）参数Ns是一个可选参数，用于设置每个block除了静态分配的shared Memory以外，最多能动态分配的shared memory大小，单位为byte。不需要动态分配时该值为0或省略不写。
（4）参数S是一个cudaStream_t类型的可选参数，初始值为零，表示该核函数处在哪个流之中。

7.CUDA存储系统
解析：每个线程拥有独立的寄存器(register)和局部存储器(local memory)；每个线程块拥有独立的共享存储器(shared memory)；所有线程都可以访问全局存储器(global memory)，以及只读存储器常量存储器(constant memory)和纹理存储器(texture memory)。如下所示：
（1）寄存器(register)
（2）局部存储器(local memory)
（3）共享存储器(shared memory)
eg：__shared__ 数据类型变量名;
（4）全局存储器(global memory)
（5）常量存储器(constant memory)
eg：__constant__ 数据类型变量名;
（6）纹理存储器(texture memory)

8.CUDA线程组织
解析：CUDA通过内置变量threadIdx.x、threadIdx.y、threadIdx.z表示当前线程所处的线程块的位置，blockIdx.x、blockIdx.y、blockIdx.z表示当前线程所处的线程块在整个网格中所处的位置，blockDim.x、blockDim.y、blockDim.z表示块的维度，gridDim.x、gridDim.y、gridDim.z表示网格的维度。对网格中的任意点(i, j)表征CUDA代码中的一个线程，该线程对应的网格中的索引，如下所示：

i = threadIdx.x+blockIdx.x*blockDim.x
j = threadIdx.y+blockIdx.y*blockDim.y

9.变量类型
解析：

（1）__device__：GPU的global memory空间，grid中所有线程可访问。
（2）__constant__：GPU的constant memory空间，grid中所有线程可访问。
（3）__shared__：GPU上的thread block空间，block中所有线程可访问。
（4）local：位于SM内，仅本thread可访问。

10.CUDA函数库
解析：
（1）Thrust：一个C++ STL实现的函数库。
（2）NVPP：NVIDIA性能原语（和Intel的MKK类似）。
（3）CuBLAS：BLAS（基本线性代数）函数库的GPU版本。
（4）cuFFT：GPU加速的快速傅里叶变换函数库。
（5）cuSparse：稀疏矩阵数据的线性代数和矩阵操作。
（6）Magma：LAPACK和BLAS函数库。
（7）GPU AI：基于GPU的路径规划和碰撞避免。
（8）CUDA Math Lib：支持C99标准的数学函数。
（9）Jacket：对.m代码可选的、基于GPU的Matlab引擎。
（10）Array Fire：类似于IPP、MKL和Eigen的矩阵、信号和图像处理库。
（11）CULA工具：线性代数库。
（12）IMSL：Fortran IMSL数值函数库的实现。
（13）NPP（NVIDIA Performance Primitives）：提供了一系列图像和通用信号处理的函数，并且支持所有的CUDA平台。

11.Ubuntu 14.04安装CUDA 7.5
解析：由于无论是CentOS还是Ubuntu都预装了开源的nouveau显卡驱动（SUSE没有这种问题），如果不禁用，则CUDA驱动可能不能正确安装。处理方法，如下所示：

sudo vim /etc/modprobe.d/blacklist.conf
blacklist nouveau    # 增加一行
sudo apt-get --purge remove xserver-xorg-video-nouveau    # 把官方驱动彻底卸载
sudo apt-get --purge remove nvidia-*    # 清除之前安装的任何NVIDIA驱动
sudo service lightdm stop    # 进命令行，关闭Xserver
sudo kill all Xorg    # 杀死所有Xorg（Xorg软件包是包括显卡驱动、图形环境库等一系列软件包）

说明：gksudo nvidia-settings可以进行NVIDIA X Server Settings的设置。
（1）安装依赖类库

sudo apt-get update  
sudo apt-get upgrade  
sudo apt-get install build-essential cmake g++ gfortran git pkg-config python-dev software-properties-common wget
sudo apt-get autoremove 
sudo rm -rf /var/lib/apt/lists/*

（2）安装Nvidia驱动

lspci | grep -i nvidia

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-352

sudo shutdown -r now
cat /proc/driver/nvidia/version

（3）安装CUDA

sudo dpkg -i cuda-repo-ubuntu1404*amd64.deb
# sudo apt-get update
sudo apt-get install cuda

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
 
nvcc -V
sudo shutdown -r now

（4）安装CUDA例子和测试

/usr/local/cuda/bin/cuda-install-samples-7.5.sh ~/cuda-samples
cd ~/cuda-samples/NVIDIA*Samples
make -j $(($(nproc) + 1))

bin/x86_64/linux/release/deviceQuery

说明：至此安装完毕，就可以使用Nsight Eclipse Edition愉快地进行CUDA异构计算开发了。

12.二维数组使用

#include 
#include
using namespace std;
 
static const int ROW = 10;
static const int COL = 5;
 
int main() {
    int** array = (int**)malloc(ROW*sizeof(int*));
    int* data = (int*)malloc(ROW*COL*sizeof(int));
     
    // initialize the data
    for (int i=0; i

 
  13.查看GPU信息的代码
   如果找不到#include ，那么将$cuda-samples/NVIDIA_CUDA-7.5_Samples/common/inc添加到NVCC Compiler中的Includes中即可。
 解析：
 （1）#include 
   #include提供数据类型：size_t，wchar_t，div_t，ldiv_t，lldiv_t；提供常量：NULL，EXIT_FAILURE，EXIT_SUCCESS，RAND_MAX，MB_CUR_MAX；提供函数：atof，atoi，atol， strtod， strtof， strtols， strtol， strtoll， strtoul， strtoull， rand， srand， calloc， free， malloc， realloc， abort， atexit， exit， getenv， system， bsearch， qsort， abs， div， labs， ldiv， llabs， tlldiv， mblen， mbtowc， wctomb， mbstowcs， wcstombs。
 （2）CUDART_VERSION
   CUDA Runtime API Version，在#include 中#define CUDART_VERSION 7050。
 （3）stdin，stdout，stderr
   进程将从标准输入文件中得到输入数据，将正常输出数据输出到标准输出文件，而将错误信息送到标准错误文件中。stdin的文件描述符为0，stdout的文件描述符为1，stderr的文件描述符为2。
 （4）host cudaError_t cudaSetDevice ( int device )
   设置device用于GPU扩展。
 （5）cudaDeviceProp数据结构
   cudaDeviceProp数据类型针对函式cudaGetDeviceProperties定义的，cudaGetDeviceProperties函数的功能是取得支持GPU计算装置的相关属性，比如支持CUDA版本号装置的名称、内存的大小、最大的thread数目、执行单元的频率等。如下所示： 
  struct cudaDeviceProp {
    char name[256]; // 识别设备的ASCII字符串（比如，"GeForce GTX 940M"）
    size_t totalGlobalMem; // 全局内存大小
    size_t sharedMemPerBlock; // 每个block内共享内存的大小
    int regsPerBlock; // 每个block 32位寄存器的个数
    int warpSize; // warp大小
    size_t memPitch; // 内存中允许的最大间距字节数
    int maxThreadsPerBlock; // 每个Block中最大的线程数是多少
    int maxThreadsDim[3]; // 一个块中每个维度的最大线程数
    int maxGridSize[3]; // 一个网格的每个维度的块数量
    size_t totalConstMem; // 可用恒定内存量
    int major; // 该设备计算能力的主要修订版号
    int minor; // 设备计算能力的小修订版本号
    int clockRate; // 时钟速率
    size_t textureAlignment; // 该设备对纹理对齐的要求
    int deviceOverlap; // 一个布尔值，表示该装置是否能够同时进行cudamemcpy()和内核执行
    int multiProcessorCount; // 设备上的处理器的数量
    int kernelExecTimeoutEnabled; // 一个布尔值，该值表示在该设备上执行的内核是否有运行时的限制
    int integrated; // 返回一个布尔值，表示设备是否是一个集成的GPU（即部分的芯片组、没有独立显卡等）
    int canMapHostMemory; // 表示设备是否可以映射到CUDA设备主机内存地址空间的布尔值
    int computeMode; // 一个值，该值表示该设备的计算模式：默认值，专有的，或禁止的
    int maxTexture1D; // 一维纹理内存最大值
    int maxTexture2D[2]; // 二维纹理内存最大值
    int maxTexture3D[3]; // 三维纹理内存最大值
    int maxTexture2DArray[3]; // 二维纹理阵列支持的最大尺寸
    int concurrentKernels; // 一个布尔值，该值表示该设备是否支持在同一上下文中同时执行多个内核
｝
 
  （6）host cudaError_t cudaDriverGetVersion ( int* driverVersion )
   返回CUDA驱动版本。
 （7）host __device__ cudaError_t cudaRuntimeGetVersion ( int* runtimeVersion )
   返回CUDA运行时版本。
 说明：__host__和__device__同时使用时触发编译系统生成同一函数的两个不同的版本。它支持一种常见的应用，即只需要重编译同一函数的源代码就可以生成一个在设备上运行的版本。
 （8）#if defined(WIN32) || defined(_WIN32) || defined(WIN64) || defined(_WIN64)
   WIN32，_WIN32，WIN64，_WIN64是Windows操作系统预定义的宏。这句话的目的是C/C++编程通过宏定义来判断操作系统的类型。 
  14.#include
 解析：#include头文件包含了内核函数的5个变量threadIdx、blockDim、blockIdx、gridDim和wrapSize。 
  15.事件管理
 解析：常用函数，如下所示：
 （1）cudaEventCreate()：事件的创建。
 （2）cudaEventDestroy()：事件的销毁。
 （3）cudaEventRecord()：记录事件。
 （4）cudaEventSynchronize()：事件同步。
 （5）cudaEventElapsedTime()：计算两事件的时间差。
   利用CUDA提供的事件管理API实现计时功能，如下所示： 
  float time;
cudaEventCreate(&start);
cudaEventCreate(&stop);
cudaEventRecord(start, 0);
{
// 需要计时的代码
}
cudaEventRecord(stop,0);
cudaEventElapsedTime(&time, start, stop);
cudaEventDestroy(start);
cudaEventDestroy(stop);
 
  16.deviceQuery
 解析：输出结果，如下所示： 
  root@ubuntu:~/cuda-samples/NVIDIA_CUDA-7.5_Samples/1_Utilities/deviceQuery# ./deviceQuery 
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce 940M"
  CUDA Driver Version / Runtime Version          7.5 / 7.5
  CUDA Capability Major/Minor version number:    5.0
  Total amount of global memory:                 1024 MBytes (1073610752 bytes)
  ( 3) Multiprocessors, (128) CUDA Cores/MP:     384 CUDA Cores
  GPU Max Clock rate:                            980 MHz (0.98 GHz)
  Memory Clock rate:                             1001 Mhz
  Memory Bus Width:                              64-bit
  L2 Cache Size:                                 1048576 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
  Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device PCI Domain ID / Bus ID / location ID:   0 / 4 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 7.5, CUDA Runtime Version = 7.5, NumDevs = 1, Device0 = GeForce 940M
Result = PASS
 
  说明：3个SM，每个SM包含128个SP，总共384个SP。 
  17.矩阵分块乘法[15]
 解析：
  
  18.一维卷积
 解析：卷积的物理意义就是加权叠加，常见的操作有一维卷积和二维卷积。需要说明的是，“幽灵元素"通常补0。因为全局存储器和常数存储器变量都是存储在DRAM中的，从DRAM中访问一个变量需要数百甚至数千个时钟周期，从DRAM访问变量的速度通常要比处理器完成算术操作的 速度慢很多。因此，DRAM的长延迟和有限带宽已经成为几乎所有现代处理器的性能瓶颈，通常被称为存储墙问题。为了缓解这个问题，现代处理器通常引进高速 缓存存储器（或多级高速缓存），以减少访问DRAM的次数。
 （1）一维卷积
   该算法的缺点是受限于访问输入数组d_N的DRAM带宽，掩码数组d_M已经放在L1高速缓存。
 （2）分块一维卷积1
   规定一个线程块处理的输出元素的集合成为"输出块”；计算不涉及幽灵元素的分块称为"中间块"；输出数据最左边的分块称为左边界分块；输出数据最右边的分块称为右边界分块；涉及多个分块、被多个线程块加载的数据称为"光环元素"或者"边缘元素"。
   该算法的优点是将输入数组d_N分块后放入共享存储器，减少了输入数组d_N的DRAM带宽，掩码数组d_M已经放在L1高速缓存。（分块一维卷积1对一维卷积的改进）
 （3）分块一维卷积2
   该算法的优点是充分利用了L2高速缓存，掩码数组d_M已经放在L1高速缓存。需要说明的是，最近的GPU（比如，Fermi）提供了通用L1和L2高速缓存，L1缓存是每个SM私有的，而L2缓存是所有SM共享的。这样的话，线程块中的光环元素可能存放在L2高速缓存中，我们直接利用光环元素即可，而不再需要将光环元素加载到线程块的共享存储器中。（分块一维卷积2对分块一维卷积1的改进） 
  19.cudaMemcpyToSymbol 
  解析：在device中，cudaMemcpyToSymbol进行赋值和读取（device，shared，constant），而在host中，cudaMemcpy进行赋值和读取。需要说明的是，在函数体外声明的变量默认为__device__类型，即全局变量类型。cudaMemcpyToSymbol(d_M, h_M, MaskLen*sizeof(float));和cudaMemcpyFromSymbol(h_M, d_M,MaskLen*sizeof(float));功能相反。常量存储器中的内容通常放在L1高速缓存中，因为常量存储器变量在kernel函数执行期间不会改变，刚好与GPU不提供缓存一致性相符合（主要是为了最大化利用硬件资源，提高处理器的算术运算吞吐率等）。需要说明的是，现代CPU通常都支持处理器核心之间的缓存一致性。 
  20.shared memory与bank conflict
 解析：
 （1）什么是bank conflict？
   在实际中，shared memory被分割成32个等大小的存储体（比如，Maxwell架构），即bank（每个bank拥有每周期32bit=4byte=4char=1int=1float的宽度）。因为一个warp中有32个线程，相当于一个线程对应一个bank。（不同的设备，存储体的数目也不相同，比如设备Tesla架构为16个存储体，后面我们以32个存储体进行讲解）。
   对于计算能力1.0设备，前个half-warp和后个half-warp不存在bank conflict；对于计算能力2.0设备，前个half-warp和后个half-warp可能存在bank conflict，因为shared memory可以同时让32个bank响应请求。
 （2）bank conflict发生的原因？
   理想情况下就是不同的线程访问不同的bank，可能是规则的访问，比如，线程0读写bank0，线程1读写bank1，也可能是不规则的，比如线程0读写bank1，线程1读写bank0。这种同一时刻每个bank只被最多1个线程访问的情况下不会出现bank conflict。特殊情况如果有多个线程同时访问同一个bank的同一个地址的时候也不会产生bank conflict，即broadcast。但当多个线程同时访问同一个bank不同的地址时，那么bank conflict就发生了。比如，线程0访问地址0，而线程1访问地址32（归一化后为0），由于它们在同一个bank中，所以就导致了冲突。因为bank conflict发生后，同一个bank的内存读写将被串行化，会导致程序性能大大降低。
 （3）什么时候会发生bank conflict呢？
   bank conflict主要出现在global memory与shared memory数据交换，及设备函数对shared memory操作中。
 （4）如何避免bank conflict呢？
   很多时候shared memory的bank conflict可以通过修改数据存储的方式来解决。 
  21.Thrust库
 解析：Thrust是一款基于GPU CUDA的C++库，其中包含诸多并行算法和数据结构。Thrust主要通过管理系统底层的功能，比如memory access（内存获取）和memory allocation（内存分配）来实现加速，使得工程师们在GPU编程的环境下能更focus在算法的设计上。
 （1）容器
   host_vector：为主机提供的向量类，并且驻留在主机内存中；device_vector：为设备提供的向量类，并且驻留在设备全局内存中。
 说明：fill()，copy()，sequence()。
 （2）算法
   转换(transformation)；规约(reduction)；前缀求和(prefix sum)；再排序(reordering)；排序(sorting)。
 （3）迭代器
   constant_iterator；counting_iterator；transform_iterator；permutation_iterator；zip_iterator。 
  22.事件，流，纹理内存
 解析：
 （1）事件：CUDA中的事件本质上是一个GPU时间戳，两个事件的时间差就是算法执行时间。
 （2）流：CUDA流表示一个GPU操作队列，可以将一个流看做是GPU上的一个任务，不同任务可以并行执行。
 （3）纹理内存：专门为那些在内存访问模式中存在大量空间局部性的图形应用程序而设计的只读内存。
 
 
  参考文献：
 [1] Java bindings for CUDA：http://jcuda.org/
 [2] CNN之Caffe配置：http://www.cnblogs.com/alfredtofu/p/3577241.html
 [3] Setting up a Deep Learning Machine from Scratch：https://github.com/saiprashanths/dl-setup
 [4] CUDA初学大全：http://www.cnblogs.com/yangs/archive/2012/07/28/2613269.html
 [5] 有哪些优秀的CUDA开源代码？：https://www.zhihu.com/question/29036289/answer/42971562
 [6] CUDA一维矩阵的加法：http://tech.it168.com/a2009/1112/807/000000807771.shtml
 [7] CUDA二维矩阵加法：http://www.cnblogs.com/jugg1024/p/4349243.html
 [8] NVIDIA CUDA Runtime API：http://docs.nvidia.com/cuda/cuda-runtime-api/index.html#axzz4G8M3LWlq
 [9] C/C++是如何通过宏定义来判断操作系统的：http://www.myexception.cn/operating-system/1981774.html
 [10] CUDA编程其实写个矩阵相乘并不是那么难：http://www.cnblogs.com/yusenwu/p/5300956.html
 [11] CUDA实例矩阵乘法：http://wenku.baidu.com/link?url=XCOgGQqpPUns-cifgGm1tbfqmY-5wWTwkXHh1_i_5ZZX6vFmbFu22r67fWMpcs-GxsH9thzOjVeNCpKIjGjdx2SYhq7bW4qfIquRTM0AAW_
 [12] 华科并行计算上机作业：http://wenku.baidu.com/link?url=1tWvUvW0t7BnFChxetS_Mr5_pCF_LZHQGLWxN-ArVVPccOM_VmoTx9IUD76l_rVMP-iPKWI97vn7wa5ZChz59rr4wlur3rL6k3MGB15qF4W
 [13] CUDA编程：http://www.cnblogs.com/stewart/archive/2013/01/05/2846860.html
 [14] NVIDIA Docker：GPU Server Application Deployment Made Easy：https://devblogs.nvidia.com/parallelforall/nvidia-docker-gpu-server-application-deployment-made-easy/
 [15] CUDA矩阵乘法——利用共享存储器：http://blog.csdn.net/augusdi/article/details/12614247
 [16] 华科并行计算上机作业：http://wenku.baidu.com/link?url=1tWvUvW0t7BnFChxetS_Mr5_pCF_LZHQGLWxN-ArVVPccOM_VmoTx9IUD76l_rVMP-iPKWI97vn7wa5ZChz59rr4wlur3rL6k3MGB15qF4W
 [17] GPUWattch Energy Model Manual：http://www.gpgpu-sim.org/gpuwattch/
 [18] 图形学领域的关键算法及源码链接：http://blog.csdn.net/u013476464/article/details/40857873
 [19] 拷贝global memory，cudaMemcpyToSymbol和cudaMemcpy函数是否有区别：http://blog.csdn.net/litdaguang/article/details/45047015
 [20] CUDA GPU编程如何避免bank conflict：http://www.th7.cn/Program/c/201512/719448.shtml
 [21] CUDA共享内存bank conflict：http://blog.csdn.net/endlch/article/details/47043069
 [22] CUDA bank conflict in shared memory：http://bbs.csdn.net/topics/390836540
 [23] CUDA Programming Guide之shared memory的Bank Confict：http://blog.csdn.net/o_oxo_o/article/details/4296281
 [24]Parallel_programming_week3.md：https://github.com/mebusy/notes/blob/c278e037aa8a59aa139fc722d01ed41cf978921d/dev_notes/Parallel_programming_week3.md
 [25] Thrust：http://docs.nvidia.com/cuda/thrust/index.html#axzz4H6gsFZs3
 [26] Thrust File List：http://thrust.github.io/doc/files.html

创建ASCII数字打印机(OpenCV C++) 河边一只猫 opencv c++cv
学习OpenCV3（中文版）LearningOpenCV3ComputerVisioninC++withtheOpenCVLibrary第四章练习1建立一个500×500大小的单通道图像，每个像素值都为0。a.创建一个ASCII数字打印机，你可以在自己电脑上输入数字，并在一个20像素高、10像素宽的方块中显示数字。当你键入时，数字将从左到右显示，直到到达图像的末尾才停止。b.允许键入回车和退格。c
【Qt入门】详解QCloseEvent、QFocusEvent、QShowEvent 和 QHideEvent事件人才程序员 QT高级教程 qt 数据库 c++开发语言 c语言面向对象 ui
文章目录前言QCloseEvent、QFocusEvent、QShowEvent和QHideEvent事件QCloseEvent作用重载函数常用成员函数QFocusEvent作用重载函数常用成员函数QShowEvent作用重载函数常用成员函数QHideEvent作用重载函数常用成员函数示例代码说明总结前言在图形用户界面（GUI）编程中，事件处理是一个核心部分。Qt作为一个强大的跨平台C++应用程序
【C++】 C++ 配置文件读取数组：读取 int[], float[], string[]，bool[]；读取 int, float, string,bool；错误输出，长度判定等 R-G-B OpenCV C++C/C++C++c++读取配置文件配置文件读数组读取int[]读取float[]读取string[]读取bool[]
文章目录1读取int,float,string，bool2读取int[],float[],string[]，bool[]3完整代码3.1头文件3.2.cpp文件4.实例调用5错误主要功能1.读取int,float,string，bool（getInt,getFloat,getString,getBool）。2.读取int,float,string数组（getIntArray,getFloatArr
PyTorch 与 NVIDIA GPU 的适配版本及安装小赖同学啊人工智能 pytorch 人工智能 python
PyTorch与NVIDIAGPU的适配版本需要通过CUDA和cuDNN来实现。以下是详细的安装教程，包括如何选择合适的PyTorch版本以及如何配置NVIDIAGPU环境。1.检查NVIDIAGPU和驱动1.1检查GPU型号确保你的机器上有NVIDIAGPU，并知道其型号。可以通过以下命令检查：nvidia-smi输出示例：+-----------------------------------
【OpenCV C++】以时间命名存图，自动检查存储目录，若不存在自动创建，按下空格、回车、Q、S自动存图 R-G-B OpenCV C++opencv c++计算机视觉
文章目录//保存图像的函数voidsaveImage(constcv::Mat&frame){//生成唯一文件名autonow=std::chrono::system_clock::
掌握STM32微控制器：嵌入式开发的终极指南段惟果Edwin
掌握STM32微控制器：嵌入式开发的终极指南【下载地址】MasteringSTM32-掌握STM32微控制器完全指南分享欢迎来到《MasteringSTM32》资源页面。本书是一本深度探索意法半导体（STMicroelectronics）STM32系列微控制器的权威指南，专为希望深入了解并掌握这一广泛应用于嵌入式系统开发平台的工程师和爱好者设计。STM32以其高性能、低功耗、丰富的外设等特点，在物
用c++ 写会移动的坦克初学者1111123 c++开发语言
#include#include#include#include"asd.h"usingnamespacestd;chartank_up[10][10]={{'.','#','.','.','.','.','.','.','.','.'},{'#','#','#','.','.','.','.','.','.','.'},{'#','#','#','.','.','.','.','.','.','
5个GitHub热点开源项目！！架构文摘JGWZ github 学习工具
1.自托管Moonlight游戏串流服务：Sunshine主语言：C++，Star：14.4k，周增长：500这是一个自托管的Moonlight游戏串流服务器端项目，支持所有Moonlight客户端。用户可以在自己电脑上搭建一个游戏流服务，通过局域网或互联网串流PC游戏到其他设备，实现跨设备的游戏共享和远程操控。它还提供了Web管理界面，方便进行配置和客户端配对，适用于Windows、Linux和
C++使用Onnxruntime/TensorRT模型推理奇华智能 AI c++开发语言人工智能 AI 计算机视觉
onnxruntime和tensorrt是我们常用的两种推理方式，下面整理了两个推理示例，仅供参考。步骤流程模型训练，python下生成pytorch的模型.pth，并基于.pth模型进行推理python下依据模型推理实现从.pth转向.onnxpython下基于.onnx进行推理，与后续两种推理方式种的推理结果进行比较环境windows10+RTX308015GB显存cuda11.3onnxru
【C++】类的const成员这学芝士多是一件美事 C++c语言 c++数据结构算法 linux
1const成员1.1const修饰类的成员函数在日期类中，我们实例化一个普通对象，普通对象调用成员函数要传参，传给隐含的this指针。普通对象调用Print()，要把d1的地址传给this指针，那如果是const对象呢？const对象取地址是constDate*，所指向的内容不能被修改，此时如果只是一个普通的成员函数是不能编译通过的。因此此时我们要将this指针变成constthis*,但是我们
【C++】模板的改进利刃大大 C++c++开发语言模板
文章目录Ⅰ.右尖括号的改进Ⅱ.模板别名usingⅢ.函数模板的默认模板参数Ⅰ.右尖括号的改进在C++98/03的泛型编程中，模板实例化有一个很繁琐的地方，就是连续两个右尖括号>>会被编译解释成右移操作符，而不是模板参数表的形式，需要一个空格进行分割，以避免发生编译时的错误。templateclassX{};templateclassY{};intmain(){Y>x1;//在c++11中编译通过Y
逐梦旅程：Windows游戏编程之从零开始读后感 wo16pao
读《Windows游戏编程之从零开始》有感我目前是一枚大三的学生，读的是数字媒体专业，在大一大二做过视频、三维动画等方面的内容之后，最终决定还是想学游戏编程方面的东西。在学习了一段时间的C++之后，不知如何开始自己的游戏编程，看过叶神给出的书单之后，本以为有了方向，可是实际上读的时候发现并不是那么回事。在读这本书之前，只知道游戏引擎是类似虚幻4和Unity那样的东西，完全不知道Shader是什么，
C/C++中的字符串 Ethan@LM c语言 c++开发语言
字符串表示方式：在C语言中，字符串实际上是一个字符数组（字节数组），并且以空字符\0结尾。例如，字符串"RUNOOB"实际上在内存中表示为{'R','U','N','O','O','B','\0'}。这个\0终止符告诉标准库函数（如printf()、strlen()等）字符串在哪里结束。防止未定义行为：如果没有正确地添加\0终止符，使用这些标准库函数时可能会导致未定义行为。例如，printf("%
QML 介绍及学习路线分享小灰灰搞电子 QML开发 QML Qt
QML介绍及学习路线分享一、QML介绍什么是QML?QML的特点QML基本结构示例说明：QML和QtQuickQML的应用场景C++与QML的集成总结二、QML学习路线分享**学习路线概述****工具与资源推荐****学习时间规划**一、QML介绍什么是QML?QML(QtModelingLanguage)是一种用于Qt应用开发的声明式用户界面语言，它基于JavaScript和JSON样式的语法，
【GESP】C++二级练习 luogu-B3700 [语言月赛202301] 九九乘方表 CoderCodingNo GESP c++开发语言
GESP二级练习，多层循环和分支以及数学函数练习，难度★★☆☆☆。题目题解详见：https://www.coderli.com/gesp-2-luogu-b3700/【GESP】C++二级练习luogu-B3700[语言月赛202301]九九乘方表|OneCoderGESP二级练习，多层循环和分支以及数学函数练习，难度★★☆☆☆。https://www.coderli.com/gesp-2-luo
数据结构——线性表——链式存储结构——C++实现线性表 MISAYAONE 【数据结构】C++疑难杂症知识点链表数据结构 C++增加结点结点
链式存储结构C++实现篇：主要实现了线性表的定义、初始化、显示、增、删结点、查找结点操作。切记亲力亲为，动手实践写代码
Unity和C++之间的区别 c++
Unity和C++是两种完全不同的技术，它们在开发目标、语言特性、应用场景等方面存在显著区别。以下是它们之间的主要区别：语言特性C++底层语言：C++是一种通用的、静态类型的、自由格式的编程语言，支持过程化编程、面向对象编程和泛型编程。编译型语言：C++代码需要通过编译器编译成机器代码后才能运行，因此执行效率高，但开发周期较长。手动内存管理：C++允许开发者手动管理内存分配和释放，这提供了更高的性
华为OD机试真题E卷 - 跳马（Java/JS/Py/C/C++）耀耀zz 2025最新华为OD机试题目华为od
题目描述马是象棋(包括中国象棋和国际象棋)中的棋子，走法是每步直一格再斜一格，即先横着或者直者走一格，然后再斜着走一个对角线，可进可退，可越过河界，俗称"马走日"字。给定m行n列的棋盘（网格图），棋盘上只有象棋中的棋子“马”，并且每个棋子有等级之分，等级为k的马可以跳1~k步(走的方式与象棋中“马”的规则一样，不可以超出棋盘位置)，问是否能将所有马跳到同一位置，如果存在，输出最少需要的总步数(每匹
Ubuntu20.04下VSCode配置PCL和OpenCV库-C++ Pertance vscode opencv c++
Ubuntu20.04+VSCode+Cpp+PCL+OpenCV准备工作代码编辑：VSCode开发语言：C++编译工具：CmakeG++依赖需求：PCL/OpenCV安装PCL库sudoaptinstalllibpcl-dev配置OpenCV库安装依赖sudoapt-getinstallbuild-essentialsudoapt-getinstallcmakegitlibgtk2.0-devp
2024华为OD机试真题-数据分类算法(C++/Java/Python)-E卷-100分 2024剑指offer 华为od c++python java
2024华为OD机试最新E卷题库-(C卷+D卷+E卷)-(JAVA、Python、C++)目录题目描述输入描述输出描述用例1用例2题目解析考点代码c++pythonJava题目描述对一个数据a进行分类，分类方法为：此数据a（四个字节大小）的四个字节相加对一个给定的值b取模如果得到的结果小于一个给定的值c，则数据a为有效类型，其类型为取模的值如果得到的结果大于或者等于c，则数据a为无效类型比如一个数
2024华为OD机试真题-符号运算-(C++/Python)-C卷D卷-200分 2024剑指offer 华为od c++python java
【华为OD机试】-(C卷+D卷)-2024最新真题目录题目描述给定一个表达式，求其分数计算结果。表达式的限制如下：所有的输入数字皆为正整数（包括0）仅支持四则运算（+-*,/）和括号结果为整数或分数，分数必须化为最简格式（比如6，3/4，7/8，90/7）除数可能为0，如果遇到这种情况，直接输出"ERROR"输入和最终计算结果中的数字都不会超出整型范围用例输入一定合法，不会出现括号匹配的情况输入描
第0篇：基于C++的通讯录管理系统课程实践项目设计 JuicyActiveGilbert C++项目实战（初级）c++开发语言
项目概述开发一个命令行交互式通讯录管理系统，支持联系人增删改查、数据持久化等功能，逐步引入C++核心语法和编程范式，最终实现一个面向对象、内存安全、支持数据序列化的完整应用。规划与知识点分布篇目标题知识点项目实现目标1VS2022环境搭建与第一个C++程序VS安装配置、项目创建、HelloWorld创建项目框架，验证开发环境2C++基础语法与结构体应用数据类型、变量、I/O操作、结构体定义联系人结
2025华为OD机试真题目录【E卷+A卷+B卷+C卷+D卷】持续收录中... 耀耀zz 2025最新华为OD机试题目华为od 算法
摘要本专栏提供2025最新最全的华为OD机试真题库（E+A+B+C+D卷），包括100分和200分题型。题目包含题目描述、输入描述、用例、备注和解题思路、多种语言解法（Java/JS/Py/C/C++）。希望小伙伴们认真学习、顺利通过。声明本专栏的文章主要包括两部分：第一部分：题目描述、输入描述、用例。第二部分：解题思路、源码。第一部分信息来自互联网，不是本专栏付费内容，如果这一部分内容侵犯了原著
工资和奖金（acwing）c/c++/java/python xinghuitunan c++c语言 java python
请你编写一个程序，给定你一个销售人员的名字，底薪以及月销售额。请你计算他的月收入是多少。已知月收入等于底薪加15%15%的月销售额。所有数据保留两位小数。输入格式输入第一行包含一个由大写字母构成的长度不超过1010的字符串，表示销售人员的名字。第二行包含一个浮点数，表示该人员的底薪。第三行包含一个浮点数，表示该人员的月销售额。输出格式输出格式为TOTAL=R$X，XX为该人员月收入。数据范围0≤底
《信息学奥赛一本通编程启蒙C++版》3431-3435（5题） dllglvzhenfeng 小学生C++编程入门小学生C++趣味编程创新 c++开发语言一本通启蒙人工智能算法 GESP CSP-J
3431：【例75.2】区间合并信息学奥赛一本通-编程启蒙（C++版）在线评测系统[例75.2]区间合并信息学奥赛一本通-编程启蒙（C++版）在线评测系统ACWing803.区间合并（C++）ACWing803.区间合并（C++）-CSDN博客算法基础之离散化&区间合并-c++&python算法基础之离散化&区间合并-c++&python_autoitem:add-CSDN博客ACwing803区
奖学金(c++) 金牛座的zxs
题目描述查看题目信息某小学最近得到了一笔赞助，打算拿出其中一部分为学习成绩优秀的前5名学生发奖学金。期末，每个学生都有3门课的成绩:语文、数学、英语。先按总分从高到低排序，如果两个同学总分相同，再按语文成绩从高到低排序，如果两个同学总分和语文成绩都相同，那么规定学号小的同学排在前面，这样，每个学生的排序是唯一确定的。任务：先根据输入的3门课的成绩计算总分，然后按上述规则排序，最后按排名顺序输出前5
第十三届蓝桥杯模拟赛（第四期）试题与题解 C++ 小球同学. 蓝桥杯模拟赛蓝桥杯
目录试题A试题B试题C试题D试题E试题F试题G试题H试题I试题J试题A【问题描述】以下是一个25行25列的字母矩阵，全部由字母A和B组成。AAAAAAABABBAABABABAAAAAAAABBBBBABBAABBBBBABABBBBBAABAAABABBBABAABBBBABAAABAABAAABABBBBBAABAABABAAABAABAAABABBABABBABABABAAABAABBB
c++编译过程初识&静态&动态链接库&makefile&cmakelists初始测试盐 c++c++开发语言
编译过程预处理：主要是执行一些预处理指令，主要是#开头的代码，如#include的头文件、#define定义的宏常量、#ifdef#ifndef#endif等条件编译的代码，具体包括查找头文件、进行宏替换、根据条件编译等操作。g++-Eexample.cpp-oexample.i编译：进行词法分析、语法分析、语义分析、代码优化等，将.i文件转换为汇编代码文件，即.s文件。g++-Sexample.
c++实现备忘录模式完整源代码源代码大师 C和C++实战教程 c++备忘录模式 qt
c++实现备忘录模式完整源代码Memento.hMemento.hCodeManager.hmain.cppMemento.h#ifndef__MEMENTO_H__#define__MEMENTO_H__#includeusingnamespacestd;
NCU使用指南及模型性能测试（pytorch2.5.1） Jakari cuda gpu ncu python docker 深度学习 pytorch
本项目在原项目的基础上增加了NsightCompute(ncu)测试的功能，并对相关脚本功能做了一些健硕性的增强，同时，对一些框架的代码进行了更改（主要是数据集的大小和epoch等），增加模型性能测试的效率，同时完善了模型LSTM的有关功能。OverviewNsightCompute(NCU)是NVIDIA提供的GPU内核级性能分析工具，专注于CUDA程序的优化。它提供详细的计算资源、内存带宽、指
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

CUDA C编程权威指南：1.1-CUDA基础知识点梳理

你可能感兴趣的:(CUDA,C编程权威指南,CUDA,异构计算,C++)