demo_worker

CUDA理解

一. GPU加速概念理解

GPU加速类似于批处理或工厂加工，指针指定的向量数据并行经过同样的处理过后输出到显存中。因此GPU加速的范围是比较局限的，但在处理大数据方面优势巨大。

二 . GPU运算的时间开销

由于平常使用的程序都是在CPU上运行，数据都是在系统内存上操作。因此，在使用GPU参与程序计算时，需要将数据从内存传输到显存上，然后才可以进行计算，并且计算结果存储在显存中。

因此，GPU程序时间开销分为两部分：1.显存与内存的调用和数据在内存与显存之间的传输； 2.程序复杂度和并行程度。

三 .GPU硬件信息和显存

首先检查一下设备的型号和性能。本机采用的是GTX1060MaxQ显卡（Pascal架构），具体数据如下：

一．各部分数据详解：

全局内存为 6144MB ，主要是因为GPU与CPU都可以对它进行写操作，任何设备都可以通过PCI-E总线对其进行访问。在多GPU系统同，GPU之间可以不通过CPU直接将数据从一块GPU卡传输到另一块GPU卡上。在调用核函数之前，使用cudaMemcpy函数就是把CPU上的数据传输到GPU的全局内存上。
CUDA core有1280 个，也叫Streaming Processor（SP）就是SM
GPU时钟频率 1.34GHz，GPU内存读写频率4004MHz,显存总线带宽为192bit
L2 Cache 总大小为1572864Bytes
纹理内存大小 1D : 131072, 2D：（131072，65536），3D：(16384,16384,16384);
纹理图层：（暂时不清楚作用）
常量内存总大小：65536Bytes；
每个线程块中共享内存大小为： 48KB;
每个线程块中可用寄存器数量为： 65536
线程束中的线程数为 32；
每个多处理器中的最大线程数为：2048 （多处理器属于哪个硬件部分结构不清楚）
每个线程块可以调用的最大线程数为：1024；（重点）各维度最大Size(1024,1024,64)
线程网格的最大SIZE为（2147483647，65535，66635）
Maxmium memory pitch(不清楚)
纹理拾取：512B；

二 . GPU内存详解

GPU的内存中可读写的有：寄存器(registers)、本地内存、共享内存（shared memory）和全局内存（global memory），只读的有：常量内存（constant memory）和纹理内存（texture memory）。以下是对几种内存的介绍：

全局内存：是CUDA中的一个主要抽象，内核通过其读写设备内存，全局内存可以被动态或静态地分配，并可以通过CUDA内核中的指针访问。 Ig：：cudaMalloc((void **)&device_weights, Numberofparticles * sizeof(float)); //GPU侧声明随机数存储缓冲器的内存空间； cudaMemcpy(host_weights, device_weights, Numberofparticles * sizeof(float), cudaMemcpyDeviceToHost); //将随机数传送到主机）
共享内存：用于同一个线程块内的CUDA线程间交换数据（可用于排序算法），SM可见的内存，访问速度比全局内存快很多，但是比寄存器慢。而且只能用于存放临时数据。
本地内存：和寄存器类似，也是线程私有的，访问速度比寄存器稍微慢一点。事实上，是由编译器在寄存器全部使用完的时候自动分配的。在优化程序的时候可以考虑减少block的线程数量以使每个线程有更多的寄存器可使用，这样可减少Local memory的使用，从而加快运行速度。
寄存器：寄存器是每个线程私有的，并且GPU没有使用寄存器重命名机制，而是致力于为每一个线程都分配真实的寄存器，CUDA上下文切换机制非常高效，几乎是零开销。和CPU一样，访问寄存器的速度是非常快的，所以应尽量优先使用寄存器。在设备代码中声明的一个自动变量，没有任何__device__，__shared__和__constant__内存空间指定符通常驻留在寄存器中。然而，在某些情况下，编译器可能会选择将其放置在本地内存中，这可能会导致设备内存访问中详细描述的不良性能后果。
常量内存：可以用于存储一些并非由设备端计算得到的常量，由主机端赋值后传入设备端，广播给多个线程参与计算。
纹理内存：一种只读存储器，由 GPU 用于纹理渲染的图形专用单元发展而来。它同样位于显存中，可通过纹理缓存加速读取。相对同样具有缓存功能的常数存储器（Constant Memory），纹理存储器可以绑定更大的数据，并且支持一维、二维、三维纹理，并可以通过浮点数寻址。由于纹理存储器转为图像纹理渲染而设计，它特别适合图像处理、查找表等，对随机访问与非对齐访问有良好的加速效果，并且可以按需在返回时同时进行滤波等操作。但是纹理存储可以在读取其中某个数据时将临近的值载入缓存（Cache），这样下次访问时，则可以直接命中缓存，减少对 Global Memory 的访问，从而提高效率。

全局、常量和纹理内存空间在同一应用程序的内核发射中持久存在。

四.编程细节

1. CUDA运行时和驱动程序API版本

CUDA驱动程序API和CUDA运行时是CUDA的两个编程接口。

CUDA软件环境的主机运行时组件只能由宿主函数来使用。它提供了处理以下问题的功能：

设备管理

上下文管理

内存管理

代码模块管理

执行控制

纹理参考管理

与OpenGL和Direct3D的互操作性

与较低级别的CUDA驱动程序API相比，CUDA运行时通过提供隐式初始化、上下文管理和设备代码模块管理，极大地简化了设备管理。nvcc生成的c/c++主机代码使用CUDA运行时，因此链接到此代码的应用程序将依赖于CUDA运行时;类似地，任何使用cuBLAS、cuFFT和其他CUDA工具箱库的代码也将依赖于CUDA运行时，这些库是由这些库内部使用的。

组成CUDA Runtime API的功能在CUDA工具包参考手册中解释。

CUDA运行时处理内核加载和设置内核参数，并在内核启动之前启动配置。隐式驱动程序版本检查、代码初始化、CUDA上下文管理、CUDA模块管理（cubin到函数映射）、内核配置和参数传递都是由CUDA运行时执行的。

2. C语言扩展

①函数执行空间说明符

函数执行空间说明符表示一个函数是否在主机上或设备上执行，以及它是否可以从主机或设备调用。

__device__声明了一个函数：在设备上执行，只能从设备上调用。

__global__声明了一个函数：在设备上执行，从主机端调用。（3.2计算能力以上的设备，设备端可以调用？？）

__host__ 声明了一个函数：在主机上执行，只能从主机端调用。在任何一种情况下，该函数仅为主机编译。

__device__ __host__声明了一个函数：该功能是为主机和设备编译的。

__global__ 和 __host__不可以同时声明同一个函数。

注意：但是CUDA运行时，CUDA驱动或者其他CUDA工具箱库都有相同功能的设备端函数和主机端函数，并且两者之间功能相同但是计算速度不同。

②数据和变量

Dim3是一个基于uint3的整数向量类型，用于指定维度。在定义dim3的变量时，未指定的任何组件都被初始化为1。

内置的变量

内建变量指定网格和块维度以及块和线程索引。它们只在在设备上执行的函数中有效。

gridDim： dim3类型网格的尺寸。

blockIdx：uint3型网格中的块索引。

blockDim：dim3类型块的大小。

threadIdx： uint3型区块内的线程索引。

warpSize： int型的，线程束大小

五．使用方法

1.使用CPU计时器

在使用CPU计时器时，重要的是要记住许多CUDA API函数是异步的;也就是说，在完成工作之前，它们会将控制权返回给调用CPU线程。所有的内核发射都是异步的，就像在名称上使用Async后缀的内存复制函数一样。因此，为了准确地测量一个特定呼叫或CUDA调用序列的运行时间，有两个方法。

1.在启动和停止CPU计时器之前立即调用cudadevicesyn计时器（）来同步CPU线程。cudadevicesyn计时（）阻塞呼叫CPU线程，直到线程之前发出的所有CUDA调用都完成。

2.将CPU线程与GPU上的特定流或事件同步，但这些同步功能不适合在流以外的流中计时代码。cudastream同步（）阻塞了CPU线程，直到先前发出的所有CUDA调用都已经完成。cudaevent同步（）块直到特定流中的某一事件被GPU记录下来。因为驱动程序可能会在其他非默认流中插入CUDA调用的执行，所以在其他流中调用可能包含在时间内。

2.内存优化

内存优化是性能的最重要的领域。我们的目标是通过最大化带宽来最大化硬件的使用。使用尽可能多的快速内存和尽可能少的慢访问内存来提供带宽是最好的。本章讨论了主机和设备上的各种内存，以及如何最好地设置数据项来有效地使用内存。

设备内存和GPU之间的峰值理论带宽要高得多，因此，为了获得最佳的整体应用程序性能，重要的是最小化主机和设备之间的数据传输。注意：最小化主机和设备之间的数据传输，即使这意味着在设备上运行一些内核，而与在主机CPU上运行相比，它不会显示性能提升。

中间数据结构应该在设备内存中创建，由设备操作，并且在没有被主机映射或复制到主机内存的情况下被销毁。

3.内存选择

①固定内存

页面锁定或固定的内存传输在主机和设备之间达到最高的带宽。固定内存是在运行时API中使用cudaHostAlloc（）函数分配的。带宽测试CUDA示例展示了如何使用这些功能以及如何测量内存传输性能。对于已经预先分配的系统内存区域，cudaHostRegister（）可以在不需要分配一个单独的缓冲区并将数据复制到它的情况下，在动态地固定内存。

②零复制内存

零拷贝是CUDA工具箱的第2.2版中添加的一个特性。它使GPU线程能够直接访问主机内存。需要映射固定的（不可分页的）内存。综合gpu（即：GPUs与CUDA设备属性结构的集成字段设置为1），映射固定内存始终是一种性能提升，因为它避免了多余的副本，因为集成的GPU和CPU内存在物理上是相同的。零拷贝可以用来代替流，因为内核发起的数据传输自动重叠内核执行，而不需要设置和确定最佳流的开销（这句话没搞懂）。

cudaGetDeviceProperties（）返回的结构的canMapHostMemory字段用来检查设备是否支持将主机内存映射到设备的地址空间。

cudaDeviceMapHost来调用cudaSetDeviceFlags（）来启用页面锁定的内存映射。

在设置设备或发出需要状态的CUDA调用之前必须调用cudaSetDeviceFlags（）。

页面锁定的映射主机内存是使用cudaHostAlloc（）分配的，

而指向映射设备地址空间的指针是通过函数cudaHostGetDevicePointer（）获得的。

内核（）可以使用指针amap来引用映射的固定主机内存，如果amap指向设备内存中的位置，它就会这样做。

映射固定的主机内存在避免使用CUDA流的同时，可以将cpu-gpu内存传输与计算重叠。

③统一内存

统一虚拟寻址Unified Virtual Addressing(UVA)了，Unified Memory依赖于UVA，但他们不同。UVA为系统中所有内存提供虚拟的单一的虚拟内存地址，不论是设备内存，主机内存或是片上共享内存。它允许cudaMemcpy的使用，不管输入和输出参数在哪。UVA能够使用“Zero-Copy” memory，一种pinned host memory，设备端能够通过PCI-Express直接获取，不需要memcpy。Zero-Copy提供了一些统一内存的便利性，但性能并不好，因为它总是和PCI-Express的低带宽和高延迟相关的。

4.异步传输

使用cudaMemcpy（）的主机和设备之间的数据传输是阻塞传输;也就是说，只有在数据传输完成之后，控制权才会返回给主机线程。cudaMemcpyAsync（）函数是cudaMemcpy（）的非阻塞变种，在这种变体中，控制权会立即返回给主机线程。与cudaMemcpy（）相反，异步传输版本需要固定的主机内存，并且它包含一个额外的参数，一个streamID。一个stream,不同stream中的操作可以是交错的，在某些情况下是重叠的——这是一种可以用来隐藏主机和设备之间数据传输的属性。

异步传输可以通过两种不同的方式实现数据传输的重叠。

①CPU和GPU上的同步计算，在所有支持cuda的设备上，都可以使用异步数据传

输和设备计算来重叠主机计算。例如，重叠的计算和数据传输演示了如何在数据传输到设备时执行例行cpuFunction（）的主机计算，并执行使用该设备的内核。

cudaMemcpyAsync(a_d, a_h, size, cudaMemcpyHostToDevice, 0); kernel<<<grid, block>>>(a_d);

cpuFunction();

cudaMemcpyAsync（）函数的最后一个参数是stream ID，在本例中使用默认流，流0。内核也使用默认流，直到内存复制完成，它才会开始执行;因此，不需要显式的同步。由于内存拷贝和内核都立即将控制权返回给主机，主机函数cpuFunction（）与它们的执行重叠。

②在重叠的计算和数据传输中，内存拷贝和内核执行顺序发生。

在能够并发复制和计算的设备上，可以在设备上重叠内核执行，并在主机和设备之间进行数据传输。一个设备是否具有这种能力是由cudadevice自营结构的asyncEngineCount字段（或者在设备equery CUDA样本的输出中列出）来指示的。在具有这种功能的设备上，重叠再次需要固定的主机内存，此外，数据传输和内核必须使用不同的、非默认的流（带有非零id的stream）。这种重叠需要非默认stream，因为只有在设备（在任何流）上的所有调用都完成之后，才会开始使用默认stream的内存拷贝、内存集函数和内核调用，并且设备（在任何流中）都没有操作，直到它们完成为止。

cudaMemcpy(a_d, a_h, N*sizeof(float), dir);

kernel<<>>(a_d);

5.线程同步

同步是并行编程的一个普遍的问题。在CUDA的世界里，有两种方式实现同步：

System-level：等待所有host和device的工作完成

Block-level：等待device中block的所有thread执行到某个点

Stream-level：等待给定流中的所有命令完成

Event-level : 等待事件中的所有命令完成

CUDA API和host代码是异步的，cudaDeviceSynchronize可以用来停住CUP等待CUDA中的操作完成：

block中的thread执行顺序不定，CUDA提供了__device__ void __syncthreads(void);

一个function来同步block中的thread。当该函数被调用，block中的每个thread都会等待所有其他thread执行到某个点来实现同步。

cudastream同步（）将溪流作为参数，并等待给定流中的所有命令完成。它可以用来同步主机和特定的流，允许其他流继续在设备上执行。

cudaStreamWaitEvent（）将溪流和事件作为参数（参见事件描述的事件），并在调用cudaStreamWaitEvent（）之后将所有的命令添加到给定的流中，直到给定事件完成为止。流可以是0，在这种情况下，在调用cudaStreamWaitEvent（）之后，所有的命令都会添加到任何流中。

cudaStreamQuery（）为应用程序提供了一种方法，以知道流中的所有前面的命令是否已经完成。

6.核函数并发执行

在能够并发内核执行的设备上，流还可以同时执行多个内核，以便更充分地利用该设备的多处理器。一个设备是否具有这种能力是由cudadevice自营结构的concurrent内核字段（或者在设备equery CUDA样本的输出中列出）来指示的。例如：

cudaStreamCreate(&stream1);

cudaStreamCreate(&stream2);

kernel1<<>>(data_1);

kernel2<<>>(data_2);

CUDA将以下操作作为独立的任务公开，可以并发地操作：

主机上的计算;

设备上的计算;

内存从主机转移到设备;

内存从设备传输到主机;

在给定设备的内存中进行内存传输;

设备之间的内存传输。

7.原子函数

一个原子函数在一个32位或64位的单词上执行一个读-修改-写的原子操作，在全局或共享内存中。例如，atomicAdd（）在全球或共享内存中的某个地址读取一个单词，向它添加一个数字，并将结果写回相同的地址。这个操作是原子的，因为它保证在不受其他线程干扰的情况下执行。换句话说，在操作完成之前，没有其他线程可以访问这个地址。

8.规约思想

与算法有关，将串行计算思想优化为并行计算。

多用于点积，累加，比较等同一数组数据相互计算的过程

9.占用

分为两部分，线程占用和内存吞吐量最大化。

一，多处理器创建、管理、调度和执行线程，这些线程有32个并行线程，称为warps。一个线程束由32个线程组成，所以，ThreadsperBlock最好为32的倍数。

二，确保最大化内存吞吐量的下一步是根据设备内存访问中描述的最优内存访问模式，尽可能地组织内存访问。当全局内存带宽较低时，这种优化对于全局内存访问尤其重要，因此非最优全局内存访问对性能有更高的影响。

归并排序（Ologn）及其应用（求逆序对）+例题（后续仍有补充）万般算法皆思想
这几天一直在看lrj紫书的归并排序部分，刚开始连递归都看不懂，，现在已经完全理解了，写这个bolg就是为了记录一下板子，方便以后进行记忆唤醒。之后陆续还会学习补充树状数组和线段树，这三者其实都是二分思想的应用，最关键的不是记住这个板子，而是能够理解其中的思想。归并排序又是分治法的一种应用，分为分和治两部分。分即为根据递归，将数组一直划分到只剩两个元素的时候，这个时候问题就很简单了，而治又是从两个元
90、Python Web抓取与数据爬虫：技巧、实践与道德规范多多的编程笔记 python 前端爬虫
Python开发：学习Web抓取和数据爬虫大家好，今天我将向大家介绍Python的Web抓取和数据爬虫技术，主要包括BeautifulSoup和Scrapy两个库。在此之前，请大家先思考一个问题：为什么我们需要Web抓取和数据爬虫？为什么需要Web抓取和数据爬虫？在互联网时代，数据量呈爆炸式增长，但并不是所有数据都易于获取。很多时候，我们需要从网站上获取数据，这就需要用到Web抓取和数据爬虫技术。
目标检测算法以及常用库概述 YOLO大师目标检测算法人工智能
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例目标检测是在图像中发现并识别物体的过程，它是深度学习和图像处理领域的重要成果之一。在创建物体定位时，识别物体时，常见的一种方法是使用边界框。这种方法具有很高的通用，可以训练目标检测模型来识别和检测多个特
【算法学习】分治法应用—归并排序 _Huazzi 算法学习笔记算法学习排序算法 C++分治法
归并排序是分治思想的运用。文章目录基本思想：分治之美核心算法✂️分治流程：️过程演示⌛分步实现⌨️完整代码性能分析❓常见问题优化建议基本思想：分治之美将待排序元素分成大小大致相同的2个子集合，分别对2个子集合进行排序，最终将排好序的子集合合并成为所要求的排好序的集合。归并排序（MergeSort）是分治思想的经典应用。其核心理念是：分解：将复杂的大问题分割成简单的小问题解决：逐步解决小问题合并：将
【算法学习】分治法应用—快速排序 _Huazzi 算法学习笔记算法数据结构排序算法
欢迎来到“C语言算法学习”系列！快速排序（QuickSort）是一种非常高效的排序算法，广泛用于实践中。在这篇文章中，我们将详细介绍快速排序的工作原理、C语言实现，并提供一些优化建议、常见问题的解答以及编程技巧。快速排序简介快速排序是分治算法的一种，它的基本思想是：选择一个“分界点”元素，将数组分成两部分，使得左边的所有元素都不大于分界点，右边的所有元素都不小于分界点。然后，递归地对这两部分进行排
《CPython Internals》阅读笔记：p360-p377 python
《CPythonInternals》学习第20天，p360-p377总结，总计18页。一、技术总结1.seaborn可视化工具。2.dtrace(1)安装sudoapt-getinstallsystemtap-sdt-dev(2)编译./configure--with-dtracemakecleanmake3.snakeviz适用于cProfile的可视化工具。二、英语总结(生词：0)无。关于英语
基于CNN+Transformer混合模型实现交通流量时序预测(PyTorch版) 矩阵猫咪 cnn transformer pytorch 卷积神经网络深度学习
前言系列专栏:【深度学习：算法项目实战】✨︎涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域，讨论了各种复杂的深度神经网络思想，如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型语言模型和迁移学习。随着城市化进程的加速，交通流量预测成为城市交通管理与规划中的关键任务。准确的交通流量预测
Maui学习笔记- SQLite简单使用案例 Mr.L70517 Maui学习笔记学习笔记 ios c#sqlite
在本案例中我们将使用EFCore对象关系映射器，对SQLite数据库进行添加删除操作。我们将从数据库读取数据并显示在CollectionView中。并使用RefreshView实现下拉刷新数据。IOS下运行程序创建项目首先需要安装NuGet包Microsoft.EntityFrameworkCore.SqliteCommunityToolkit.MvvmCommunityToolkit.Maui(
智能体（Agent）如何具备自我决策能力的机理与实现方法由数入道人工智能应急管理人工智能自然语言处理
一、智能体自我决策能力的机理从人工智能和控制理论的角度看，智能体能够“自我决策”的核心在于其“感知–认知–行动”的循环过程，以及在此过程中引入自主学习与自主优化的机制。经过优化与补充，智能体具备自我决策能力的机理可以分解为以下五个部分：1.自主感知与信息获取智能体通过传感器、数据库、互联网信息等多源数据采集，构建全面的环境感知能力。通过数据清洗、去噪、融合等方法，提升感知数据的可靠性，结合高维特征
大语言模型应用指南：OpenAI大语言模型简介 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：OpenAI大语言模型简介1.背景介绍1.1问题的由来在过去几年中,自然语言处理(NLP)领域取得了长足的进步,这主要归功于大型语言模型(LargeLanguageModels,LLMs)的出现和发展。LLMs是一种基于深度学习的人工智能模型,能够从大量文本数据中学习语言模式和语义关系,从而生成看似人类写作的自然语言输出。随着计算能力和数据可用性的不断提高,LLMs的规模也在不
【算法学习】归并排序算法思想的应用—求逆序对数量 _Huazzi 算法学习笔记算法排序算法学习 c++分治法
Hey，大家好！今天我们来聊聊一个有趣的话题——如何在归并排序的基础上，高效解决求逆序对数量的问题。如果你对算法感兴趣，或者正在准备算法面试，这篇文章一定会对你有所帮助！题目描述给定一个长度为n的整数数列，请你计算数列中的逆序对的数量。逆序对的定义如下：对于数列的第i个和第j个元素，如果满足ia[j]，则其为一个逆序对；否则不是。输入格式第一行包含整数n，表示数列的长度。第二行包含n个整数，表示整
预测未来，Python中的时间序列分析模型ARIMA Python学研大本营 python 开发语言
时间序列分析：Python中的ARIMA模型，ARIMA模型是一种常用的时间序列预测工具，可以使用statsmodels库在Python中实现。微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩时间序列分析广泛用于预测和预报时间序列中的未来数据点。ARIMA模型被广泛用于时间序列预测，并被认为是最流行的方法之一。在本教程中，我们将学习如何在Python中搭建和评估用于时间序列预测的A
基于QT框架的开发——飞机大战 facker_Lap C/C++----数据结构 qt 开发语言
基于QT框架的开发——飞机大战概述场景设置创建Player添加Enemy添加Bullet添加碰撞添加Score添加Health游戏的结束与重启添加音效一.概述由于笔者也是一个初学者，所以文章写的很拙劣，还请读者多多包含，这里呢，我推荐一个哔站up主关于飞机大战的学习教程，笔者也是跟着up主学习制作的，飞机大战教程QT是一个跨平台的C++框架，主要是用于图形用户界面（GUI）的程序开发，当然也可以用
[转]挑战程序设计竞赛2 算法和数据结构读后感 Shawn Chou
介绍本篇主要是讲《挑战程序设计竞赛2算法和数据结构》书的读后感和部分题目的再次解读、编程。包括书中的部分代码和一些个人的见解。如果想深入了解，建议去网上买一本回来看，比较适合学习算法的初学者。章节第一章第一章主要让你在AOJ处注册登录，然后开始做题第二章2.5入门问题ALDS1_1_D:MaximumProfit第三章初等排序3.2插入排序法ALDS1_1_A:InsertionSort3.3冒泡
云借阅-图书管理系统夏之目程序 mybatis java spring
程序设计逻辑简单，适合观摩学习使用。文章目录前言一、开发技术与工具二、功能模块三、运行截图总结前言云借阅图书管理系统主要实现了两大功能模块:用户登录模块和图书管理模块，用户登录模块主要用于实现用户的登录与注销;图书管理模块主要用于管理图书，如新书推荐、图书借阅等。一、开发技术与工具1.开发技术：后端：SSM(Spring、SpringMVC、Mybatis)框架前端：JSP、Ajax、JQuery
一、深度学习的基本介绍关关钧深度学习深度学习人工智能神经网络
机器学习的基本步骤：前馈运算、反向传播计算梯度、根据梯度更新参数值。一、定义及基本概念深度学习，就是一种利用深度人工神经网络来进行自动分类、预测和学习的技术。它可以从海量的数据中自动学习，找寻数据中的特征。所以说，它的本质就是自动提取特征的能力。可以说，深度学习就等于深度人工神经网络。一般认为超过三层的神经网络就可以叫做深度神经网络。深度学习属于一种特殊的人工智能技术。反向传播算法：此算法是人工神
【QT开发】所有控件基类QWidget类详解及实战应用 I'mAlex QT开发教程 qt 开发语言
QWidget是Qt中所有用户界面对象的基类，掌握它的用法对于学习和使用Qt进行GUI开发至关重要。通过本篇文章的学习，你应该对QWidget有了全面的理解，能够在自己的项目中正确使用它。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者，提供产品测评、学习辅导、简历面试辅导、毕设辅导、项目开发、C/C++
学习R语言：数学运算与模拟 Mrrunsen R语言大学作业 r语言开发语言
本文内容来自《R语言编程艺术》(TheArtofRProgramming)，有部分修改R内置很多数学函数和统计分布函数。数学函数exp()log()log10()sqrt()abs()sin()，cos()等三角函数min()，max()：向量的最小、最大值which.min()，which.max()：向量的最小、最大元素的位置索引pmin()，pmax()：多个向量逐元素对比sum()，pro
ACM培训2 ZIZIZIZIZ() 算法笔记
学习总结--二分基础知识二分查找前提是有序(即单调),若无序一般先sort向左找while(l=x)r=mid;elsel=mid+1;}向右找while(lusingnamespacestd;intn;longlongx;longlonga[100001];boolcheck(intmid){longlongsum=0,minn=1e10;for(inti=1;i=2*x)return1;els
MySQL 基础学习(2)： INSERT 操作 Purified_Soda MySQL数据库数据库 mysql 学习
在这篇文章中，我们将专注于MySQL中的INSERT操作，深入了解如何高效地向表中插入数据，并探索插入操作中的一些常见错误与解决方案。一、基础INSERT语法在MySQL中，INSERT操作用于向表中插入新记录，基本语法如下：INSERTINTO表名VALUES(值1,值2,...);例如：INSERTINTOstudentVALUES(1,'zhangsan');这条语句会向student表中插
【Python报错已解决】NameError: name ‘python‘ is not defined HoRain云小助手 python python 开发语言
很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨目录引言：一、问题描述：1.1报错示例：1.2报错分析：1.3解决思路：二、解决方法：2.1方法一：定义变量2.2方法二：检查变量名拼写2.3方法三：确认变量作用域2.4方法四：检查模
最详细的Dart Flutter3.X入门实战系列教程完整版，学习Flutter建议收藏！ yuanlaile 学习 flutter
最详细的DartFlutter3.X入门实战系列教程完整版，学习Flutter建议收藏！要学Flutter的话我们必须首先得会Dart。Dart教程全套学习地址（共16课时），教程总学习时长为6小时左右：01Dart介绍WinMac上面分别搭建Dart环境开发工具配置以及运行DartDart教程详细内容介绍：一、Dart介绍WinMac上面分别搭建Dart环境开发工具配置以及运行Dart1、Dar
深入理解与应用：Hyello远程控制台大苏牙
本文还有配套的精品资源，点击获取简介：Hyello远程控制台是一款高效的IT工具，专为远程管理和控制设计，特别适合系统管理员和IT专业人员使用。文章深入解析了Hyello远程控制台的核心原理和实际应用，涵盖了易语言编程、网络通信、权限管理、图形用户界面、多线程编程、加密与安全以及异常处理等关键技术点。通过学习其源码，读者将能够深入了解远程控制台的工作机制，并提升在系统管理与软件开发方面的专业技能。
现代卓越认证指南：PMP项目管理专业学习秘籍大苏牙
本文还有配套的精品资源，点击获取简介：PMP认证作为项目管理领域的全球认可资质，对专业人士的职场竞争力有显著提升作用。文章介绍了南京卓尔越提供的PMP学习策略和资源，强调了PMP框架理解、敏捷方法、风险管理、沟通技巧等关键知识领域的重要性。南京卓尔越的微信图片等资源可帮助考生高效复习和练习，通过定制化学习支持和模拟考试来提高备考效率。1.PMP认证的重要性1.1PMP认证的行业认可度项目管理专业认
【蓝牙学习笔记一】三种实现蓝牙架构理茶德蓝牙蓝牙协议栈 BLE蓝牙蓝牙架构
实现蓝牙的三种架构实现蓝牙的三种架构通过阅读这篇博文的学习总结https://blog.csdn.net/iini01/article/details/799439081.Host+controller双芯片标准架构：将host和controller放在两个芯片上面这种双芯片架构通常用在手机上的蓝牙应用实现。手机里面有很多SoC(systemonchip系统级芯片)和模块，这些SoC和模块都有自己
# AI绘图中的Embedding、CLIP、Flux中的Clip与LCM SDXL加速生成解析迪小莫学AI 人工智能 embedding
AI绘图中的Embedding、CLIP、Flux中的Clip与LCMSDXL加速生成解析在现代AI绘图和深度学习中，涉及了多个复杂的概念和技术，这些技术在图像生成、训练加速以及多模态学习等方面起着至关重要的作用。在这篇博客中，我们将讨论几个关键概念：Embedding、CLIP模型、Flux中的Clip，以及LCMSDXL加速生成技术的实现原理。1.AI绘图中的Embedding是什么意思？在A
机器学习day3 ኈ ቼ ዽ 机器学习人工智能
自定义数据集使用框架的线性回归方法对其进行拟合importmatplotlib.pyplotaspltimporttorchimportnumpyasnp#1.散点输入#1、散点输入#定义输入数据data=[[-0.5,7.7],[1.8,98.5],[0.9,57.8],[0.4,39.2],[-1.4,-15.7],[-1.4,-37.3],[-1.8,-49.1],[1.5,75.6],[0
Python文件操作(json、csv、tsv、excel、pickle文件序列化) herosunly 机器学习入门之工具篇 Python新手快速入门 python 文件操作
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Python文件操作(json、csv、tsv、excel、pickle
爱普特APT32F110x系列时钟介绍西之可乐单片机嵌入式硬件时钟
最近要用APT32F110x做一些开发，顺便学习一下。APT32F110x是由爱普特推出的基于平头哥（T-HeadMicrosystems）CPU内核开发的32位高性能低成本单片机。APT32F1104x基于嵌入式Flash工艺制造，内部丰富的模拟资源，包括模拟比较器、LCD控制器，面向的应用为工业控制，小家电，消费电子设备，可穿戴设备等应用。APT32F1104x的系统时钟源选择和HCLK/PC
Oracle PL/SQL 编程入门：第五章条件控制：CASE 语句的使用 caifox Oracle PL/SQL 编程入门 oracle sql 数据库 CASE CASE语句条件语句 NULLIF
欢迎来到OraclePL/SQL编程入门的第五章！在这一章中，我们将深入探讨PL/SQL中的另一种条件控制结构——CASE语句。通过学习CASE语句和SearchedCASE语句，你将能够编写更加灵活和高效的程序逻辑。此外，我们还将介绍NULLIF和COALESCE函数，帮助你更好地处理NULL值。准备好迎接新的挑战了吗？让我们开始吧！第一节：条件控制：CASE语句CASE语句是PL/SQL中用于
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f