ELT.ZIP

【ELT.ZIP】OpenHarmony啃论文俱乐部—gpu上高效无损压缩浮点数

本文出自ELT.ZIP团队，ELT<=>Elite(精英)，.ZIP为压缩格式，ELT.ZIP即压缩精英。
成员：
- 上海工程技术大学大二在校生
- 合肥师范学院大二在校生
- 清华大学大二在校生
- 成都信息工程大学大一在校生
- 黑龙江大学大一在校生
- 华南理工大学大一在校生
我们是来自7个地方的同学，我们在OpenHarmony成长计划啃论文俱乐部里，与华为、软通动力、润和软件、拓维信息、深开鸿等公司一起，学习和研究操作系统技术…

文章目录

- - 【往期回顾】
  - 【本期看点】
  - 【技术DNA】
  - 【智慧场景】
- 引言
- 背景
- - 并行无损数据压缩的挑战
  - - 可变编码器/解码器状态
    - 可变长度编码
  - 专用浮点压缩器
  - GPU上的数据压缩
- NDZIP
- 并行化方案
- - 压缩管道概述
  - 解压管道概述
  - 共享内存布局
  - 并行整数洛伦佐变换
  - Warp合作垂直位封装
  - 参数调整
- 评估
- - 评估方法
  - 结果

【往期回顾】

① 2月23日《老子到此一游系列》之 老子为什么是老子 —— ++综述视角解读压缩编码++
② 3月11日《老子到此一游系列》之 老子带你看懂这些风景 —— ++多维探秘通用无损压缩++
③ 3月25日《老子到此一游系列》之 老子见证的沧海桑田 —— ++轻翻那些永垂不朽的诗篇++
④ 4月4日《老子到此一游系列》之 老子游玩了一条河 —— ++细数生活中的压缩点滴++
⑤ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——一文穿透多媒体过往前沿++
⑥ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——这些小风景你不应该错过++
⑦ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——浅析稀疏表示医学图像++
⑧ 4月29日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——计算机视觉数据压缩应用++
⑨ 4月29日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——点燃主缓存压缩技术火花++
⑩ 4月29日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——即刻征服3D网格压缩编码++
⑪ 5月10日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——云计算数据压缩方案++
⑫ 5月10日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——大数据框架性能优化系统++
⑬ 5月10日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——物联网摇摆门趋势算法++
⑭ 5月22日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——电子设备软件更新压缩++
⑮ 5月22日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——人工智能短字符串压缩++
⑯ 5月22日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——多层存储分级数据压缩++
⑰ 6月3日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——数据高通量无损压缩方案++
⑱ 6月3日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——快速随机访问字符串压缩++

【本期看点】

并行无损数据压缩的挑战
专用浮点压缩器
压缩管道概述
并行整数洛伦佐变换
Warp合作垂直位封装

【技术DNA】

【智慧场景】

**********	********************	********************	********************	********************	********************	********************	********************	********************	********************	********************	********************	********************	********************	********************	*****************	*****************
场景	自动驾驶 / AR	语音信号	流视频	GPU 渲染	科学、云计算	内存缩减	科学应用	医学图像	数据库服务器	人工智能图像	文本传输	GAN媒体压缩	图像压缩	文件同步	数据库系统	通用数据
技术	点云压缩	‎稀疏快速傅里叶变换‎	有损视频压缩	网格压缩	动态选择压缩算法框架	无损压缩	分层数据压缩	医学图像压缩	无损通用压缩	人工智能图像压缩	短字符串压缩	GAN 压缩的在线多粒度蒸馏	图像压缩	文件传输压缩	快速随机访问字符串压缩	高通量并行无损压缩
开源项目	Draco / 基于深度学习算法/PCL/OctNet	SFFT	AV1 / H.266编码 / H.266解码/VP9	MeshOpt / Draco	Ares	LZ4	HCompress	DICOM	Brotli	RAISR	AIMCS	OMGD	OpenJPEG	rsync	FSST	ndzip

引言

无损数据压缩是一种很有前途的软件方法，可以减少加速器集群上科学应用的带宽需求，而不会引入近似误差。合适的压缩器必须能够有效压缩浮点数据，同时使系统互连饱和以避免引入不必要的延迟。
在通往百亿亿次的道路上，能源效率正成为高性能计算(High Performance Computing, HPC) 创新的主要驱动力。节点内并行性的快速增长，包括GPU作为通用加速器的出现，大大降低了计算密集型应用程序的能源成本。
为了证明数据压缩在加速节点间通信方面的可行性，论文探讨了 GPU 压缩如何提供必要的性能。在ndzip的基础上，提出了ndzip-gpu，这是一种用于 ndzip 的高效 GPU 并行化方案，一种先进的无损浮点压缩器。

背景

并行无损数据压缩的挑战

由于可变编码器/解码器状态和可变长度输出流编码的必要性，传统的无损压缩器倾向于支持串行实现。

可变编码器/解码器状态

在一般情况下，通过为输入数据构建概率模型并将较短的表示分配给可能的输入,将较长的表示分配给不太可能的输入来实现数据量的无损减少（比如Huffman编码）。解码器必须知道编码器的概率模型才能反转此映射。由于模型通常既不是提前知道的，也不是整个数据流的静态模型，因此对于单程压缩器来说，显式地交换它变得不可行。编码器和解码器都将从先前观察到的未压缩符号构建并不断更新相同的模型。
一个高度并行的压缩器必须能够打破这个依赖链，以避免由同步共享状态主导的运行时行为。具有大状态的压缩器（例如字典编码器）在对它的输入空间进行粒度细分是会明显的降低效率。局部去相关方案在这方面更加稳健。

可变长度编码

分块数据流的压缩是一个输入并行问题，因为压缩的块长度事先不知道。并行压缩器的线程必须同步才能确定输出流中各个块的位置。有两种基本方法可以避免围绕这种依赖进行序列化：
- 在快速暂存内存中的 k 个并行线程中压缩 k 个块，在屏障之后导出输出位置，最后让每个线程将写入提交到输出流。
- 将整个流压缩到足够大的中间缓冲区，使用前缀和计算所有块的输出位置，并使用单独的压缩步骤最终确定输出流。

专用浮点压缩器

浮点二进制表示具有比面向字节的通用压缩器所假定的更大的字长。此外，来自实际应用程序的浮点数据有很多位相同的重复值，这些值很容易进行重复数据删除。因此，传统的字典编码器方法在这类数据上并不是特别有效。
源自物理模拟或传感器阵列的密集网格数据往往表现出低频分量，这使得从相邻值进行局部预测是可行的。网格的维数越高，由于每个值的相邻单元数越多，预期的局部相关性就越多。因此，专门的浮点压缩器的构建通常包括以下三个组件：
- 预测器通过字典、哈希表或相邻值从先前编码的点估计数据。
- 差分算子以可逆方式计算值与其预测之间的残差，例如使用 XOR 运算或整数差。
- 残差编码器使用有利于小幅度值的可变长度代码表示残差。算法通常旨在通过诸如游程编码(Run-length encoding, RLE)或算术编码(Arithmetic coding)之类的表示来消除前导零位(leading-zero)。
除了 ndzip 算法之外，还有几个著名的基于 CPU 的无损浮点压缩器。fpzip使用洛伦佐预测器来利用1维网格内点的直接邻域的平滑度，压缩使用范围编码器的残差。该方案表现出很高的压缩效率，特别是对于单精度值，但仅限于单线程操作。FPC使用一对基于哈希表的值预测器来压缩非结构化双精度数据流。线程并行 pFPC 变体允许通过处理块中的输入数据来进一步确定压缩吞吐量的优先级。ZFP是一种固定速率有损压缩器，它使用频率变换对多维网格中的浮点值进行去相关。

GPU上的数据压缩

适用于浮点数据的GPU的公开可用的无损数据压缩器比较少，作者在文中列举了几个：

通用压缩机。nvCOMP³是适用于英伟达GPU的无损数据压缩框架。它包括众所周知的 LZ4 压缩器的高吞吐量实现和非常适合整数数据的可配置级联压缩管道。
cudppCompress是一个通用的面向字节的GPU压缩器。它并行化了著名的bzip2压缩器的三个阶段，与类似时代的硬件CPU实现相比，实现了可测量的加速。对应的并行化解压器没有实现。
在有些工作中，GPU已成功用作协处理器来加速Burrows-Wheeler变换。LZW和LZSS压缩器还存在并行实现，GPU熵编码有快速Huffman和非对称数字系统(ANS)编码器。
专门的浮点压缩机。 MPC是一种用于单精度或双精度浮点数据的非结构化、多变量流的 GPU 压缩方案。两步一维值预测与垂直位打包相结合，这是一种很好地映射到目标硬件的编码方案。
GFC是一种用于非结构化双精度数据的超快 GPU 压缩器。来自一维预测器的残差通过游程编码前导零位来压缩。与所有其他评估过的压缩器不同，GFC 会生成碎片压缩输出，并在传输回主机时进行压缩。

NDZIP

ndzip 是先进的块压缩器，针对单精度或双精度浮点数据的一维到三维网格。它使用整数洛伦佐变换逼近洛伦佐预测器，这是一种用于多维块的局部去相关的可分离就地操作。残差使用先前在MPC 中发现的垂直位打包方案进行编码，消除了相邻残差位位置的零游程。通过完全在整数域内操作，该算法保证了压缩操作的可逆性以及可移植性。与既定的通用压缩器（例如 Deflate）和专用算法（例如 fpzip或FPC）相比，ndzip 已被证明可以在 CPU 上提供出色的吞吐量，其实现同时利用线程和 SIMD 并行性。而ndzip-gpu压缩器完全再现了 ndzip 的压缩格式。
关于ndzip更多的内容，可以看之前发布的文章OpenHarmony啃论文俱乐部—数据高通量无损压缩方案，里面详细的介绍了ndzip算法，并且包含算法的使用教程。

并行化方案

这部分，我们将介绍并行化方案ndzip-gpu如何能够在多达 768 个线程之间有效地分配变换和残差编码，同时将分支发散和序列化保持在最低限度。我们的目标是在设备上的全局内存缓冲区之间进行压缩和解压缩。

压缩管道概述

并行压缩的输出偏移问题可以通过每个块中的全设备同步或多个内核启动以及通过中间全局暂存缓冲区的往返来解决。ndzip-gpu采用第二种方法，预计全局障碍将部分否定计算繁重的残差编码器中短路评估的好处。

图 1 三级压缩管道

上图详细说明了三级压缩过程。内核1将一个未压缩的块从全局加载到共享内存中，将浮点值转换为其整数表示。然后n维整数洛伦佐变换计算n中的残差在原地传递块数据。残差被分组为 32 个单精度或64个双精度值的序列，并通过垂直位打包进行编码，从而产生一个头字和可变数量的非零列。
分配了一个全局暂存缓冲区，为不可压缩的情况提供了足够的空间。索引空间被细分为块，每个块为所有头字保留一个块，然后为每个位压缩列序列保留一个较小的块。从输入网格的维度，暂存缓冲区中的所有块偏移量都是先验已知的。

编码后，每个线程块将它们各自的块写入暂存内存，并将块长度写入单独的缓冲区。内核2计算长度缓冲区上的并行前缀和，以获得紧凑输出流中所有块的偏移量。最后，使用偏移缓冲区，内核 3 从零内存加载块并将它们存储在输出流中的最终位置。每个块中第一个块的输出偏移量收集在流头中.
图2中可视化的流布局有意将固定大小的元信息（块偏移和块头）与可变长度的压缩列编码分开。这允许解码器并行计算压缩列的绝对偏移量，而无需同步或多次通过流。

图 2 压缩流布局

解压管道概述

由于可以从流标头中检索压缩缓冲区中每个块的偏移量，因此解压缩是输出并行的，并且不需要块之间的同步。单个内核启动足以解码整个流或任意块子集。图3详细说明了单个块的解压过程。

内核首先从第一个块中加载所有的头，对设置的位进行计数以获得每个序列的非零列数，最后执行前缀求和以在共享内存中生成偏移表。
然后可以并行反转所有块的位打包，扩展到残差的共享内存块。
然后通过逆整数洛伦佐变换恢复未压缩值的整数表示。
最后，通过反转整数映射来恢复浮点位模式，然后将块写入全局输出网格缓冲区。

图 3 单级解压管道

共享内存布局

必须仔细选择多通道转换步骤的中间结果的共享内存布局，以避免所有必需的访问模式之间的存储库冲突。硬件将根据需要将冲突的加载或存储拆分为尽可能多的无冲突访问，这可以显著增加受共享内存访问限制的函数的运行时间，例如整数洛伦佐变换。这个问题没有明显的通用解决方案，相反，索引空间变换必须分别专门针对一维、二维和三维情况以及单精度和双精度数据。

填充。为了确保沿所有轴访问超立方体的连续索引可以映射到不重叠的银行，插入了填充词。由于每个内存块都是32位宽，并且64位加载和存储是作为两个连续的 32 位访问执行的，因此双精度情况下的填充仍然必须是 32 位宽。这需要对 64 位值进行故意未对齐的访问。
定向访问顺序。在变换步骤的每个维度中，对通道项目的迭代可以建模为固定步幅的循环。然而，由于每个激活的warp(SM的基本执行单元)同时处理 32 个通道，因此必须明确计算每个通道中第一项的内存偏移量。必须再次小心地对一组通道进行分区以避免存储库冲突。

并行整数洛伦佐变换

n维整数洛伦佐变换，包括正向和逆向，由n个通道组成。在每个定向通道中，可以并行处理L个数据；这些通道分布在线程块的线程之间。

前向变换。前向变换在每条车道4096次迭代中构造残差，用与其前任的整数差替换值表示。前驱值在寄存器中进行跟踪，因此该方案只需要在共享内存中的每个数据点执行一次加载和一次存储。
逆变换。为了重构值表示，每个逆变换通道必须将已解码的前驱添加到每个残差。由于这引入了一个大小与块边长相等的依赖链，因此最多可以有4096^{1-1/n}个独立通道（1对应1维， 64对应2维，256对应3维）。
由于每个通道的逆变换构成前缀和，因此可以通过采用并行扫描来避免串行化。在实践中，我们通过在连续块内存上使用快速并行前缀和来反转一维变换，并通过对每个通道执行顺序求和来接受二维和三维情况的有限占用。

Warp合作垂直位封装

固定宽度整数序列的垂直位封装已经在数据库系统中看到了先前的应用。这种压缩长度不能被处理器最小可寻址单元分割的位模式的方法在并行硬件上有效地矢量化，例如支持 SIMD 的处理器。
它可以很容易地适应于压缩输入位位置的任意子集，而不是对整数中的连续位进行操作，再次允许在 SIMD 架构上高效实现。在这种形式中，它以前曾作为MPC压缩器的一部分用于 GPU 浮点压缩。在下文中，我们将未压缩的单词称为行，将未压缩序列中相同位置的位称为列。
ndzip-gpu的新颖打包方案通过以下方式显着提高了现代GPU上MPC方法之外的性能：

短路评估无线程发散的全零块的昂贵转置步骤
通过避免块来允许独立的前向进展- 在打包期间完全同步
通过将压缩块写入全局暂存缓冲区并在解包期间使用单独的压缩内核
避免围绕输出流位置进行序列化，通过读取粗粒度块偏移量来避免围绕输入流位置进行序列化来自流标头并计算块内的细粒度块偏移作为并行前缀和。

包装。在ndzip-gpu编码器中，32 个线程协作打包 32 个 32 位或 64 个 64 位行。图4显示了更简单的32位情况的机制，其中一个字对应一个线程。

图 4 合作垂直位包装

解包。解码阶段使用类似的线程分配，如图5中所示的32位情况。首先，每个打包块的长度被确定为其头部的位数(popcount)。根据这些长度，使用线程块并行前缀和计算打包流的偏移量。

图 5 合作垂直位解包

参数调整

由于ndzip格式要求固定块大小，最重要的可调参数是每个块的线程数。这个数字可以独立于实现的其余部分进行选择，并允许用缓存局部性换取更高的占用率，从而提高隐藏指令延迟的能力。

评估

评估方法

将数据集的压缩比定义为压缩大小除以未压缩大小（以字节为单位），较低的比率表示更好的压缩。该定义允许使用未加权算术平均值从一组观察值中对预期压缩比进行有意义的分析。
通过测量从第一个内核开始到最后一个内核结束的设备执行时间来评估压缩器性能。缓冲区分配以及主机设备内存传输不包括在测量范围内。我们报告每秒未压缩字节的吞吐量，它转换为压缩输入和解压缩输出带宽。重复测量每个算法-数据集对，直到总运行时间超过一秒，但至少五次。
所有 CPU 算法都通过测量执行时间来进行基准测试，不包括可以提前执行的所有内存分配。

结果

图6展示了ndzip-gpu提供的吞吐量和压缩比之间的出色权衡。、

在评估的测试数据上，并行化方案在单精度情况下同时提供了所有测试过的压缩器的最佳平均压缩比和最高吞吐量。
对于双精度，GFC 和nvCOMP级联方案超过ndzip-gpu在 RTX 2070 SUPER 和 A100 GPU 上的速度，但是压缩比更差。
与GFC和MPC不同，ndzip-gpu显示出压缩和解压缩速度之间的显着差异。这可以用压缩器的多级架构来解释，它需要完整的全局内存往返来进行压缩。

图 6 与Tesla V100上的压缩器/解压缩器吞吐量相比的平均压缩比

表 1 Tesla V100 上的每个 GPU 压缩器实现的每个数据集的压缩率和吞吐量

每个数据集的压缩效率。上表列出了每个压缩器在每个数据集上实现的压缩率和吞吐量。虽然ndzip-gpu平均实现了最佳的数据缩减和最高的吞吐量，但某些数据集可以通过竞争对手的算法更有效或更快地压缩。对于大多数输入，ndzip和MPC的比率非常接近，因为这两种算法共享相同的残差编码算法。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul