深度学习大讲堂

饮水思源--浅析深度学习框架设计中的关键技术

点击上方“深度学习大讲堂”可订阅哦！

编者按：如果把深度学习比作一座城，框架则是这座城中的水路系统，而基于拓扑图的计算恰似城中水的流动，这种流动赋予了这座城以生命。一个优雅的框架在保证城市繁荣的同时，还能让这座城市散发出独特的魅力，使它保持永恒的生命力。本文中，年仅22岁的开源框架Dragon的设计者、中科院计算所博士研究生、中科视拓实习算法研究员潘汀，将结合独立开发深度学习框架的经验，介绍框架设计中的关键技术，并给出其发展趋势的简单分析。文末将分享讲者自己设计的开源框架：Dragon。

以下是本文作者在CCML2017-深度学习Tutorial上分享的报告：

在去年的CES展会上，英伟达CEO黄仁勋，放了这样一张图，上面列了近几年学术界工业界的一些杰出框架，并称赞这些框架是当代AI发展的引擎。

虽然略有广告之嫌，但深度学习框架确实是相当重要的。这体现在以下两个方面：

从工程性上来说，无论是工业界还是学术界都需要可靠的框架来支持计算量庞大的实验；

从学术性上来说，以深度学习为主的论文每周都有大量的更新，如果没有框架：

(1)一周内不可能复现完世界上各大研究组的工作

(2) 会议的deadline截止了，实验还没有跑完

MXNet框架作者之一的李沐博士曾经开过这样的玩笑：“我们这一群曾经一起写框架的小伙伴，如今都年薪百万了。”这间接体现了框架开发和维护人才的稀缺。

放眼Github，明明已经有那么多优秀的框架了，那么为什么我们还需要自己写框架呢？

这里就有俩种不同的声音了：

第一种声音来自地平线机器人的余凯博士，他曾公开表示对以TensorFlow为主的框架产生的垄断效应而产生担忧。

与之相对的是，LSTM作者之一的Schmidhuber教授在ICML15上的观点：AI研究的代码是非常自由，我们并非一定要局限使用固定的代码来源，总有人不喜欢TensorFlow，这就是它难以垄断的根本原因。

所以，无论是否会产生框架垄断，AI研究者都必须刻苦钻研代码技术，这才是最重要的。

以上是我今天报告的主旨。下面我将从4个方面，结合独立开发框架的一些经验，介绍目前深度学习框架设计中最新的一些关键技术。

框架设计界目前有两大阵营，命令与声明式，可以根据是否使用计算图来划分它们。基于计算图的声明式框架，需要先假设完整的模型，再对模型进行一次性求解。相反，不使用计算图的命令式框架，如其名，只能逐步求解了。

下面这张表列出了两个阵营的战力对比，我们可以看到，自2012年后，绝大多数深度学习框架都选择了基于计算图的声明式求解。

这并不是什么巧合，计算图表示本身是优雅的，它携带的上下文拓扑关系允许我们结合领域知识对组合运算做进一步优化。

计算图这个概念大家现在基本是比较熟悉了，它本质就是一个有向无环图。

那么为什么这么一个简单的小小有向无环图就能用于大部分基础表达式建模呢，这里列出两种较为广泛使用的观点：

(1) 表达式计算具有拓扑先后性，这意味着图的有向遍历可以用来建模表达式。

(2) 最早来自Bengio教授在著名的《Learning deep architectures for ai》文章中的观点，也就是神经网络是天然的有向图，注意这里是可以带环的，我们可以使用一些小技巧把环去掉。

同时注意到，这篇文章也是Theano框架的开发的参考之一，它也成为第一个基于计算图的深度学习框架。

传统的深度学习框架通常是双向的执行逻辑，它们使用Layer这种粗粒度的抽象结构，前向传播时，执行一个从0开始的递增循环。反向传播时，倒过来做一个递减循环。

这种多次执行的逻辑实际上是与有向图计算思想相悖的。有向图计算倡导的是”一波流“，控制逻辑简洁、简单，而Layer级别的抽象很难做到这一点。

让我们换一个思路，把一个”层“拆解成两个符号，一个做前向，一个做反向，前向后面接着反向，这样整个计算图就避免了先后循环两次的问题。

以TensorFlow为主的框架通常并不倡导这种中间断裂执行的逻辑，这使得早期一些深度可视化工作难以复现。在这一点上，通常会有两种解决方案：

(1) MXNet的做法很简单，仍然保持前反向的双逻辑，只是分段执行图的不同部分。

(2) 我们的工作受到了Caffe(1)的启发，允许图在执行时动态引入包含/排除规则，因此可以根据需求，划分任意的部分图执行逻辑。

使用Layer这种粗粒度结构所导致的另一个问题是反向传播的贡献分析过程码农化。经典的例子是Caffe(1)中的暴力模拟做法：

(1) 首先定义一个集合，用于插入对损失有贡献的Blob。

(2) 由损失开始反向倒退，根据本层输出是否被”贡献“，判断本层是否需要反向计算

(3) 在逐层倒推的过程中，不断的更新贡献集合。

而我们的做法非常简单，借助简单图遍历染色，仍然可以在线性时间复杂度内完成贡献分析。

要支持灵活的图遍历染色，首先我们要将原本粗大笨重的Layer给分解掉。链式法则的拓扑性非常优美，它是一个经典的后入先出FIFO逻辑。

如图，我们可以直接在正向过程后，对称地展开反向过程。

在得到这样的完全展开图后，我们需要对符号结点所辖的输入输出结点，(这里我们用张量结点来描述它们)，做一些约束：

首先我们定义源点和汇点，源点可以是任意是用户指定的数据输入点，而汇点，通常是以下三种：用户指定的中间求解点、目标函数结点，以及偏导数结点。

连通路是图遍历的基本需求，前向过程中的连通路可以由表达式或者神经网络结构确定，而反向过程中连通路，根据链式法则及对应符号的计算规则即可自动生成。

预先生成的大量连通路通常是冗余的，这时候就需要对朴素的计算图进行剪枝。

这张图来自去年的微软雷德蒙德研究院讲座，两位作者分别是陈天奇博士，解浚源博士，他们是MXNet框架的两位主要作者。

这里列出了常见三种计算图的优化，图的依赖性剪枝，符号融合，以及内存共享。除了符号融合外，其余两种都可以用非常简洁的代码实现，是我们本次我们讨论的重点。

图的依赖性剪枝是我们需要首先考虑的问题。前向传播过程中的剪枝较为简单，如图，假设我们同时计算两个A+B问题，输出分别为X和Y，那么最简单的做法就是由X，Y开始，沿父结点方向遍历染色，未染色结点则一定不是求解目标所依赖的。

这是完整的算法，为了实现简洁，我们只采用了深度优先遍历。

反向传播的剪枝较为复杂，首先我们来看左图，通常这是自动生成的全导关系。假设用户只需要求输出X关于输入A的偏导，输出Y关于B的偏导，从dA或dB沿着父节点遍历一定会污染到不相关的求解链式上，因为它们默认是连通的。

这个问题可以等价成寻找在各个结点上的最优子结构，与最短路不同，这里我们将依赖边数目定义为代价。朴素算法时间复杂度是指数级的，我们可以借助动态规划在线性时间复杂度内实现它。

具体来说，首先我们定义一个三状态的动规标记，记录当前结点x的访问情况。

状态0表示该结点未访问，状态1表示该结点已访问，但其子孙结点与当前指定的目标结点都不连通。最后状态2则表示其子孙结点目标结点连通。

当搜索至任意结点时，若状态为0，显然未访问，继续搜索。若状态为1，则后续结点与目标节点不连通，代表已无继续搜索必要。若状态为2，它将被后续结点依赖，我们再把其记录的已搜索的路径和后续路径进行合并。

该动规算法可以保证每个结点只被访问一次情况下，完成所有偏导关系的剪枝。

除剪枝外，另一种常见优化就是原位替换。这里考虑一种三个ReLU函数连续的极端情况，通常情况下，除了输入A之外，我们会得到B，C,这两个中间量，以及D这个最终目标量，需要开4倍的内存。但如果我们开启原位替换，结合ReLU函数的特性，不断擦写输入，最终只需要A这个量本身。

实现原位替换最简单的方式是重命名。需要先假设任意结点为祖先结点，搜索一条符合替换规则的最长链。那么该链上所有结点都可以重命名为祖先结点。

基本的替换规则适用范围并不广，这里我们提供一个较为简单的，它需要如下特定结构：

孩子结点数量仅为1，这是一个基础规则
所属符号支持替换模式，这是一个附加规则，可通过类似Caffe2的OpSchema来获取。

顺便我们来回忆一下Caffe(1)中原位替换，它需要人工设置，比较灵活。

这里使用的自动推导方式，虽然只能处理一些简单的符号，但还是很好用的。

在计算图框架的设计中，可以根据需要二选一。因为原位替换将导致图带环，导致无法剪枝。

搜索原位替换结构略微费时，因为每个结点可能在多次搜索中被遍历，但单次搜索长度是有限的，范围在3~5左右，我们仍然认为它是线性的时间复杂度。

结合上面的一些技巧，我们可以完成一个自动求导的小应用。首先回忆一下Caffe(1)中模拟链式法则计算的一个小技巧：

各层编写一个逐元素计算梯度的函数
然后自顶向下依次执行即可

如何用这种计算思想山寨一个类似Theano中使用的自由求导函数呢？很简单，只需要三步：

1）生成全导关系的图定义

2）收集用户指定的所有偏导关系二元组

3）根据偏导关系及上文的反向传播剪枝算法移除不相关的计算链

这是我们的框架使用的自动求导策略，实现起来并不是困难。

如果说计算图表示及其优化是一个框架的骨架，那么内存优化就是其血肉。传统框架通常轻视，甚至忽略这一步，随着深度学习越搞越深，这些框架的发展也步履维艰。

典型的例子是Caffe(1)，这个框架实际上基本没有任何内存优化，现在我们更多是拿它作为一个无优化的基准。其自身架构缺陷导致了以下两个很严重的内存问题：

第一，卷积缓冲区的重复申请。单次GEMM卷积临时变量其实不是很大。但在深度堆叠结构里面，这就很要命了，以16层VGG16网络为例，这些重复的缓冲区累积起来大概会多占用3G显存。通常多个卷积层计算不是并发的，那么是否可以共享它们？

第二，交叉验证过于昂贵。由于设计缺陷，训练网络和验证网络内存是完全隔离的。这就等于我们直接同时运行了2个网络。通常训练过程和验证过程不是并发的，那么是否可以共享它们？

针对C1薄弱的内存管理，C2在设计之初就引入了全新的管理结构——工作区机制。

工作区是一个全新的内存托管平台，常规的Blob的申请只能通过它来完成。每一段内存都有唯一的”键“进行实名制管理。工作区之间的内存是隔离的，这为自动并行提供可能。此外，工作区直接向Python前端暴露，规范了PyCaffe混乱的内存访问与修改。

工作区并不是什么新鲜设计，实际上就是工程领域很常见的MVC编程结构，通过它，数据和业务逻辑得到分离。用于改正在Net或者Layer开内存的这样的坏习惯。

利用工作区，可以很轻易的实现GEMM卷积的缓冲区共享。我们在测试中发现，该实现在输入图像尺寸不大的情况下，占用显存甚至比cuDNN实现还要少。

梯度回收是目前另一种普遍使用的内存优化。它利用了梯度结点优雅的特性：入度不定，出度为1，这意味着梯度是可以”阅后即焚“的。

入度不定的通常解决方案是梯度分支求和合并，C1扔在了SplitLayer中处理，C2则直接自动追加了一个求和符号。当我们合并了各分支梯度后，一个非常重要的优化是立即释放分支，否则在长时序的RNN中，会导致巨额的瞬时内存开销。

出度为1是一个巨大诱惑，这意味这我们是可以直接擦写其内存的。释放它或者留给前一层梯度计算使用都可以。回收梯度可使训练内存仅为基准的50%，而速度只下降15%~20%，这是一个非常划算的时间换空间买卖。但缺陷是全局的中间梯度都被破坏，难以进行调试。

针对这个问题，我们引入调试模式。通过检查用户是否设置调试标志位，以确定回收函数是否开启。

优雅地回收需要一些技巧。这里我们通过引入”缓冲区回收栈”来完成它。缓冲区在大多数符号设计中都是必要的，有趣的是，我们回收的梯度也可以直接用于缓冲区。

我们使用栈来存储可被使用的缓冲区，同时默认设定栈容量为3. 这个数字也很有意思，cuDNN的卷积默认会需要2个，而梯度租用也需要一个。栈的特性是后入先出，我们用它来维护临近使用缓冲区的大小稳定，避免频繁释放和顺次申请。

回收“栈”仍然也交给工作区托管，跨符号或层可共享使用。

2015年提出的ResNet是个好东西，但是跑起来却是一个灾难。首先，ResNet的极深，大量的中间输出是难以释放的，加上稍大的batchsize之后，整个网络对内存的要求极其恐怖。相比之前的没显卡就买显卡方案，我们现在得加上“买更大的显卡”选项。

优化ResNet也是非常简单的。早在1年前，Torch的Blog就给出了下面的几个方案：包括使用cuDNN版的BatchNorm，回收梯度，原位替换残差分支的加法。这些小技巧能够极大减少ResNet的门槛。

将它们全部应用之后，ResNet就显得非常亲民了。很有意思的是，MXNet和TensorFlow的结果和这个是非常接近的。

更进一步的内存优化，这里我们称之为极限内存优化，目前并没有被多数框架采用。其主要思想是丢弃前向计算中的中间结果，在反向传播需要时，重新计算它们。比如经典的卷积+BN+ReLU结构，由于BN和ReLU算的比较快，直接擦写其中间结果也是可行的。几天前在arXiv放出DenseNet显存优化就使用该方案。

广义上来看，这涉及到一个时间空间均衡问题。我们可以贪心地保留时空比较高的结果。具体一些细节可以参考MXNet的memonger库，及在arXiv上对应的论文。

有了骨架和血肉，我们还得给框架注入新的智慧。

目前框架设计的一个争论点是，梯度的求解函数到底放哪？以C1，MXNet为主的框架主张放在同符号类中，以forward和backward区别。以C2，TensorFlow为主的框架则主张放在异符号类中，不区别。

那么为什么要分离出梯度计算过程呢？这里列出我的几点思考：

第一，部分符号根本不存在梯度求解

第二，自定义符号可能需要终止梯度（如RCNN中的PythonLayer）

第三，强制终止梯度（如TensorFlow中的梯度停止算符）

第四，最重要的是，这样可以提供最完整的链式求导编程体验。

我们可以从Caffe2全新的符号设计中观察到，原本捆绑式的输入/参数结构被移除，取而代之的是算符及其操作数，这极大的规整了原先混乱且含糊的计算表示。

这是一个卷积层拆解的简单例子，对于每个算符而言，输入即是常量，输出即是变量，多余的表示不存在，也自然不可能被用到，更不可能被用错。

通常前向计算中会产生一些中间资源，当前反向计算分离时，如何传递它们便成了一个新的问题。为此，我们引入锚点机制，在前反向符号间建立用于哈希的锚点，这些锚点可用于直接从工作区中拉取已计算资源。与Caffe2直接将其混入操作数相比，我们的方法既维持了符号编程接口的简洁，又模拟了与Caffe1近似的编程体验。

几年前，我们很难想象深度学习竟可以适应半精及更低的精度，带类型的模板元编程曾经是众多框架争相模仿的设计，如今，计算设备对不同算符支持类型趋于多样化，再看带类型模板，不得不说完全是搬起石头砸自己的脚。

如果追踪Caffe2最近更新的代码，可以发现部分算符已经完全移除了类型模板，替换成了一个简单的if语句。随着明年Volta GPU架构开放更多的半精度编程接口，这种趋势将会愈演愈烈。

与之相反的，将设备用于模板逐渐成为诸多框架广泛采用的设计。符号对设备的支持通常是稳定的、全面的，利用模板，我们可以免除上图那样蹩脚的函数命名。

早期的框架都是清一色的C语言编程接口，C语言是编译语言，尽管它十分适合设计内核，但在应用和扩展上，通常捉襟见肘。与之相对的，Python，非常灵活的脚本语言，我们知道它的库不仅多的用不完，速度还快。那么为何不将两者结合起来，用C语言写纯净的计算内核，而用Python搞应用呢？

这种想法最早见于Caffe(1)中的PythonLayer，大家都觉得好用，所以现在基本是个框架都支持这种特性了。

交叉语言的引入，意味着内核将会在C语言端和Python端跳跃执行。基于此的经典案例就是用于语义分割的FCN以及用于目标检测的RCNN。我们的工作还发现，Python端非常适合用来做多进程的数据缓冲，为此，我们在内核中移除了所有数据库及OpenCV代码，仍然可以满足ImageNet分布式训练的IO需求。

从符号层面，我们已经看到现有框架在设计上已经各种“撞车”了。

这些框架大多都需要繁琐的编译配置，但功能基本是相似的。接口设计的不同导致学习成本和配置成本很高。

Keras框架似乎可以解决这个问题，但真的看起来这么简单吗？

仔细分析这个封装框架，就会发现它是没有自己内核的，仅仅依靠自身引入的新接口来将执行引导至多个内核上。这是一个很严重的问题，因为相同的调用，在多个内核上的结果可能是不同的，我们并不能保证TensorFlow的执行结果和Theano执行结果完全一致。

此外，它的封装层次过于复杂，调试非常困难，既不适合学术界，也不适合工业界。

为了消除多个框架之间的分歧，另一种可行方案就是中间表示。早在20年前，这个思想就已经在编译器界流行，于2000年诞生的LLVM项目，就成功利用中间表示，将跨语言的多个编译器整合至共同的编译方案中。

20年后，再看我们这些深度学习框架，也大量使用了类似的中间表示，是不是有种殊途同归的感觉？

中间表示带来的优势是明显的，从硬件层面来说，有望在跨计算设备上实现计算内核的自动生成，并且更紧地结合编译器做一些上下文的优化。从软件层面来说，中间表示可用于表示拓扑连接，与工厂模式结合后，便形成了今天大多数框架都采用的组件化符号编程。

对计算图做虚拟化，便得到了计算图虚拟机。这是一个很有意思的工作，以我们的SeetaDragon框架为例，既不需要安装上述框架，也不用担心混合使用它们的冲突。

对于研究者来说，最贴心的，莫不是使用最熟悉的框架来编程了。当模型被快速建立后，将会转换成内核执行的确定中间表示，对于开发者而言，定位到内核上确定的调试点并不困难。由中间表示发布或是部署这些代码，模块间的代码冗余可以得到控制，几乎没有移植成本。

基于计算图虚拟机，便可将这三者天然结合在一起。除我们之外，同期还有一些的近似工作，比如，DMLC深盟基于MXNet的NNVM，Intel基于Nervana的NervanaGraph，脸书的Caffe2结合PyTorch的双子星框架战略。

这是一张由我们内核互通三个框架后的架构图，Bengio教授曾以组合子函数构建新函数来类比深度神经网络，如果将其倒过来，用神经网络来类比子函数构建新函数，子框架构建新框架，似乎也是合理的。既然深度优势可以让模型大量减少参数，那么也同样可以减少虚拟机中各框架间的代码重叠度。

超越计算图后，虚拟化也可以延伸至符号设计上，但这将更多地涉及设备和编译器。未来的几年内，我们可以预见更多在符号虚拟化上的工作，框架的设计难度，也将随之超出个人可以维护的范畴。

希望以上内容，能够对大家在学习框架过程中有所帮助。编写一个自己使用的框架，也许只需要一个月，但维护和扩充它可能需要数年。报告中没有涉及的三点：架构精简、算符扩充、以及分布式训练，都需要投入更多的时间去研究。

需要强调的是，无论框架如何演化，如何利用它们做出有用的工作，才是最重要的。但也不能完全不关心它们的发展，在这一点上，MXNet主要作者，解浚源博士在知乎上的回答则发人深省：无论你想做深度学习还是深度学习系统，都需要同时了解两方面的知识，否则很难做出在实践中有用的成果。

我们的工作已经在Github上放出：https://github.com/neopenx/Dragon

Dragon是一个非常轻量的计算图虚拟机框架，欢迎大家贡献PR。

致谢：

本文主编袁基睿，诚挚感谢李珊如对本文进行了细致的整理工作。

该文章属于“深度学习大讲堂”原创，如需要转载，请联系 astaryst。

作者信息：

作者简介：

潘汀，中科院计算所2017级博士生，导师山世光研究员。主要研究兴趣为目标检测技术与深度学习框架设计，目前独立开发与维护基于计算图的多重虚拟化深度学习框架Dragon。

往期精彩回顾

VALSE2017系列之八: 物体识别与物体知识表征的认知神经基础

Seeta看ＡＩ：从大数据驱动到x数据驱动

VALSE2017系列之七：视觉与语言领域年度进展概述

人脸检测与识别年度进展概述

视频行为识别年度进展

欢迎关注我们！

深度学习大讲堂是由中科视拓运营的高质量原创内容平台，邀请学术界、工业界一线专家撰稿，致力于推送人工智能与深度学习最新技术、产品和活动信息！

中科视拓（SeetaTech）将秉持“开源开放共发展”的合作思路，为企业客户提供人脸识别、计算机视觉与机器学习领域“企业研究院式”的技术、人才和知识服务，帮助企业在人工智能时代获得可自主迭代和自我学习的人工智能研发和创新能力。

中科视拓目前正在招聘：人脸识别算法研究员，深度学习算法工程师，GPU研发工程师， C++研发工程师，Python研发工程师，嵌入式视觉研发工程师，运营经理。有兴趣可以发邮件至：[email protected]，想了解更多可以访问，www.seetatech.com

中科视拓

深度学习大讲堂

点击阅读原文打开中科视拓官方网站

你可能感兴趣的:(饮水思源--浅析深度学习框架设计中的关键技术)

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
直抒《紫罗兰永恒花园外传》雷姆的黑色童话
没看过《紫罗兰永恒花园》的我莫名的看完了《紫罗兰永恒花园外传》，又莫名的被故事中的姐妹之情狠狠地感动了的一把。感动何在：困苦中相依为命的姐妹二人被迫分离，用一个人的自由换取另一个人的幸福。之后，虽相隔不知几许依旧心心念念彼此牵挂。这种深深的姐妹情谊就是令我为之动容的所在。贝拉和泰勒分别影片开始，海天之间一个孩童凭栏眺望，手中拿着折旧的信纸。镜头一转，挑灯伏案的薇尔莉特正在打字机前奋笔疾书。这些片段
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
读《人世间》有感一0一
这个寒假，就如同朋友圈中的一段话：一闭眼，一睁眼假期还有5天，在一闭眼一睁眼假期还有12天；再一闭眼一睁眼假期还有20天；不敢睡，不敢睡啊……受疫情影响，这个假期变得漫长又煎熬，我也无时无刻不关注着疫情的变化。当然这样的一个假期，我还真得要感谢周翔，因为他有个爱看书的习惯，所以家里有不少他看过的书，可以让我随意挑选，因此也让我的假期不至于那么无所事事。这次我选了一本梁晓声的《人世间》，作为一名语文
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
ARM中断处理过程落汤老狗嵌入式linux
一、前言本文主要以ARM体系结构下的中断处理为例，讲述整个中断处理过程中的硬件行为和软件动作。具体整个处理过程分成三个步骤来描述：1、第二章描述了中断处理的准备过程2、第三章描述了当发生中的时候，ARM硬件的行为3、第四章描述了ARM的中断进入过程4、第五章描述了ARM的中断退出过程本文涉及的代码来自3.14内核。另外，本文注意描述ARM指令集的内容，有些sourcecode为了简短一些，删除了T
如何成为段子手欣雅阅读
我是一个尬聊大师，与朋友聊天经常把话题聊死，留我一个人在群里，望着自己打下的最后一句话无语凝噎。看到风趣幽默的朋友与人聊天，很是艳羡，觉得自己何时才能成为这样的段子手呢？一、段子是什么？“段子”一词在百度百科上的解释：本是相声中的一个艺术术语，指的是相声作品中一节或一段艺术内容。我的理解：段子就是一些搞笑的故事或者笑话。二、为什么要会说段子？不知道大家有没有这样的朋友，本来很无趣的聚会，只要有他参
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发