weixin_39865952

偏微分方程数值解法pdf_天生一对，硬核微分方程与深度学习的联姻之路

机器之心原创

作者：蒋思源

微分方程真的能结合深度神经网络？真的能用来理解深度神经网络、推导神经网络架构、构建深度生成模型？本文将从鄂维南、董彬和陈天琦等研究者的工作中，窥探微分方程与深度学习联袂前行的路径。

近日，北京智源人工智能研究院开展了第一次论坛，其以「人工智能的数理基础」这一重大研究方向为主题，从数学、统计和计算等角度讨论了智能系统应该怎样融合数学系统。

在论坛中，北京大学董彬副教授、林伟研究院和张志华教授等研究者从基础出发介绍了「数学」眼中的机器学习是什么样的。而这些数理基础，正好是构建可计算、可泛化、可解释和稳健 ML 系统所必需的。

在众多演讲中，我们发现董彬老师介绍的微分方程非常有吸引力，它对于探索新的深度学习架构、构建更高性能的深度学习模型非常有帮助。因此在这篇文章中，我们重点关注微分方程在深度学习中的应用，看起来，它们确实是天生一对的组合。

微分方程与深度学习

深度学习还能与微分方程相结合？是的，这是一个很有意思的领域，近来也有非常多的研究成果，包括 NeurIPS 2018 的最佳论文。那么什么是微分方程，它结合深度学习又有什么用呢？

按照维基百科的描述：「微分方程是一种数学方程，用来描述某一类函数与其导数之间的关系」，因此一个方程如果同时包含函数及其导数，那么就可以称为微分方程。例如，f'(x) = 2x 就是一个常微分方程，我们可以「看出来」其通解为 f(x)=x^2 +C，其中 C 表示任意常数。

不过深度学习一般也就会用到概率论、线性代数和最优化等基础数学，似乎与微分方程没什么关系？其实并不然，如果我们探索网络架构到底与数学的哪些概念是相关的，那么会发现深度神经网络可以理解为一种微分方程。即，深度神经网络架构，就是离散化的微分方程。

因此如果能找到了微分方程与深度网络之间的关系，那么两个领域之间的研究成果就能互相借鉴，也就能找到更高效的深度模型。

此外，深度学习的模型设计缺少系统指导，大多数深度学习模型都缺少可解释性，这也限制了它的应用。如果加上了微分方程，那么网络架构就是数值微分方程，网络训练就是最优控制，神经网络的设计也就能有理论指导了。

如上图所示，比较受关注的是神经网络架构与数值微分方程之间的关系，这个领域早期比较有影响的就是北大、普林斯顿教授鄂维南老师的研究，它首次将残差网络理解为微分方程。北大董彬等研究者在 ICML 2018 中进一步表明 ResNet、PolyNet、FractalNet 和 RevNet 等网络都可以理解为微分方程的不同数值离散方式。

此外，在 NeurIPS 2018 的最佳论文中，陈天琦等研究者提出神经常微分方程，在近似常数级的内存成本上，ODENet 能实现高效的图像分类和生成任务。在 ICLR 2019 中，陈天琦等研究者进一步将微分方程应用到流模型中，从而获得内存效率更高的生成模型。

正如董彬老师所言，通过结合微分方程，我们可以从数学角度出发设计网络架构，并分析它们的泛化性能和可解释性。在这篇文章中，我们希望从基本概念到应用，介绍该领域的一些新想法。

数学老师眼中的 ResNet

鄂维南院士是一位主要关注数学领域的研究者，也是北京大学和普林斯顿大学的教授。在 17 年的《Communications in Mathematics and Statistics》中，鄂维南发表了一篇文章，他讨论了使用连续动力学系统建模高维非线性函数的想法，即微分方程与深度学习之间的关系。

以下是该工作的地址：

论文：A Proposal on Machine Learning via Dynamical Systems
论文地址：https://link.springer.com/article/10.1007/s40304-017-0103-z

在这篇「Proposal」中，鄂老师表示深度神经网络可以理解为离散的动力学系统。离散的动力学系统很难分析，但连续的动力学系统在数学上更易于分析，因此它可作为深度神经网络的数学基础。此外，因为有很多种方式离散化动力学系统，所以我们也许能构建更多有意思的模型。例如，动力学系统可以选择自适应的时间步大小，这对应于选择自适应的神经网络层级。

这一篇文章提出了非常多的新洞见，尤其是结合常微分方程与深度残差网络的新视角。下面让我们看看在数学家的眼中，残差网络到底该怎样推导。

离散动态系统：ResNet

因为 DNN 可以视为离散的动力学系统，那么每一步最基础的动力学过程即线性变换加上非线性激活函数，这是最简单的非线性离散动力学系统之一。具体而言对于深度残差网络，我们可以用离散动态系统描述为：

其中 Z_l 和 Z_l+1 为第 l 层的输入与输出，y_l 为第 l 层的辅助变量，h 和 g 为一些映射，它们可以是线性的，也可以是非线性的。对于深度神经网络，如果 g 和 h 是恒等映射，训练会非常顺畅，那么为什么会这样呢？为什么 g 和 h 是恒等映射就能减轻梯度爆炸或消失问题？

实际上，如果令 G 为 g 的逆向映射(inverse map)，我们可以将上述动力学系统写为：

为了有一个稳定的训练过程，即梯度不爆炸、不消失，上述方程右边的梯度需要接近于恒等映射。也就是说，梯度由后向前传时，它在量上需要保持稳定。鄂老师表示若令 h 和 g 都为恒等映射，∇G∇h 就逼近恒等映射(F 为较小随机扰动)，梯度的传递就非常平稳。

其实若 h 和 g 为恒等映射，那么方程 2.3 就可以写为：

这难道不就是标准的残差连接吗？它不就是如下动态系统的离散化吗？

这里 t 相当于层级 l 的连续化，如果 l 趋向于无穷小，那么按照导数的定义，z_l+1 与 z_l 两层之间的差就趋向于 z 对 t 的导数。所以，可以说残差网络其实就是连续变换的欧拉离散化，它是一个特例。

如果从导数定义的角度来看方程 2.7，当 t 的变化趋向于无穷小时，隐藏状态的变化 dz 可以通过神经网络建模。当 t 从初始一点点变化到终止，那么 z(t) 的改变最终就代表着前向传播结果。

从节选的几步推导，我们可以看到，ResNet 能天然理解为动力学系统，能用微分方程天然表示。但是所有的，或大多数深度神经网络都能这样理解吗？董彬老师做了进一步的研究，他们将这一观点推广到了更多的深度神经网络。

其它深度卷积网络又怎样？

北京大学董彬副教授等研究者做了进一步探讨，即 ResNet 与微分方程的这种关系是特例还是一般化的联系。如果数值 ODE 和网络构架的联系建立起来了，董彬老师表示我们就可以从数值 ODE 反推出一些有用的神经网络构架。因为 ODE 已经发展了几十年，有丰富的研究成果可以参考，反推的新架构可能取得更好的效果。

在 ICML 2018 的一项研究中，董彬等研究者表示很多高效的卷积神经网络都能解释为微分方程，并基于微分方程的线性多步解法提出新的线性多步架构，这种结构能提升 ImageNet 等的图像分类任务的性能。

论文：Beyond Finite Layer Neural Networks: Bridging Deep Architectures and Numerical Differential Equations
论文地址：https://arxiv.org/abs/1710.10121

微分方程的解法即网络架构

这里展示了其它卷积网络与微分方程之间的关系，它们在图像识别等任务上都非常有效。如下所示为 ResNet 及其它三种卷积网络架构。

图源：arXiv: 1710.10121

其中 PolyNet 为每个残差模块引入了 PolyInception 模块，从而加强模块的表达能力。PolyInception 模块是 Inception 单元的「多项式」组合，它会以并行或串行的方式集成多条计算路径。FractalNet 以自相似性为基准设计架构，它会重复引用简单的扩展规则，从而生成结构为截断分形(fractal)的深度网络。最后的 RevNet 是一种可逆网络，它不需要在前馈传播中储存中间激活值。

在下表中，董彬老师总结了不同卷积网络对应的微分方程数值解法。其中 ResNet 和 ResNeXt 可视为步长为 1 的前向欧拉离散化，其它卷积网络也对应着不同的离散化方式。

图源：arXiv: 1710.10121

PolyNet

这里我们先看看 PolyNet 怎样搭上微分方程这班车。PolyNet 主要希望提供多样性的架构，因此 PolyInception 除了常规残差模块的一阶路径，还添加了另一条二阶路径。具体而言，PolyInception 模块可以表示为：

其中 I 表示恒等映射，「·」表示作用于，即 F·x 表示非线性变换 F 作用于 x。我们可以看到，PolyInception 多了一个二阶的复合函数，也就是说，如果 F 表示某种 Inception 模块，那么二阶的路径会穿过串联的两个 Inception 模块。在 PolyNet 原论文中，作者展示了可能的 PolyInception 结构：

图源：arXiv: 1611.05725

如上所示，a 和 b 是等价的，F 和 G 表示是否共享参数。董彬老师表示，PolyNet 可以解释为时间步为 1 的反向欧拉方法，实际上前向传播就是在解一个反向欧拉。

不过本身反向欧拉要求解一个非常巨大的非线性方程组的逆，这样无法求解就只能用多项式去逼近解。也就是说，上式的求逆又可以写为：

因此，PolyNet 可以视为采用反向欧拉策略解常微分方程 u_t = f(u) 的逼近方法。如果这样理解，那么它暗示着允许更大的时间步大小，因此这表示我们可以采用更少的残差模块就能构建更好的效果。这正好解释了，为什么 PolyNet 能增加残差模块宽度而降低层级深度，从而实现更好的分类准确度。

此外，从微分方程的角度来说，反向欧拉法要比正向欧拉法有更好的稳定性。这也能从侧面说明为什么在相近参数和计算量下，PolyNet 能实现更好的效果。

FractalNet 与 RevNet

FractalNet 与 RevNet 也都有对应的微分方程「解法」，研究者发现 FractalNet 的宏观架构能解释为数值分析中著名的 Runge-Kutta 方法。例如对于复合次数小于等于 2 的 FractalNet，每一个模块都可以表示为：

其中 f_1 和 f_2 分别表示不同的 Fractal，如果我们看看二阶的 Runge-Kutta 方法，我们就会发现他们的表达式非常相似：

另外的 RevNet 也是一样，因为它是一种可逆的深度网络，所以它有从 X 到 Y 和 Y 到 X 的过程。如果它们分别对应着前向欧拉方法，那么就表示两条简单的动态系统就能描述整个神经网络。此外值得注意的是，虽然深度学习中很少有可逆的双向网络，但是在微分方程中，动态系统的正反向都是可行的。

最后，董彬老师还根据数值微分方程提出了一种新的结构：Linear Multi-step Architecture。他表明加上这种结构，残差网络只需要一半的参数量就能达到相同的训练效果，这表示新结构使卷积网络的训练更高效与稳定，希望了解的读者可查阅董老师的原论文。

神经化的微分方程

微分方程除了为深度网络提供理论解释，并启发架构创新，它还能做一些更炫酷的工作吗？多伦多大学陈天琦等研究者表示，既然残差连接就是常微分方程(ODE)的离散化，那么常规神经网络的前向传播过程岂不就是微分方程给定初值解末值的过程？如果我们用业界成熟的微分方程求解器(ODESolve)解某个 ODE，这不就能代替前传和反传么？

在他们的研究 ODENet 中，研究者使用神经网络参数化隐藏状态的导数，而不是如往常那样直接参数化隐藏状态。这里参数化隐藏状态的导数就类似构建了连续性的层级与参数，而不再是离散的层级。因此参数也是一个连续的空间，我们不需要再分层传播梯度与更新参数。

简而言之，ODENet 中的神经网络建模可以表示为下式：

其中 f 表示的是神经网络，h 表示的是隐藏状态。相比而言，常规卷积网络可表示为 h(t+1) = f(h(t), θ)。

如果参数化的是隐藏状态的变化，神经微分方程在前向传播过程中不储存任何中间结果，因此它只需要近似常数级的内存成本。

论文：Neural Ordinary Differential Equations
论文地址：https://arxiv.org/abs/1806.07366
实现地址：https://github.com/rtqichen/torchdiffeq

新颖的前传与反传

其实 ResNet 只不过是简单的欧拉离散化，而近百年来，数学家构建了很多现代 ODE 求解方法。这些新方法不仅能保证收敛到真实解，同时还能控制误差水平。

ODENet 就采用了一种适应性 ODESolver 代替前向传播过程，它不像欧拉法移动固定的步长，相反它会根据给定的误差容忍度选择适当的步长逼近真实解。

如下图所示，左边的残差网络定义有限转换的离散序列，它从 0 到 1 再到 5 是离散的层级数，且在每一层通过激活函数做一次非线性转换。此外，黑色的评估位置可以视为神经元，它会对输入做一次转换以修正传递的值。而右侧的 ODE 网络定义了一个向量场，隐藏状态会有一个连续的转换，黑色的评估点也会根据误差容忍度自动调整。

图源：arXiv: 1806.07366

所以 ResNet 采用的是固定的步长 1，适应性 ODESolver 可以自动估计不同的步长，它的自由度和误差控制都更强一些。

对于新颖的前向传播，我们可以通过两段伪代码了解它与常规方法的不同之处。如下是 ResNet 的简要伪代码，定义 f 为卷积层、T 为残差块的数量：

def f(h, t, θ): return nnet(h, θ_t) def resnet(h): for t in [1:T]: h = h + f(h, t, θ) return h

如下展示的是整个 ODEnet 的伪代码，f 表示的也是神经网络层级。不过它不需要层层堆叠离散的层级，只要通过 ODESolver 求出终止时刻 t_1 的 h 就行了，整个 ODESolver 就是一个黑箱过程。

def f(h, t, θ): return nnet([h, t], θ)def ODEnet(h, θ): return ODESolver(f, h, t_0, t_1, θ)

所以不同之处在于 ODESlover 代替了整个前传过程，这样岂不是无法进行反向传播了？为了「绕过」前向传播中的 ODESolver，陈天琦等研究者采用了一种名为 adjoint method 的梯度计算方法。也就是说，模型在反传中通过第二个增广 ODESolver 算出梯度，其可以逼近按计算路径从前向 ODESolver 传递回的梯度，因此可用于进一步的参数更新。

总之，通过一系列推导，反向传播在不知道中间激活值的情况下，直接求一个微分方程就行了。我们并不需要一层层反向传递梯度，就能直接获得更新参数的梯度。ODENet 的反向传播过程如下伪代码所示：

def f_and_a([z, a], t): return[f, -a*df/da, -a*df/dθ][z0, dL/dx, dL/dθ] =  ODESolver([z(t1), dL/dz(t), 0], f_and_a, t1, t0)

其中 f_and_a 为增广状态的动力学过程，用于求解微分方程。ODESlover 求出来的 dL/dθ 就可以直接用来更新神经网络的权重。

ODENet 采用了一种非常新颖的前向与反向传播过程，它和常规的神经网络训练完全不一样。它的优势也体现在这种差异上，因为反向传播不需要保留前传的中间计算结果，所以只需要常数级的内存要求。

微分方程也能搭生成模型

在 ODENet 中，研究者也展示了将微分方程应用到生成模型的前景。因此在 ICLR 2019 中，陈天琦等研究者进一步研究了微分方程如何用于流模型。

论文：FFJORD: Free-form Continuous Dynamics for Scalable Reversible Generative Models
论文地址：https://arxiv.org/abs/1810.01367

目前，最流行的生成模型 GAN 通过生成器与判别器的博弈，从而逼近真实数据的概率密度函数 p(x)。但流模型希望通过一系列可逆转换，明确地学习到数据分布 p(x)。因此，流模型会通过可逆神经网络将数据点从一个简单分布映射到复杂分布。

但基于似然度训练常规流模型需要限制它们的架构，从而使雅可比行列式的计算成本足够小。例如流模型 Real NVP 或 Glow 等，它们对矩阵维度进行分割或使用秩为 1 的权重矩阵进行限制。

ODENet 使用常微分方程定义了一种从隐变量到数据的映射，它可以使用相对低成本的迹运算计算雅可比行列式。后面提出的 FFJORD 进一步发扬了这种观点，它将迹估计和前向传播都定义为了常微分方程，并使用 ODESolver 直接求解。直观而言，FFJORD 的抽象过程可如下图所示：

图源：arXiv: 1810.01367

如上图所示，对于微分方程而言，我们知道初始的随机分布 z(t_0)，并系统通过 ODESolver 解出真实图像分布 z(t_1)。如果知道了 z(t_1)，那么从中采样就能生成真实图像。

最后，这些方向与成果都表明，微分方程真的可以和深度神经网络相结合。也许以后，微分方程乃至其它数理基础，都能帮助我们构建更鲁棒和可解释性的机器学习系统。

本文为机器之心原创，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心(全职记者 / 实习生)：[email protected]

投稿或寻求报道：content@jiqizhixin.com

广告 & 商务合作：[email protected]

发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Excel控件Spire.XLS 更新至7.12.144 | 附下载 cocacola456 文档管理更新 Excel控件 Spire.XLS更新 Spire.XLS Spire.XLS下载
Excel控件Spire.XLS更新至7.12.144，修复了转换PDF时字幕对齐的问题。Spire.XLS7.12.144更新修复修复了将Chart转换为Image时图表数据标签重复的问题。修复了CalculateAllValue方法抛出异常的问题。修复了将工作表转换为PDF时图表字幕对齐不正确的问题。
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
剑指offer-12、数值的整数次方 java
题⽬描述给定⼀个double类型的浮点数base和int类型的整数exponent。求base的exponent次⽅。保证base和exponent不同时为0。示例1:输⼊：2.00000,3返回值：8.00000示例2:输⼊：2.10000,3返回值：9.26100思路及解答暴力求解如果使⽤暴⼒解答，那么就是不断相乘，对于负数⽽⾔，则是相除，并且符号取反。publicclassSolution{
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
线性代数同济教材每一部分的现实意义 ZhuBin365 其它算法
一、行列式(Determinants)的现实意义：不仅仅是数字，而是“尺度”和“特性”行列式虽然计算结果是一个数值，但它绝不是一个孤立的数字，它在现实世界中代表着“尺度”和“特性”的重要信息：现实意义核心：“衡量变化的能力”和“判定系统特性”“尺度”：衡量体积/面积的缩放比例：在现实世界中，很多变换都会改变物体的形状和大小。行列式就像一个“尺度”，衡量了线性变换对面积(二维)或体积(三维及以上)的
【亲测免费】 S7-1200PLC使用SCL语言编程实现数控G代码指令编程控制苗璋希Eldwin
S7-1200PLC使用SCL语言编程实现数控G代码指令编程控制资源介绍本仓库提供了一个资源文件，标题为：S7-1200PLC使用SCL语言编程实现数控G代码指令编程控制(附上源程序).pdf。该资源文件详细介绍了如何使用S7-1200PLC的SCL（StructuredControlLanguage）语言进行编程，以实现数控G代码指令的编程控制。资源中不仅包含了详细的理论说明，还附带了完整的源程
前端面试题总结——JS篇又又呢前端 javascript 开发语言
一、说说JavaScript中的数据类型？存储上有什么差别？1、数据类型基本类型number：数值类型十进制：letintNum=55八进制（零开头）：letnum1=070十六进制（0x开头）：lethexNum1=0xANaN：特殊数值，意为“不是数值”string：字符串类型boolean：布尔值，true或falseundefined：表示未定义null：空值symbol：是原始值，且符号
Flink自定义函数之聚合函数（UDAGG函数）土豆马铃薯 Flink flink 大数据
1.聚合函数概念聚合函数：将一个表的一个或多个行并且具有一个或多个属性聚合为标量值。聚合函数理解：假设一个关于饮料的表。表里面有三个字段，分别是id、name、price，表里有5行数据。假设你需要找到所有饮料里最贵的饮料的价格，即执行一个max()聚合。你需要遍历所有5行数据，而结果就只有一个数值。2.聚合函数实现聚合函数主要通过扩展AggregateFunction类实现。AggregateF
LeetCode第317题_离建筑物最近的距离 @蓝莓果粒茶算法 leetcode linux 算法 c#学习 python c++
LeetCode第317题：离建筑物最近的距离文章摘要本文详细解析LeetCode第317题"离建筑物最近的距离"，这是一道图论和广度优先搜索的问题。文章提供了基于多源BFS的解法，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合想要提升图论算法能力的程序员。核心知识点：广度优先搜索、图论、矩阵遍历难度等级：困难推荐人群：具有图论基础，想要提升算法能力的程序员题目描述
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
python把竖着的变成横着的数_python – Reportlab：如何切换纵向和横向？ weixin_39524703
我正在使用reportlab从动态数据自动生成pdf报告.由于内容有时太大,无法以纵向显示,所以我正在为大量内容切换到景观.以下是我的报告生成工作原理：主功能：doc=DocTemplate(...)//DoctemplateisacustomedBaseDocTemplateclassarray=[]some_data="Hereissomedatadisplayedinportrait"arr
【数据攻略】字节面试真题（含答案）+100道面试题库六哥（数据攻略）面试数据分析 java
整理了一套字节的面试真题，还有100道PDF版的面试题库一、SQL题面试真题1：抖音电商平台，现有一张订单表（order_info），有以下字段：order_idgoods_idorder_amt请统计销量金额前10的商品信息。▼参考答案：此题考察的知识点较为简单，主要是考察GROUPBY和窗口函数。面试真题2：现有一张用户登录表（user_login_log），请统计2021.9.1之前活跃过，
Python提取PDF中的文字和图片西门一刀 python学习 python
一，使用Python提取PDF中的文字#只能处理包含文本的PDF文件#coding=utf-8importsysimportimportlibimportlib.reload(sys)frompdfminer.pdfparserimportPDFParser,PDFDocumentfrompdfminer.pdfinterpimportPDFResourceManager,PDFPageInter
python提取pdf文字,python 提取pdf文字
安装pdfminer库windows下安装pdfminer3kpipinstallpdfminer3kLiunx下安装pdfminerpipinstallpdfminer代码frompdfminer.pdfparserimportPDFParser,PDFDocumentfrompdfminer.converterimportPDFPageAggregatorfrompdfminer.layout
Python|扫描版词书转文字(PyPDF、OCR） NuageL pdf ocr python
心血来潮想把词书pdf(只有扫描版）转化成电子版，然后插到某生词APP去复习然后有两个想法：1.按照A-Z等来分词单2.PDF转文字1.那首先需要把PDF分开，这个用PyPDF2可以达成PDF参考文章：掌握PDF文件处理的神器：PythonPyPDF2库详解-CSDN博客写了一个功能，允许用户一次性输入多个页码范围：fromPyPDF2importPdfReader,PdfWriterdefspl
傅里叶方法求解正方形偏微分方程 weixin_30777913 算法
题目问题10.使用傅里叶方法在正方形中找到以下问题的所有解：4uxx−8uyy=0,00\lambda>0λ>0：设λ=μ2\lambda=\mu^2λ=μ2(μ>0\mu>0μ>0)，则X′′+μ2X=0X''+\mu^2X=0X′′+μ2X=0，解为X=Acos⁡(μx)+Bsin⁡(μx)X=A\cos(\mux)+B\sin(\mux)X=Acos(μx)+Bsin(μx)。X′=−Aμs
wireshark分析以太网帧结构_[半小时]以太网数据帧的结构分析 whph
以太网帧，属于二层数据，分为2种：EthernetII帧和IEEE802.3帧。其中EthernetII帧格式为：而IEEE802.3帧格式为：两种帧的区别----->在于Type/Length字段数值的大小。Type/Length>=1536(0x0600)----->EthernetIIType/LengthIEEE802.3最常见的基本都是EthernetII类型的帧，STP协议的帧格式属于
【OD机试题解法笔记】根据IP查找城市 xuwzen 编码训练笔记 tcp/ip java
题目描述某业务需要根据终端的IP地址获取该终端归属的城市，可以根据公开的IP地址池信息查询归属城市。地址池格式如下：城市名=起始IP,结束IP起始和结束地址按照英文逗号分隔，多个地址段采用英文分号分隔。比如：City1=1.1.1.1,1.1.1.2;City1=1.1.1.11,1.1.1.16;City2=3.3.3.3,4.4.4.4;City3=2.2.2.2,6.6.6.6一个城市可以有
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
多模态模型在RagFlow中的应用程序猿李巡天 milvus langchain 人工智能大数据 java
在RagFlow的最新版本中（0.19.0）中，为了提升对文档中各类图片的解析效果，也尝试引入了多模态模型（image2text）对图片内容进行增强解析。我们来详细分析一下相关的过程。首先需要在当前租户下配置一个image2text的模型（这里有个坑，后面会讲到），在RagFlow的文档解析过程中主要有三个场景使用到这个image2text模型，我们一一来看下：PDF文档内容提取如果配置了imag
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
多模态模型在RagFlow中的创新应用与实战案例 AGI大模型老王人工智能 DeepSeek 产品经理学习 AI 大模型大模型教学
在RagFlow的最新版本中（0.19.0）中，为了提升对文档中各类图片的解析效果，也尝试引入了多模态模型（image2text）对图片内容进行增强解析。我们来详细分析一下相关的过程。首先需要在当前租户下配置一个image2text的模型（这里有个坑，后面会讲到），在RagFlow的文档解析过程中主要有三个场景使用到这个image2text模型，我们一一来看下：PDF文档内容提取如果配置了imag
专题：2025供应链数智化与效率提升报告|附100+份报告PDF、原数据表汇总下载拓端研究室 php 开发语言
全文链接：https://tecdat.cn/?p=42926在全球产业链重构与数字技术革命的双重驱动下，供应链正经历从传统经验驱动向数据智能驱动的范式变革。从快消品产能区域化布局到垂类折扣企业的效率竞赛，从人形机器人的成本优化到供应链金融对中小企业的赋能，技术创新与模式重构正在重塑行业价值网络。本报告洞察基于《灼识咨询：2025中国供应链金融科技行业蓝皮书》《中国银河证券：折扣业态供应链效率深度
【OD机试题解法笔记】分月饼 xuwzen 编码训练笔记算法
题目描述中秋节，公司分月饼，m个员工，买了n个月饼，m≤n，每个员工至少分1个月饼，但可以分多个，单人分到最多月饼的个数是Max1，单人分到第二多月饼个数是Max2，Max1-Max2≤3，单人分到第n-1多月饼个数是Max(n-1)，单人分到第n多月饼个数是Max(n)，Max(n-1)–Max(n)≤3，问有多少种分月饼的方法？输入描述每一行输入mn，表示m个员工，n个月饼，m≤n输出描述输出
python中函数与递归的练习
求一个十进制的数值的二进制的0、1的个数实现一个用户管理系统（要求使用容器保存数据）[{name:xxx,pass:xxx,……},{},{}]users=[]#用户类，包含基本信息classUser:def__init__(self,name,password,email=None):self.name=nameself.password=passworddef__str__(self):ret
C#中的循环控制语句笑敬 c#开发语言后端
一般的循环就是直接根据语句中的基础数值与循环体的构成的运行的。运行的循环语句运行到了一定的程度，当运行条件不再满足循环条件的时候就会退出循环的。但是有时候运行条件会一直满足循环的条件，那么这个条件就会一直执行下去的。这时候这个循环就是一个死循环。为了在循环语句中可以更加好的控制循环语句，我们在循环语句中添加了一些循环控制语句。比如continue、break、goto...1.break:brea
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

偏微分方程数值解法pdf_天生一对，硬核微分方程与深度学习的联姻之路

你可能感兴趣的:(偏微分方程数值解法pdf)