Pikachu5808

牛顿法和拟牛顿法

牛顿法（Newton method）和拟牛顿法（quasi Newton method）是求解无约束最优化问题的常用方法，有收敛速度快的优点。牛顿法是迭代算法，每一步都需求解目标函数的海塞矩阵（Hessian Matrix），计算比较复杂。拟牛顿法通过正定矩阵近似海塞矩阵的逆矩阵或海塞矩阵，简化了这一计算过程。

1、牛顿法

1.1、原理

牛顿法的原理是使用函数 f(x) 的泰勒级数的前面几项来寻找方程 f(y)=0 的根。
将函数 f(x) 在 x0 处展开成泰勒级数:

f (x) = f (x 0) + f' (x 0) (x - x 0) + 1 2 f ″ (x 0) (x - x 0) + \dots

取其线性部分，作为

f(x) f ( x ) 的近似，则可用

f(x0)+f′(x0)(x−x0)=0 f ( x 0 ) + f ′ ( x 0 ) ( x − x 0 ) = 0 的解来近似

f(x)=0 f ( x ) = 0 的解，其解为

x1=x0−f(x0)f′(x0) x 1 = x 0 − f ( x 0 ) f ′ ( x 0 ) 。
由于对

f(x) f ( x ) 的近似只是一阶展开，因此

x1 x 1 并非

f(x)=0 f ( x ) = 0 的解，只能说

f(x1) f ( x 1 ) 比

f(x0) f ( x 0 ) 更接近0。于是，考虑迭代求解：

x n + 1 = x n - f ( x n ) f ' ( x n )

迭代过程可参考下图：

牛顿法和拟牛顿法_第1张图片

1.2、求解最优化问题

对于无约束最优化问题 minx∈Rnf(x) ，可根据极小点的必要条件 ∇f(x)=0 采用牛顿法求解：

x k + 1 = x k - H - 1 k g k

其中，

gk=g(xk)=∇f(xk) g k = g ( x k ) = ∇ f ( x k ) 是

f(x) f ( x ) 的梯度向量在点

xk x k 的值；

Hk=H(xk) H k = H ( x k ) ，

H(x)=[∂2f∂xi∂xj]n×n H ( x ) = [ ∂ 2 f ∂ x i ∂ x j ] n × n 是

f(x) f ( x ) 的海塞矩阵。

输入：目标函数 f(x) ，梯度 g(x)=∇f(x) ，海塞矩阵 H(x) ，精度要求 ϵ ；
输出： f(x) 的极小点 x∗ 。
（1）取初始点 x0 ，置 k=0
（2）计算 gk ，若 ||gk||<ϵ ，则 x∗=xk ，停止计算；否则转（3）
（3）计算 Hk ，令 xk+1=xk−H−1kgk
（4）置 k=k+1 ，转（2）
注：第（3）步中，涉及到 H−1k 的计算，实际应用中，通常并不直接对 Hk 进行求逆，而是将其转化为求解线性代数方程组 Hkdk=−gk ，此时可根据系数矩阵 Hk 的性态来选择合适的迭代法，如预条件共轭梯度法（PCG）、代数多重网格法（AMG）等。

1.3、小结

当目标函数是二次函数时，海塞矩阵退化成一个常数矩阵，从任一初始点出发，牛顿法可一步到达，因此它是一种具有二次收敛性的算法。对于非二次函数，若函数的二次性态较强，或迭代点已进入极小点的邻域，则其收敛速度也是很快的，这是牛顿法的主要优点。
牛顿法的迭代公式中由于没有步长因子，是定步长迭代，对于非二次型目标函数，有时会使函数值上升，即出现 f(xk+1)>f(xk) 的情况，更甚者，可能出现迭代点列 {xk} 发散而导致计算失败的情况。为解决这个问题，出现了“阻尼牛顿法”，增加一个步长因子 λk ，将算法流程（3）中的计算公式修改为：

x k + 1 = x k - λ k H - 1 k g k

牛顿法的另一个弊病在于，每一次迭代都要计算

H−1 H − 1 ，这一步计算比较复杂，下一节的拟牛顿法将解决这个问题。

2、拟牛顿法

如上节所说，牛顿法虽然收敛速度快，但是需要计算海塞矩阵的逆矩阵 H−1 ，而且有时目标函数的海塞矩阵无法保持正定，从而使得牛顿法失效。为了克服这两个问题，人们提出了拟牛顿法。这个方法的基本思想是：不用二阶偏导数而构造出可以近似海塞矩阵（或海塞矩阵的逆）的正定对称阵。不同的构造方法就产生了不同的拟牛顿法。
下面我们先推导一下拟牛顿条件，它给“对海塞矩阵（或海塞矩阵的逆）做近似”提供了理论指导，指出了用来近似的矩阵应该满足的条件。

2.1、拟牛顿条件

对 ∇f(x) 做泰勒展开我们得到了以下近似：

\nabla f (x) = g k + H k (x - x k)

取

x=xk+1 x = x k + 1 ，即得：

g k + 1 - g k = H k (x k + 1 - x k)

记

yk=gk+1−gk y k = g k + 1 − g k ，

δk=xk+1−xk δ k = x k + 1 − x k ，则：

y k = H k δ k H - 1 k y k = δ k

以上即为拟牛顿条件。
在拟牛顿法中，选择

Gk G k 作为

H−1k H k − 1 的近似或选择

Bk B k 作为

Hk H k 的近似，并且使得它们满足上述拟牛顿条件即可。

2.2、DFP算法

DFP算法用 Gk 作为 H−1k 的近似，这里我们直接给出计算公式：

G k + 1 = G k + δ k δ T k δ T k y k - G k y k y T k G k y T k G k y k

可以证明，如果初始矩阵

G0 G 0 是正定对称的，则迭代过程中的每个矩阵

Gk G k 都是正定对称的，一般取

G0=I G 0 = I 。

2.3、BFGS算法

BFGS算法用 Bk 作为 Hk 的近似，与DFP相比，BFGS性能更佳。这里我们直接给出计算公式：

B k + 1 = B k + y k y T k y T k δ k - B k δ k δ T k B k δ T k B k δ k

可以证明，如果初始矩阵

B0 B 0 是正定对称的，则迭代过程中的每个矩阵

Bk B k 都是正定对称的，一般取

B0=I B 0 = I 。
若记

Gk=B−1k G k = B k − 1 ，

Gk+1=B−1k+1 G k + 1 = B k + 1 − 1 ，那么应用Sherman-Morrison公式可以将上述迭代公式改写为：

G k + 1 = (I - δ k y T k δ T k y k) G k (I - δ k y T k δ T k y k) T + δ k δ T k δ T k y k

这就是BFGS算法关于

Gk G k 的迭代公式。

2.4、L-BFGS算法

在BFGS中，需要用到一个N阶矩阵 Gk ，当N很大时，存储这个矩阵将消耗大量计算机资源。为了解决这个问题，减少BFGS迭代过程中所需的内存开销，就有了L-BFGS。
L-BFGS（Limited-memory BFGS或Limited-storage BFGS）对BFGS进行了近似，其基本思想是：不再存储完整的矩阵 Gk ，而是存储计算过程中的向量序列 {δk}{yk} ，需要矩阵 Gk 时，利用向量序列 {δk}{yk} 的计算来代替。而且，向量序列 {δk}{yk} 也不是所有的都存储，而是保留最新的m个，每次计算 Gk 时，只利用最新的m个向量序列 {δk}{yk} 。这样一来，存储空间由 O(N2) 降至 O(mN) 。
具体推导和计算细节，这里不赘述，读者可自行了解。

3、其它

3.1、牛顿法和梯度下降法

二者都是求解无约束最优化问题的常用方法，牛顿法是二阶收敛，梯度下降法是一阶收敛，所以牛顿法更快，下图形象化地显示了这一点：

牛顿法和拟牛顿法_第2张图片

其中，红色路径代表牛顿法，绿色路径代表梯度下降法。

3.2、牛顿法和深度学习

深度学习中，往往采用梯度下降法作为优化算子，而很少采用牛顿法，主要原因有以下几点：

神经网络通常是非凸的，这种情况下，牛顿法的收敛性难以保证；
即使是凸优化，只有在迭代点离全局最优很近时，牛顿法才会体现出收敛快的优势；
可能被鞍点吸引。

参考文献

[1] https://www.cnblogs.com/ljy2013/p/5129294.html
[2] https://blog.csdn.net/VictoriaW/article/details/71710280
[3] https://zh.wikipedia.org/wiki/%E7%89%9B%E9%A1%BF%E6%B3%95
[4] https://www.jiqizhixin.com/articles/2017-03-11-2
[5] https://www.zhihu.com/question/46441403?sort=created
[6] https://baike.baidu.com/item/%E7%89%9B%E9%A1%BF%E6%B3%95/1384129?fr=aladdin
[7] https://www.zhihu.com/question/19723347
[8] https://liuxiaofei.com.cn/blog/lbfgs%E6%96%B9%E6%B3%95%E6%8E%A8%E5%AF%BC/
[9] https://www.cnblogs.com/jiahenhe2/p/8086857.html
[10] https://baike.baidu.com/item/%E6%B3%B0%E5%8B%92%E7%BA%A7%E6%95%B0/7289427?fr=aladdin
以上为本文的全部参考文献，对原作者表示感谢。

你可能感兴趣的:(数学基础)

如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
群体遗传分析（一）#学习笔记 kangroomoon
哈温的遗传平衡定律是基础，费、莱、霍的群体遗传学是数学基础和理论框架，木村资生的中性进化论深化了自然选择的概念。中性学说认为：分子水平上的遗传变异在很大程度上是中性的，变异程度主要由突变速率和有效群体大小决定。（通过观察值和理论值之间的差异性测验中性进化假说）群体遗传多态性与结构分析Locus：遗传座位，在群体中通常包含多个allele：等位基因，即遗传多态性。大多数的新突变是由于geneticd
几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩... weixin_39848097 几何分布的期望和方差公式推导均值定理六个公式概率论方差公式
我们天天都可以接触很多随机现象，比如每天的天气不一样气温是我们最直接的感受，我们很难预测明天的精确问题，但是这些随机现象又体现出了一定的规律性。比如上海7月份平均35度左右，冬天的平均温度在5度左右。所以35、5这些数字体现了某种稳定性。所以除了前面几章中讲到的分布律和概率密度函数可以表征随机变量外，还可以用一组数字来表达随机变量的一般特性。这就是我们今天要讲到的随机变量的数字特征。通过对数字特征
CTF 竞赛密码学方向学习路径规划 David Max CTF 学习笔记密码学 ctf 信息安全
目录计算机科学基础计算机科学概念的引入、兴趣的引导开发环境的配置与常用工具的安装WattToolkit（Steam++）、机场代理Scoop（Windows用户可选）常用Python库SageMathLinux小工具yafuOpenSSLMarkdown编程基础Python其他编程语言、算法与数据结构（可选）数学基础离散数学与抽象代数复杂性分析密码学的正式学习兴趣的培养做题小技巧系统学习需要了解并
深度学习算法，该如何深入，举例说明 liyy614 深度学习
深度学习算法的深入学习可以从理论和实践两个方面进行。理论上，深入理解深度学习需要掌握数学基础（如线性代数、概率论、微积分）、机器学习基础和深度学习框架原理。实践上，可以通过实现和优化深度学习模型来提升技能。理论深入数学基础线性代数：理解向量、矩阵、特征值和特征向量等，对于理解神经网络的权重和偏置矩阵至关重要。概率论：用于理解模型的不确定性，如Dropout等正则化技术。微积分：理解梯度下降等优化算
数学基础 -- 线性代数正交多项式之勒让德多项式展开推导 sz66cm 线性代数决策树算法
勒让德多项式展开的详细过程勒让德多项式是一类在区间[−1,1][-1,1][−1,1]上正交的多项式，可以用来逼近函数。我们可以将一个函数表示为勒让德多项式的线性组合。以下是如何推导勒让德多项式展开系数ana_nan的详细过程。1.勒让德展开的基本假设给定一个函数f(x)f(x)f(x)，我们希望将它表示为勒让德多项式的线性组合：f(x)=∑n=0∞anPn(x),f(x)=\sum_{n=0}^
数学基础 -- 线性代数之格拉姆-施密特正交化 sz66cm 线性代数机器学习人工智能
格拉姆-施密特正交化格拉姆-施密特正交化（Gram-SchmidtOrthogonalization）是一种将一组线性无关的向量转换为一组两两正交向量的算法。通过该过程，我们能够从原始向量组中构造正交基，并且可以选择归一化使得向量组成为标准正交基。算法步骤假设我们有一组线性无关的向量{v1,v2,…,vn}\{v_1,v_2,\dots,v_n\}{v1,v2,…,vn}，其目标是将这些向量正交化
数学基础 -- 线性代数之矩阵的迹 sz66cm 线性代数机器学习决策树
矩阵的迹什么是矩阵的迹？矩阵的迹（TraceofaMatrix）是线性代数中的一个基本概念，定义为一个方阵主对角线上元素的总和。矩阵的迹在许多数学和物理应用中都起着重要作用，例如在矩阵分析、量子力学、统计学和系统理论中。矩阵迹的定义对于一个n×nn\timesnn×n的方阵AAA：A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮an1an2⋯ann)A=\begin{pmatrix}a_{1
数学基础 -- 线性代数之矩阵正定性 sz66cm 线性代数矩阵
线性代数中的正定性正定性在线性代数中主要用于描述矩阵的特性，尤其是在二次型与优化问题中有重要应用。正定矩阵的定义对于一个n×nn\timesnn×n的对称矩阵AAA，其正定性可以通过以下条件来判断：正定矩阵：如果对于任意非零向量x∈Rnx\in\mathbb{R}^nx∈Rn，二次型xTAxx^TAxxTAx都是正的，即：xTAx>0∀x∈Rn,x≠0x^TAx>0\quad\forallx\in
想学java，需要什么基础？吹来人间烟火
不需要什么基础，课程都是针对于零基础的同学，设计这个行业，本身入行门槛比较低，能力重于学历。真正科班出身的更是少数，大部分人都是通过找培训机构系统学习出来的，所以只要自己下定决心去学，就一定能学会的。另外，如果说普通人具备哪些能力可以更好地学习Java，那可以列出来三点。1、简单的英语读写能力；2、一定的数学基础；3、一定的计算机基础操作能力。Java是一门面向对象地编程语言，吸收了C++语言的各
数学基础 -- 线性代数之酉矩阵 sz66cm 量子计算线性代数
酉矩阵（UnitaryMatrix）酉矩阵是线性代数中一种重要的矩阵类型，特别在量子力学和信号处理等领域有广泛的应用。以下是酉矩阵的定义、性质以及使用和计算的例子。1.定义酉矩阵是一个复矩阵UUU，满足以下条件：U†U=UU†=IU^{\dagger}U=UU^{\dagger}=IU†U=UU†=I其中：U†U^{\dagger}U†是矩阵UUU的共轭转置矩阵，即UUU的转置矩阵再取元素的共轭。
深度学习奥秘解锁：AI大模型技能提升指南 AGI大模型老王人工智能深度学习语言模型算法大模型 AI大模型
文章目录每日一句正能量前言AI大模型学习的理论基础AI大模型的训练与优化AI大模型在特定领域的应用AI大模型学习的伦理与社会影响未来发展趋势与挑战后记**前言**随着人工智能技术的快速发展，AI大模型学习正成为一项备受关注的研究领域。为了提高模型的准确性和效率，研究者们需要具备深厚的数学基础和编程能力，并对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习正为人类的生活和工
数学基础 -- 线性代数之伴随矩阵 sz66cm 线性代数矩阵
伴随矩阵1.代数余子式首先我们需要理解什么是代数余子式。对于一个n×nn\timesnn×n的方阵AAA，代数余子式MijM_{ij}Mij是指从矩阵AAA中删除第iii行和第jjj列后，剩下的子矩阵的行列式。假设有一个3×33\times33×3的矩阵：A=(a11a12a13a21a22a23a31a32a33)A=\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_
数学基础 -- 线性代数之矩阵的秩 sz66cm 线性代数矩阵机器学习
矩阵的秩：概念与应用1.概述矩阵的秩（Rank）是线性代数中的一个基本概念，它衡量了矩阵中行或列向量的线性无关性。矩阵的秩在解线性方程组、矩阵分解、确定线性变换的维度等方面起着重要作用。2.矩阵的秩的定义矩阵的秩可以从以下几个角度进行定义：行秩：矩阵的行秩是指矩阵中最大线性无关行向量的个数。列秩：矩阵的列秩是指矩阵中最大线性无关列向量的个数。在一个矩阵中，行秩和列秩总是相等的，因此我们通常将矩阵的
【ShuQiHere】从零开始实现逻辑回归：深入理解反向传播与梯度下降 ShuQiHere 代码武士的机器学习秘传逻辑回归算法机器学习
【ShuQiHere】逻辑回归是机器学习中一个经典的分类算法，尽管它的名字中带有“回归”，但它的主要用途是处理二分类问题。逻辑回归通过一个逻辑函数（Sigmoid函数）将输入特征映射到一个概率值上，然后根据这个概率值进行分类。本文将带你从零开始一步步实现逻辑回归，并深入探讨背后的核心算法——反向传播与梯度下降。逻辑回归的数学基础逻辑回归的目标是找到一个逻辑函数，能够将输入特征映射到一个(0,1)之
数学基础 -- 线性代数之行阶梯形 sz66cm 线性代数机器学习人工智能
行阶梯形行阶梯形（RowEchelonForm,REF）是线性代数中用于简化矩阵形式的一种方法，常用于求解线性方程组。矩阵经过行变换（如高斯消元法）后可以转换为行阶梯形，它具有以下特点：行阶梯形的定义零行在矩阵的底部：矩阵中如果存在一行全为零的行，这些行必须在矩阵的最下方。每一非零行的首个非零元素为1：这一元素称为该行的主元（leadingentry）。主元是从左到右的第一个非零元素，并且主元必须
【ShuQiHere】《机器学习的进化史『上』：从数学模型到智能算法的百年征程》 ShuQiHere 机器学习人工智能
【ShuQiHere】引言：概述机器学习的演进机器学习的发展史是一段从数学基础到智能算法的演进历程。从19世纪的数学探索，到20世纪的计算革命，再到21世纪的智能算法应用，机器学习模型的演化贯穿了科学进步的每个重要阶段。这篇博客将系统回顾这些模型的历史演进，展示它们之间的联系，并探讨其在现代应用中的重要性。线性回归：机器学习的起点背景故事：1805年的法国，年轻的数学家Adrien-MarieLe
数学基础 -- 线性代数之增广矩阵 sz66cm 线性代数机器学习
增广矩阵增广矩阵（AugmentedMatrix）是在求解线性方程组时常用的工具。它将线性方程组的系数矩阵与常数项合并在一起，形成一个扩展的矩阵，从而便于使用矩阵操作方法求解方程组。定义假设我们有一个线性方程组：a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm\begin{aligned}a_{11}x_1+a_
数学基础 -- 梯度下降算法 sz66cm 算法人工智能数学基础
梯度下降算法梯度下降算法（GradientDescent）是一种优化算法，主要用于寻找函数的局部最小值或全局最小值。它广泛应用于机器学习、深度学习以及统计学中，用于最小化损失函数或误差函数。梯度下降的基本概念梯度下降算法通过以下步骤工作：初始化参数：随机初始化模型的参数（如权重和偏差），也可以用特定的策略初始化。计算损失：对当前模型输出和实际目标值计算损失（如均方误差、交叉熵等）。计算梯度：计算损
数学基础 -- 线性代数之矩阵的可逆性 sz66cm 线性代数矩阵机器学习
矩阵的可逆性1.矩阵可逆的定义对于一个n×nn\timesnn×n的方阵AAA，如果存在一个矩阵BBB使得：A×B=B×A=InA\timesB=B\timesA=I_nA×B=B×A=In其中InI_nIn是n×nn\timesnn×n的单位矩阵（对角线上全为1，其他位置全为0），那么矩阵AAA是可逆的，并称矩阵BBB是矩阵AAA的逆矩阵，记作A−1A^{-1}A−1。2.矩阵不可逆的定义如果对
Logistic 回归零度° 机器学习回归数据挖掘人工智能
文章目录1.引言2.Logistic回归概述2.1定义与应用场景2.2与线性回归的区别3.原理与数学基础3.1Sigmoid函数3.2概率解释3.3极大似然估计4.模型建立4.1假设函数4.2成本函数4.3梯度下降法5.正则化5.1正则化的目的与类型5.1.1正则化的目的5.1.2正则化的类型5.2L1和L2正则化5.2.1L1正则化5.2.2L2正则化6.多分类问题6.1一对多(OvA)6.2一
数学基础 -- 线性代数之行列式不变性推导 sz66cm 线性代数
行列式不变性的推导我们要证明：给矩阵的一行（或列）加上另一行（或列）的倍数，这种操作不会改变行列式的值。问题描述假设我们有一个矩阵AAA，其大小为3×33\times33×3，如果我们将其第1行加上第2行的倍数，得到新的矩阵A′A'A′。我们需要证明矩阵AAA的行列式和矩阵A′A'A′的行列式是相等的。给定矩阵AAA如下：A=(a11a12a13a21a22a23a31a32a33)A=\begi
数学基础（四）几两春秋梦_ 数学基础算法人工智能机器学习
一、特征值与特征向量特征空间：特征向量的应用：特征值表达了重要程度且和特征向量所对应，那么特征值大的就是主要信息了，基于这点我们可以提供各种有价值的信息。二、SVD矩阵分解基变换：特征值分解：SVD：离散型随机变量概率函数（概率质量函数）：连续型随机变量似然函数
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
2018-02-19 471503Liwufeng
四十岁之后就经常算不清楚自己多大岁数，到底44还是45或者46真的不能不假思索脱口而出。是小学数学基础没打好，还是心理学上说的“可以回避”？所以今天记上一笔，2018年2月19日，45周岁。中年人的生日我相信没人由衷想为自己又长一岁而庆贺
计算机等级考试：信息安全技术知识点二 ting_liang 计算机网络
1、信息技术的飞速发展，对人类社会产生了重要影响，其主流是积极的，但也客观存在一些负面影响，这些负面影响有:信息泛滥、信息污染、信息犯罪。2、1949年，香农发表了著名的《保密系统的通信理论》的论文，把密码学置于坚实的数学基础上，标志着密码学作为一门学科的形成。3、数字签名的过程使用的是签名者的私有密钥，验证数字签名时，使用的是签名者的公有密钥。4、已知最早的代换密码是由JuliusCaesar发
数学分析视频+书籍等 dllglvzhenfeng 计算机考研机试创新程序猿的数学人工智能算法信奥青少年趣味编程数学分析
数学分析（数学基础分支）数学分析（数学基础分支）_百度百科《数学分析（一）》专题《数学分析（一）》专题_哔哩哔哩_bilibili北京某高校《数学分析（二）》：第一讲~第五讲北京某高校《数学分析（二）》：第一讲~第五讲_哔哩哔哩_bilibili北京某高校《数学分析（二）》：第六讲~第八讲（未完待续）北京某高校《数学分析（二）》：第六讲~第八讲_哔哩哔哩_bilibili北京某高校《微观数学》之《
【人工智能学习思维脉络导图】 AK@ 人工智能人工智能学习
曾梦想执剑走天涯，我是程序猿【AK】目录知识图谱1.基础知识2.人工智能核心概念3.实践与应用4.持续学习与进展5.挑战与自我提升6.人脉网络知识图谱人工智能学习思维脉络导图1.基础知识计算机科学基础数学基础（线性代数、微积分、概率论和统计学）编程语言（Python、R等）2.人工智能核心概念机器学习监督学习无监督学习强化学习深度学习神经网络卷积神经网络（CNN）循环神经网络（RNN）自然语言处理
智力题还是水有毒 (智力唤醒、简单代码、公平性) BABYMISS
前言：群里发现一个很有意思的问题一、智力题？？！有1000瓶水，其中有一瓶有毒，小白鼠只要尝一点带毒的水24小时内就会死亡，至少要多少只小白鼠才能在24小时内鉴别出哪瓶水有毒？【题目肯定经不起吃瓜大众的推敲，我们还是按出题人的思路来！】二、思路对不起，刚开始跑偏了。自诩数学基础好、生活经验丰富的我，思绪飘过二叉树、布隆过滤器，在奥卡姆剃刀指引下，最终回归最基础的二进制(如果是1024瓶水，保证不跑
小学奥数全套试卷百度云资源，pdf可打印电子版地址更新全网优惠分享君
奥数，全称为奥林匹克数学竞赛，是一项极富挑战性的数学竞赛活动。它旨在发现和培养数学人才，提高他们的数学水平，并为国家培养出优秀的数学后备力量。在奥数竞赛中，学生需要掌握扎实的数学基础，灵活运用数学知识，解决各种复杂的数学问题。为了帮助小学生更好地学习奥数，我们整理了一份小学奥数全套试卷百度云资源，pdf可打印电子版。这份资源包含了小学奥数各年级的试卷，题型全面，难度适中，适合小学生练习和提高自己的
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他