More action

一文让你彻底搞懂最小二乘法（超详细推导）

要解决的问题

在工程应用中，我们经常会用一组观测数据去估计模型的参数，模型是我们根据先验知识定下的。比如我们有一组观测数据 $x_i,y_i)$ （一维），通过一些数据分析我们猜测 $y$ 和 $x$ 之间存在线性关系，那么我们的模型就可以定为： $f (x) = k x + b$

这个模型只有两个参数，所以理论上，我们只需要观测两组数据建立两个方程，即可解出两个未知数。类似的，假如模型有 $n$ 个参数，我们只需要观测 $n$ 组数据就可求出参数，换句话说，在这种情况下，模型的参数是唯一确定解。

但是在实际应用中，由于我们的观测会存在误差（偶然误差、系统误差等），所以我们总会做多余观测。比如在上述例子中，尽管只有两个参数，但是我们可能会观测 $n$ 组数据 $x_1, y_1)..,(x_n, y_n)$ ，这会导致我们无法找到一条直线经过所有的点，也就是说，方程无确定解。

于是这就是我们要解决的问题：虽然没有确定解，但是我们能不能求出近似解，使得模型能在各个观测点上达到“最佳“拟合。那么“最佳”的准则是什么？可以是所有观测点到直线的距离和最小，也可以是所有观测点到直线的误差（真实值-理论值）绝对值和最小，也可以是其它，如果是你面临这个问题你会怎么做？

早在19世纪，勒让德就认为让“误差的平方和最小”估计出来的模型是最接近真实情形的。

为什么就是误差平方而不是其它的，这个问题连欧拉、拉普拉斯都未能成功回答，后来是高斯建立了一套误差分析理论，从而证明了确实是使误差平方和最小的情况下系统是最优的。理论的证明也并不难，如果你了解了会有更深刻的认识，限于篇幅我会写在另外一篇博客。

按照勒让德的最佳原则，于是就是求：
$L=\sum_{1}^{n}\left(y_i-f(x)\right)^{2}$
这个目标函数取得最小值时的函数参数，这就是最小二乘法的思想，所谓“二乘”就是平方的意思。从这里我们可以看到，最小二乘法其实就是用来做函数拟合的一种思想。

至于怎么求出具体的参数那就是另外一个问题了，理论上可以用导数法、几何法，工程上可以用梯度下降法。下面以最常用的线性回归为例进行推导和理解。

线性回归

线性回归因为比较简单，可以直接推导出解析解，而且许多非线性的问题也可以转化为线性问题来解决，所以得到了广泛的应用。甚至许多人认为最小二乘法指的就是线性回归，其实并不是，最小二乘法就是一种思想，它可以拟合任意函数，线性回归只是其中一个比较简单而且也很常用的函数，所以讲最小二乘法基本都会以它为例。

下面我会先用矩阵法进行推导，然后再用几何法来帮助你理解最小二乘法的几何意义。

矩阵解法

线性回归定义为： $h_{\theta}\left(x_{1}, x_{2}, \ldots x_{n-1}\right)=\theta_{0}+\theta_{1} x_{1}+\ldots+\theta_{n} x_{n-1}$ （ $\theta$ 为参数）假设现在有 $m$ 个样本，每个样本有 $n - 1$ 维特征，将所有样本点代入模型中得：
$\begin{array}{l} h_{1}=\theta_{0}+\theta_{1} x_{1,1}+\theta_{2} x_{1,2}+\ldots+\theta_{n-1} x_{1,n-1} \\ h_{2}=\theta_{0}+\theta_{1} x_{2,1}+\theta_{2} x_{2,2}+\ldots+\theta_{n-1} x_{2,n-1}\\ \vdots \\ h_{m}=\theta_{0}+\theta_{1} x_{m, 1}+\theta_{2} x_{m, 2}+\ldots+\theta_{n-1} x_{m, n-1} \end{array}$ 为方便用矩阵表示，我们令 $x_0=1$ ，于是上述方程可以用矩阵表示为：
$\mathbf{h}=\mathbf{X} \theta$ 其中， $\mathbf{h}$ 为mx1的向量, 代表模型的理论值， $\theta$ 为nx1的向量， $X$ 为mxn维的矩阵， $m$ 代表样本的个数, $n$ 代表样本的特征数，于是目标损失函数用矩阵表示为：
$J(\theta)=\|\mathbf{h}-\mathbf{Y}\|^2 =\|\mathbf{X}\theta-\mathbf{Y}\|^2= (\mathbf{X} \theta-\mathbf{Y})^{T}(\mathbf{X} \theta-\mathbf{Y})$ 其中 $\mathbf{Y}$ 是样本的输出向量, 维度为mx1。

根据高数知识我们知道函数取得极值就是导数为0的地方，所以我们只需要对损失函数求导令其等于0就可以解出 $\theta$ 。矩阵求导属于矩阵微积分的内容，我也是现学的(…，这里先介绍两个用到的公式：
$\frac{\partial x^{T} a}{\partial x}=\frac{\partial a^{T} x}{\partial x}=a$ $\frac{\partial x^{T} A x}{\partial x}=A x+A^{T} x$ 如果矩阵A是对称的： $A x+A^{T} x=2 A x$ 对目标函数化简：
$J(\theta)=\theta^{T} X^{T} X \theta-\theta^{T} X^{T}Y-Y^{T} X\theta+Y^{T} Y$ 求导令其等于0： $\frac{\partial}{\partial \theta} J(\theta)=2X^{T} X \theta-2X^TY=0$ 解得 $\theta=\left(X^{T}X\right)^{-1} X^{T}Y$ ，经过推导我们得到了 $\theta$ 的解析解，现在只要给了数据，我们就可以带入解析解中直接算出 $\theta$ 。

几何意义

几何意义会直观的帮助你理解最小二乘法究竟在干什么。首先先来解释一下矩阵乘法的几何意义，对于一个方程组 $A x$ ，我们可以看做是 $x$ 对矩阵 $A$ 的列向量的线性组合，比如：

$\left\{\begin{array}{l} 1 \times x_{1}+x_{2}=3 \\ -1 \times x_{1}+x_{2}=1 \end{array} \Leftrightarrow\left[\begin{array}{ll} 1 & 1 \\ -1 & 1 \end{array}\right]\left[\begin{array}{l} x_{1} \\ x_{2} \end{array}\right]=\left[\begin{array}{l} 3 \\ 1 \end{array}\right] \Leftrightarrow A \times x=b\right.$
可以看作：
$\left[\begin{array}{c} 1 \\ -1 \end{array}\right] \times x_{1}+\left[\begin{array}{c} 1 \\ 1 \end{array}\right] \times x_{2}=\left[\begin{array}{l} 3 \\ 1 \end{array}\right] \Leftrightarrow a_{1} \times x_{1}+a_{2} \times x_{2}=b$
画在坐标轴上可以看到，向量 $\mathbf{b}$ 其实就是向量 $\mathbf{a_1}$ 与 $\mathbf{a_2}$ 的线性组合，因为他们都是在一个平面上，显然是有解的。

但是如文章开头所说，由于存在观测误差，我们往往会做多余观测，比如要拟合一次方程 $y = k x + b$ ，我们可能观测了三个点（0,2）,（1,2）,（2,3），写成矩阵形式如下(为表述方便，用x1代替k，x2代替b )：
$\left\{\begin{array}{l} 1 \times x_{1}+x_{2}=2 \\ 0 \times x_{1}+x_{2}=2 \\ 2 \times x_{1}+x_{2}=3 \end{array} \Leftrightarrow\left[\begin{array}{ll} 1 & 1 \\ 0 & 1 \\ 2 & 1 \end{array}\right]\left[\begin{array}{l} x_{1} \\ x_{2} \end{array}\right]=\left[\begin{array}{l} 2 \\ 2 \\ 3 \end{array}\right] \Leftrightarrow A \times x=b\right.$
表示成线性组合的方式：
$\left[\begin{array}{l} 1 \\ 0 \\ 2 \end{array}\right] \times x_{1}+\left[\begin{array}{l} 1 \\ 1 \\ 1 \end{array}\right] \times x_{2}=\left[\begin{array}{l} 2 \\ 2 \\ 3 \end{array}\right] \Leftrightarrow a_{1} \times x_{1}+a_{2} \times x_{2}=b$

画在图中如下：

从图中我们可以看到，无论 $\mathbf{a_1}$ 和 $\mathbf{a_2}$ 怎么线性组合都不可能得到 $\mathbf{b}$ ，因为 $\mathbf{a_1}$ 和 $\mathbf{a_2}$ 的线性组合成的向量只能落在它们组成的子空间 $\mathbf{S}$ 中。

退而求其次，虽然我们不可能得到 $\mathbf{b}$ ，但在 $\mathbf{S}$ 上找一个和 $\mathbf{b}$ 最接近的总可以吧。那么将 $\mathbf{b}$ 投影在平面 $\mathbf{S}$ 上得到的向量 $\mathbf{p}$ 就是和 $\mathbf{b}$ 最接近的向量（把向量看作点，最接近的意思就是点到平面某点取得距离最短，自然就是投影所成的交点）。

换句话说，方程组 $A x = b$ 虽然无解，也就是b不在A的列空间中，但是我们可以在 $A$ 的列空间中找到一个和 $b$ 最接近的向量 $p$ ， $p$ 就是 $b$ 在 $A$ 的列空间中的投影，通过求 $A x = p$ 的解，就是原方程的最小二乘解。

由几何意义可知垂线 $e = b - p = b - A x$ 正交于平面 $\mathbf{S}$ ，也就是 $a_{1}^{T} e=0, a_{2}^{T} e=0$ ，写成矩阵形式：
$\begin{array}{c} A^{T} e=A^{T}(b-Ax)=A^{T} b-A^{T} Ax=0 \end{array}$ 解得 $x=\left(A^{T} A\right)^{-1} A^{T} b$ ，可以看到推导结果和矩阵法一样。从上面可以看到，最小二乘法的几何意义就是求解 $b$ 在 $A$ 的列向量空间中的投影。

到这里最小二乘法的推导已经完成了，但是我们忽略了一个问题，就是假如 $A^TA$ 不可逆怎么办？这个问题我会另写一篇博客进行介绍。

以上就是全部内容。

Reference
https://www.cnblogs.com/pinard/p/5976811.html
https://zhuanlan.zhihu.com/p/38128785
https://www.zhihu.com/question/304164814/answer/549972357

如果对你有帮助，请点个赞让我知道:-D

你可能感兴趣的:(数学知识)

小学数学知识记忆的六大技巧海韵互联
记忆是知识的仓库，学过的知识记得牢，积累的知识就丰富，而丰富知识的积累将为创造型人才的培养奠定坚实的基础。如何才能提高学生记忆数学知识的效果呢？下面为大家介绍六种技巧，具体内容如下：一、归类归类记忆法就是根据识记材料的性质、特征及其内在联系，进行归纳分类，以便帮助学生记忆大量的知识。比如，学完计量单位后，可以把学过的所有内容归纳为五类：长度单位；面积单位；体积和容积单位；重量单位；时间单位。这样归
绘本的价值 666小飞鱼
《小学教师》的编辑陈洪杰老师曾说过，对于孩子而言，教学往往是“关系先于教学”“形式先于内容”“趣味先于意义”。这其实是给我们就如何打破当前数学教学窘况的一个很好的引子。数学绘本具有图文并茂，以贴近生活的趣味故事、色彩丰富的直观图画呈现数学知识，顺应了第一学段儿童的心理和学习发展规律，更能激发他们对于数学学习的兴趣，培养他们的想象力和逻辑思维。因此，数学绘本在第一学段的融入具有十分重要的意义和价值。
蒙特卡罗——排队模拟python代码实现潮汐退涨月冷风霜 python 开发语言蒙特卡罗
排队问题描述数学知识：指数分布指数分布随机变量生成的数学原理指数分布的定义指数分布是连续概率分布，常用于描述某些事件发生的时间间隔。其概率密度函数（PDF）为：f(x;λ)=λe−λxf(x;\lambda)=\lambdae^{-\lambdax}f(x;λ)=λe−λx其中，λ\lambdaλ是速率参数，λ>0\lambda>0λ>0，并且x≥0x\geq0x≥0。生成指数分布随机变量的原理要
tyut数据分析考试资料 study NH 数据分析 python 数据挖掘
1、关于数据分析的说法，下列描述错误的是（）。CA.数据分析可以通过计算机工具和数学知识处理数据｜B.可以做出具有针对性的决策｜C.数据分析没有实际的使用意义｜D.在大数据环境下，数据分析能够挖掘出更有价值的信息2、下列关于数据分析概念的描述错误的是（）。DA.使用适当的统计分析方法对收集来的大量数据进行分析｜B.数据分析可以从数据中提炼出有用的信息并形成结论｜C.数据分析可以对数据进行更深层的研
有关区块链的一些数学知识储备 fc&&fl 考研学习
1.集合集合是由不同对象组成的整体（collectionsofobjects）的数学模型，这些对象被称为集合的元素（elements）。整数（Integers）、有理数（Rationalnumbers）、实数（Realnumbers）、复数（Complexnumbers）、矩阵（Matrices）、多项式（Polynomials）、多边形（Polygons）以及其他的很多概念实质上都是集合。常用集
Acwing打卡day4 U盾oo 算法
1.分形之城题意：不同等级的城市有不同的城市分布，问在n等级的城市A，B之间的距离，每个街区边长10米思路：刚开始看题目看了很久，后来枚举每个等级城市1的坐标才发现一点规律，等级一的城市区块变化一下可以变成等级二的城市区块，递归求解就行了还要用到一些数学知识(1)如果(x,y)逆时针旋转90度，变成（y,-x)(2)如果(x,y)顺时针旋转90度，变成（-y,x)等级n-1城市区块变化到等级城市区
吴正宪数学教学学习笔记之81 东哥杂谈
吴正宪数学教学学习笔记之八十一（0121）巧妙利用比较思想的策略三：利用负迁移进行比较。数学知识之间有非常紧密的内在联系，很多新知识在一定的条件下可以用旧知识去认识和理解。在教学时，教师要沟通新旧知识的联系，创设条件，使新知识转化为旧知识，从而使迁移顺利实现。事实上，旧知识对于新知识的影响并非只有正迁移或负迁移，往往是某一方面起正迁移作用，另一方面又起负迁移作用。使用比较策略可以有效分清新旧知识的
《公倍数与最小公倍数》的教学设计洞口224张辉
一、教学目标1.知识与技能:让学生通过具体的操作和交流活动，认识公倍数和最小公倍数，会在集合图中分别表示两个数的倍数和它们的公倍数。2.过程与方法:让学生会利用列举的方法求10以内两个数的公倍数和最小公倍数，并能在解决问题的过程中主动探索简捷的方法进行有条理地思考。3.让学生经历探索和发现数学知识的过程，进一步发展与同伴进行合作交流的意识和能力，积累经验。二、教学重难点1.重点:认识公倍数与最小公
一天果然越来越好
1.晨梦做梦了。梦到解题，学习数学。有个老教授，讲数学知识点，通俗易懂。你不懂的，他可以换种方式，变得极其简单让你一听就懂！真是大师级人物。老教授说，学习什么时候都不嫌晚！你只要踏踏实实持续不断学习2年，就能真正掌握一门学科！学习，浸盆式。不是见干见湿的学习方式。2.简笔画，治愈系。看了绘画的文章，触发灵感。自己可以为温暖的植物小铺，设计一个吉祥物。记录，表达心情。看不同层面的人的生活。宣传品牌温
数学素养马明洋河南信阳
就目前而言，中外数学教育家对数学素养的研究成果可以归结于如下五个方面：数学知识与技能；数学能力；数学应用；数学思维的信心和语言；科学语言。1.数学知识技能，即掌握“数与代数”“图形与几何”“统计与概率”“综合与实践”四个领域的基本内容及相应的基本技能。2.数学能力，主要包括计算能力、论证能力、推理判断能力、使用工具和技术的能力。具体又可分解为如下二级指标体系:计算能力包括数感、符号意识、空间观念，
好的东西都免费：比尔盖茨都用的可汗学院，教育理念值得父母深思说书人熊二娘
最近，我们“母婴群”的妈妈们被一个网络平台圈了粉。这个网络平台叫做“KhanAcademyKids”，是美国前投行分析师萨尔曼·可汗制作的网络平台。最初，这个平台主要是致力于线上教育，有成千上万的人受惠于这个平台。现如今，他又出了儿童版。我那三岁的儿子最近在用这个平台学习数学。这个平台里不仅有数学知识，还有慢速英语歌曲、逻辑和一些绘本。哦，最近正是圣诞节，里面的英语歌很应景的加上了《我是一个雪人》
AI大模型副业变现之路，有技术就有收入！ AI大模型-王哥人工智能 AI大模型大模型大模型学习大模型教程大模型入门
在当今时代，AI大模型的应用越来越广泛，利用这些技术开展副业赚钱已成为可能。以下是一份详细的指南，帮助你了解需要学习的内容以及如何操作。一、需要学习的内容基础知识储备（1）数学知识：线性代数、概率论与数理统计、微积分等，这些是理解AI算法的基础。（2）编程技能：掌握Python编程语言，因为Python在AI领域有丰富的库和框架支持。（3）机器学习原理：了解常见的机器学习算法，如线性回归、决策树、
【速通C语言（纯小白版）】第一部分：准备工作况之嘉禾 C语言基础 c语言
1谁适合阅读本文？本系列力求用最简单，最容易理解的语言（我自己认为的）给读者分享有关C语言的相关知识，所以即便是对编程毫无概念的朋友也可以阅读本文。您可能需要的前置知识和技能有：高中数学：简单的加减乘除（也许初中数学知识也足够了？）使用浏览器检索信息和安装软件计算机的基本知识（不是必须的）有了上述知识和技能，相信您一定能够学习完本系列内容！让我们一起踏上轻松愉快的C语言之旅。2什么是C语言？我想这
数学知识——欧拉函数、快速幂、扩展欧几里得算法 up-to-star acwing算法基础课学习笔记
欧拉函数欧拉函数定义为ϕ(n)=1−n中与n互质的个数\phi(n)=1-n中与n互质的个数ϕ(n)=1−n中与n互质的个数，互质就是最大公约数是1。欧拉函数求解公式：将n分解质因数：n=p1a1+p2a2+...+pkakn=p_1^{a1}+p_2^{a2}+...+p_k^{ak}n=p1a1+p2a2+...+pkak,则ϕ(n)=n∗(1−1p1)∗(1−1p2)∗.....∗(1−1p
机器学习与数学星河涛声天净沙
想要更多了解深度学习、机器学习、人工智能等领域，以及涉及的相关数学知识和编程基础，强烈推荐大家一个微信公众号：机器学习与数学，真的是干货满满，非常专业。每篇文章读完后，收获很大，值得关注！
从此岸到彼岸的距离小小的雪花
读马云鹏主编吴正宪副主编的《深度学习，走向核心素养》这本书，让我惊叹太多，惊叹于每位作者的写作能力，惊叹于每位作者对数学知识的深度理解、设计、总结能力，惊叹于每位作者对工作的敬业精神，惊叹于每位作者对学生心理的了解程度，惊叹于每位作者的教育教学智慧。里面有一段话是这样说的:此岸与彼岸之间，绝大多数学生既没有乖乖的等待此岸，也没有安全的着陆彼岸，他们中的大多数都滞留在“除法意义的扩充”和“小数位置转
基于大观念的单元整体教学设计李星太
1、数学大观念的本质内涵：结构、联系和迁移。2、数学大观念和数学素养数学学科大观念和数学素养有本质上的共通之处和密切联系。他们都是深入数学学科本质的核心所在，折射了一种超越知识本位的价值理念。既是学生发展的出发点，也是落脚点和目标。大观念是在数学知识内容基础上的一种重新架构。以少而精的观念促使学生达成对于数学学科的深度理解，是落实数学素养的重要方式，也是连接知识和数学素养的桥梁，核心观念和深度理解
深度学习如何入门？ nanshaws yolov5 深度学习
深度学习是机器学习的一个子领域，它基于人工神经网络的研究。入门深度学习可以分为以下几个步骤：基础知识准备：（1）掌握基础数学知识，特别是线性代数、概率论和统计学、微积分。（2）学习编程语言，Python是目前最流行的深度学习语言，因其简洁易学且有大量的库支持。（3）了解机器学习基础，包括监督学习和非监督学习的概念、模型评估与选择等。学习深度学习理论：（1）理解神经网络的基本组成，如神经元、激活函数
深度学习应该如何入门？ wypdao 人工智能深度学习人工智能
深度学习是一门令人着迷的领域，但初学者可能会感到有些困惑。让我们从头开始，用通俗易懂的语言来探讨深度学习的基础知识。1.基础知识深度学习需要一些数学和编程基础。首先，我们要掌握一些数学知识，如线性代数、微积分和概率统计。这些知识在深度学习算法中非常常见。另外，选择一门编程语言作为工具，如Python，掌握其基本语法和常用库的使用。2.学习机器学习吴恩达的机器学习课程是一个很好的入门教程。虽然有些地
Acwing-基础算法课笔记之数学知识（中国剩余定理）不会敲代码的狗 Acwing基础算法课笔记算法笔记线性代数
Acwing-基础算法课笔记之数学知识（中国剩余定理）一、中国剩余定理1、概述1、表述一2、表述二2、辗转相除法求逆元的回顾3、模拟过程（1）例题一（2）例题二4、闫氏思想5、求最小正整数解二、扩展知识一、中国剩余定理1、概述{x≡a1(modm1)x≡a2(modm2)x≡a3(modm3)⋮x≡an(modmn)\begin{cases}x\equiva_1(modm_1)\\x\equiva
作业八:数学知识与思维导图公羽氵氵
当数学遇到导图，先是懵，不知道要干什么，先听课再说吧！图片发自App洋洋洒洒画完了课程导图后，发现白忙活了，哈哈，只怪自己不认真审题。不过一遍梳理下来，知识点通通都记牢了！再看题目，瞬间就把思路理清了两位数乘两位数前后用了15分钟就搞定了，只是图上的小图标太少了，实在是想不到要加些什么了。在第四分支时，布局不合理，导致不够写。挨挨挤挤，不太好看！《第八节数学知识点》作业自评[拥抱]打卡人：翁尤颖打
小学奥数全套试卷百度云资源，pdf可打印电子版地址更新全网优惠分享君
奥数，全称为奥林匹克数学竞赛，是一项极富挑战性的数学竞赛活动。它旨在发现和培养数学人才，提高他们的数学水平，并为国家培养出优秀的数学后备力量。在奥数竞赛中，学生需要掌握扎实的数学基础，灵活运用数学知识，解决各种复杂的数学问题。为了帮助小学生更好地学习奥数，我们整理了一份小学奥数全套试卷百度云资源，pdf可打印电子版。这份资源包含了小学奥数各年级的试卷，题型全面，难度适中，适合小学生练习和提高自己的
卷积CNN中的数学知识数据智能谷
来源网络对于一维函数f（x），其一阶微分的基本定义是差值：我们将二阶微分定义成如下差分：我们首先我们来看边缘的灰度分布图以及将一二阶微分作用于边缘上：我们可以看到，在边缘（也就是台阶处），二阶微分值非常大，其他地方值比较小或者接近0.那我们就会得到一个结论，微分算子的响应程度与图像在用算子操作的这一点的突变程度成正比，这样，图像微分增强边缘和其他突变（如噪声），而削弱灰度变化缓慢的区域。也就是说，
UnityShader——07数学知识：向量 Aubyn11 UnityShader 线性代数 unity
数学知识：向量二维（笛卡尔）坐标系二维向量（矢量）具有方向的线段叫做有向线段，以A为起点、B为终点的有向线段作为向量，可以记作v=B-A。区别于有向线段，在一般的数学研究中，向量是可以平移的。一个向量的坐标等于表示此向量的有向线段的终点坐标减去始点的坐标。二维向量加法二维向量减法二维向量点乘根据这个公式就可以计算向量a和向量b之间的夹角。从而就可以进一步判断这两个向量是否是同一方向，是否正交(也就
【机器学习算法】KNN鸢尾花种类预测案例和特征预处理。全md文档笔记（已分享，附代码）机器学习python算法
本系列文章md笔记（已分享）主要讨论机器学习算法相关知识。机器学习算法文章笔记以算法、案例为驱动的学习，伴随浅显易懂的数学知识，让大家掌握机器学习常见算法原理，应用Scikit-learn实现机器学习算法的应用，结合场景解决实际问题。包括K-近邻算法，线性回归，逻辑回归，决策树算法，集成学习，聚类算法。K-近邻算法的距离公式，应用LinearRegression或SGDRegressor实现回归预
20210304玩游戏学数学第一次预习作业大海2010
前几天开始读王志江和宋亚男老师合著的《玩游戏学数学》。朱永新老师老师在序言中写到，引导儿童发明数学、创造数学，像数学家一样研究数学。课程的丰富性决定了生命的丰富性，课程的卓越性决定了生命的卓越性。进取是人类共同的梦想，教育是人类必备的使命。王志江老师在前言写到，把客观的数学知识系统梳理清楚，仅仅算是一个小小的前提条件。我们必须真正搞清楚的是：一旦进入学习状态，儿童脑海中相关的已有经验是什么？这些经
【机器学习】机器学习常见算法详解第4篇：KNN算法计算过程（已分享，附代码）机器学习python算法
本系列文章md笔记（已分享）主要讨论机器学习算法相关知识。机器学习算法文章笔记以算法、案例为驱动的学习，伴随浅显易懂的数学知识，让大家掌握机器学习常见算法原理，应用Scikit-learn实现机器学习算法的应用，结合场景解决实际问题。包括K-近邻算法，线性回归，逻辑回归，决策树算法，集成学习，聚类算法。K-近邻算法的距离公式，应用LinearRegression或SGDRegressor实现回归预
GiantPandaCV | 一文弄懂 Diffusion Model 双木的木深度学习拓展阅读深度学习人工智能 python 计算机视觉图像处理 stable diffusion
本文来源公众号“GiantPandaCV”，仅用于学术分享，侵权删，干货满满。原文链接：一文弄懂DiffusionModel0前言最近AI绘图非常的火，其背后用到的核心技术之一就是DiffusionModel（扩散模型），虽然想要完全弄懂DiffusionModel和其中复杂的公式推导需要掌握比较多的前置数学知识，但这并不妨碍我们去理解其原理。接下来会以笔者所理解的角度去讲解什么是Diffusio
第一次数学月考试卷质量分析春天的承诺
这次数学试卷检测的范围应该说是内容比较全面的,检测的知识比较灵活。难易适度，能如实反映出学生的实际数学知识的掌握情况。考试成绩来看，基本达到了预期的目标。一，从卷面看，大致可分为两大类，第一类是基础知识，计算、看图写算式、填空、连线等一系列习题考察学生对于20以内的加减的计算能力。第二类是综合应用，主要是考应用题实践题。无论是试题的类型，还是试题的表达方式，都是适合学生现阶段的解决问题意识。试卷能
数学成绩好的孩子都有这三个习惯海韵互联
无论是小考，高考亦或是中考，平时的学习习惯对于一个学生来说，都至关重要，往往直接决定了考试的成与败。相信接下来要分享的学习习惯，能够真正地帮助学生们提高自己的数学成绩。一、试题在于精不在于多数学能力的提高离不开做题，“熟能生巧”这个简单的道理大家都懂。但做题不是搞题海战术，要通过一题联想到很多题。你要着重研究解题的思维过程，弄清基本数学知识和基本数学思想在解题中的意义和作用，研究运用不同的思维方法
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他