Mikey_Sun

【统计学习系列】多元线性回归模型（五）——参数与模型的显著性检验：t检验与F检验

文章目录

1. 前文回顾
2. 单参数显著性检验——t检验

2.1 问题的提出
2.2 检验统计量——t统计量的构造
2.3 拒绝域的构造
2.4 浅谈p值

3. 回归方程显著性检验——F检验

3.1 问题的提出
3.2 F检验统计量的构造
3.3 拒绝域的构造

4. 总结

参考文献
写在最后

【更新日志】
5/1/2020 对文章中公式与措辞中存在的问题进行修正(感谢评论区小伙伴的指正！)

1. 前文回顾

在上一篇文章中，我们分别研究了最小二乘估计量 β^_OLS 和 σ^_OLS 的相关性质，证明了 β^_OLS 是 β 的一个最优线性无偏估计量（BLUE）， σ^²_OLS 是 σ² 的一个无偏估计量，并得到了其在正态性误差假设下所对应的分布：
$\bm{\hat\beta}_{OLS} \thicksim N(\bm\beta, \sigma^2 ( \bm{X}^T \bm{X} )^{-1} )$ $\frac {\hat \sigma _{OLS}^2} {\sigma^2} \thicksim \chi^2_{N-p-1}$

（详情请见：【统计学习系列】多元线性回归模型（三）——参数估计量的性质）。

通过最小二乘法拟合好模型的参数后，一个重要的问题就是：这个模型真的“好"吗？满足什么条件、什么性质的模型可以称作一个“好模型”呢？

2. 单参数显著性检验——t检验

2.1 问题的提出

首先，我们应该想到的问题是，在一个多元回归模型中，是不是每一个引入的自变量对因变量都有实实在在的影响呢？这样的影响是显著的吗？我们应不应该在模型中保留这一变量呢？

在回答这些问题之前，我们先回顾一下总体模型：
$\beta_0 + \sum_{i=1}^{p} X_{i} \beta_i + \epsilon$ 其中：
$\epsilon \thicksim N(0,\sigma^2)$
让我们聚焦众多参数中的一个：β_i 。β_i 的意义是什么呢？当其他变量保持不变，而只有 X_i 变动时，每变动一个单位的 X_i，就会让 Y 平均变动 β_i 个单位。而若 X_i 的变动能够确确实实引起 Y 的变动，那么 β_i 应该不等于0。换句话说，若可以验证 β_i 不为0，那么就可以证明X_i 与 Y 存在线性相关关系。

【注1】 这里的关系是线性的。二次即更高阶的相关性并不能由 β_i 是否等于0体现；
【注2】 X_i 与 Y 存在相关关系，并不能证明二者之间存在 因果关系（Causality）。

然而，我们现在只有 β_i 的估计量 β^_OLS,i ，而估计量与参数的真实值有一定的误差。由于 β^_OLS,i 是一个统计量，因此只要我们在统计意义下验证 β_i 是否等于零就可以了。

至此，我们就可以构造一个如下的假设检验问题：

$H_0: \beta_i=0 \\ H_1: \beta_i\ne0$

2.2 检验统计量——t统计量的构造

若想构造检验统计量，我们需要先对 β^_OLS,i 进行变型。

记矩阵 (X^TX)^-1 的对角线元素：

$\text{diag}(\bm{X}^T \bm{X} )^{-1} = (v_{i,i})_{p+1}$

由第一部分中 β^_OLS 服从的分布，我们可以得到 β^_OLS,i 的分布：

$\hat\beta_{OLS, i} \thicksim N(\beta_i, \sigma^2 v_{i,i}) , \ i=0, 1,...,p$

将 β^_OLS 标准化，有：
$\frac {\hat\beta_{OLS,i} - \beta_i}{ \sigma \sqrt{v_{i,i}} } \thicksim N(0, 1) , \ i=0, 1,...,p$

然而，此时总体标准差σ 为未知参数，因此需要用样本标准差 σ^ 来代替。由于 σ^²_OLS 有分布：

$\frac {(N-P-1) \hat \sigma _{OLS}^2} {\sigma^2} \thicksim \chi^2_{N-p-1}$

由 t 分布的定义：
$\frac {\sqrt{(N-p-1)} (\hat\beta_{OLS,i} - \beta_i ) } { \sigma \sqrt{v_{i,i}} } / \sqrt{\frac {(N-p-1)\hat \sigma _{OLS}^2} {\sigma^2} } \\ =\frac {\hat\beta_{OLS,i} - \beta_i}{\hat \sigma \sqrt{v_{i,i}} } \thicksim t_{N-p-1}$
若原假设 H₀ 成立，即 β_i = 0，可以定义 t 统计量（又称 t 值）：
$\frac {\hat\beta_{OLS,i}}{\hat \sigma \sqrt{v_{i,i}} } \thicksim t_{N-p-1}$

并称上式分母项为 β^_OLS,i 的标准误（Standard Error, SE）。

从 t 统计量的定义式可以看出，t 的绝对值越大，β^_OLS,i 越不等于0，原假设越有可能出错，我们越应该拒绝原假设。

注1：t 值的几何意义为 β^_OLS,i 偏离其标准误的单位数；
注2：当N足够大时，t 统计量近似服从标准正态分布，因此可以使用标准正态分布进行替代。关于 t 分布与正态分布的关系，可参考文献[1] t分布收敛于标准正态分布的几种证明方法。
注3：关于t分布与t检验相关的更多知识，可参考文献[2] 我懒得找了。

2.3 拒绝域的构造

然而，t 统计量多大算大呢？多大我们才应该拒绝原假设呢？

假设原假设 H₀ 正确，根据 t 统计量所对应的分布，在给定某一概率 1-α（我们称其为置信水平（Confidence Level））的前提下，t 统计量应该满足：
$P\{ |t| >t_{\frac{\alpha}{2}, N-p-1} \}< \alpha$

其中，t_α/2,N-p-1是 t_N-p-1 分布的 α/2 分位数，可以通过计算机软件或者查 t 分布分布表的方式得到。

在判断原假设是否成立时，我们可以基于一个原则：小概率事件在一次试验中几乎不会发生。若 α 足够小，比如规定为常用的0.05，那么在 H₀ 正确的前提下，t 统计量的绝对值大于 t_0.025,N-p-1 的概率不超过5%。换言之，或者说 |t| > t_0.025,N-p-1，我们就有足够的理由去认为原假设不正确，从而拒绝原假设。

基于这种思想，我们可以构造出一个区域（称为拒绝域（Rejection Field））：
$(-\infin,-t_{\frac{\alpha}{2}, N-p-1}) \ \cup \ (t_{\frac{\alpha}{2}, N-p-1}, +\infin)$

图1 t检验拒绝域构造示意图（阴影部分即为对应显著性水平下的拒绝域。图片来源：百度图片）

当 t 统计量落入这个区域时，我们都应该拒绝原假设H₀，并认为 β_i 不等于0，自变量 X_i 与因变量 Y 存在统计意义下显著的线性相关关系（Statistically Significant Linear Correlation）。

注1：拒绝域，顾名思义，即若t值落入这个区间就应该拒绝原假设H₀；
注2：在应用时，我们可以记住一句口诀：t值（的绝对值）越大越拒绝。

2.4 浅谈p值

此外，许多统计软件在回归的结果中会给出参数估计量所对应的p值（p-value）。p值的意义是：拒绝原假设所需要的最小置信度。什么意思呢？就是说，如果给出的p值小于你需要的置信度 α ，那么我们就应该拒绝原假设。也就是说，若：
$\text{p-value}<\alpha$

我们应拒绝原假设H₀，并认为 β_i 不等于0，自变量 X_i 与因变量 Y 存在统计意义下显著的线性相关关系。

注1：与t值正好相反，在应用时，我们可以说：p值越小越拒绝；
注2：使用p值而不使用t值的好处是：p值不依赖于样本容量 N，不用查分布表，使用起来更加简单方便。

3. 回归方程显著性检验——F检验

3.1 问题的提出

在上一章的t检验中，我们对单一变量进行了显著性影响的评判。然而，这样做的一个缺点是：我们只判断了某一个解释变量对因变量单独的影响，而忽略了各解释变量对因变量的“共同作用”。若每一个变量单独与因变量不具有显著的线性关系，那么是不是模型本身就不能用了呢？未必。换句话说，只有模型中引入的解释变量 X₁, …, X_p 均不能解释因变量Y，那么我们所建立的模型才能说是没有意义的。因此，我们需要对模型整体进行检验。与t检验类似，我们可以构造如下的假设检验问题：
$H_0: \beta_1 = \beta_2 = ... = \beta_p =0 \\ H_1: \exist \ i \in \{1,2,...,p\}, s.t. \ \beta_i\ne0$

注：β₀ 不能放入检验变量中，因为现在需要检验的是 X 与 Y 的线性关系，而不是Y 是否等于0这一问题。

3.2 F检验统计量的构造

我们应该如何构建检验统计量呢？让我们重新考察原模型：
$y_i= \beta_0 + \sum_{j=1}^{p} x_{ij} \beta_j + \epsilon_i$

然而，若原假设H₀成立，那么模型将会退化为
$\beta_0 + \epsilon_i$

因此，假设回归方程是显著的（即H₀不成立），那么由回归方程所拟合的因变量 y^_i 应该有较大的方差，而其残差项所对应的方差应该较小，这是因为不同的解释变量 x_i 应该对应不同的被解释变量 y_i ；若回归方程不显著（H₀成立），那么此时回归方程所拟合的变量 y^_i 方差应该几乎为零，而其残差项 y^_i - y_i 则应具有较大的方差。

我们定义回归方程的可解释平方和（Explained Sum of Square，ESS）为：
$\sum_{i=1} ^N(\hat{y}_i - \bar{\hat{y}} )^2 = \sum_{i=1} ^N(\hat{y}_i - \bar{y} )^2$

回归的残差平方和（Residual Sum of Square，RSS）为：

$\sum_{i=1} ^N(\hat{y}_i - y_i )^2$

根据上述的分析，如果可解释平方（ESS）和与残差平方和（RSS）之比越大，则说明 X 对 Y 整体的影响越显著；若原假设H₀成立，则ESS与RSS的比值应该接近于0。

而容易证明，ESS与RSS分别服从卡方分布：
$\frac{ESS}{p} \thicksim \chi^2_{p}$ $\frac{RSS}{N-p-1} \thicksim \chi^2_{N-p-1}$

注：这部分证明将会在未来补充在附录中。

至此，我们可以构造F统计量：
$\frac{ESS/p}{RSS/N-p-1} \thicksim F(p, N-p-1)$

从F统计量的够造上来看，F统计量越大，说明 X 对 Y 存在的影响更大，原假设越可能被拒绝；而F统计量越接近零，说明 X 对 Y 存在的影响越小，原假设越可能成立。

注1：从F统计量的构造上来看，F取值非负（平方和与平方和的比值）；
注2：在应用过程中，可以记住口诀：F越大越拒绝；
注3：有关F分布与F检验更多的相关知识，请有关参考文献[3] 我还是懒得找了。

3.3 拒绝域的构造

与 t 统计量拒绝域构造方法类似，在给定置信水平 1 - α 的前提下，F 统计量应该满足：
$P\{ F > F_{\alpha} (p, N-p-1) \}< \alpha$

其中，F_α(p, N - p - 1) 是 F(p, N - p - 1) 分布的 α 分位数，可以通过计算机软件或者查 F 分布分布表的方式得到。

注：与 t 统计量的双尾检验区间不同的是，F 检验为单尾检验。

我们依然依照“小概率事件在一次试验中不会发生”的原则：在 H₀ 正确的前提下，F 统计量大于 F_α(p, N - p - 1) 的概率不超过 α。换言之，若 F > F_α(p, N - p - 1)，我们就有足够的理由去认为原假设不正确，从而拒绝原假设。

基于这种思想，我们可以构造拒绝域：
$(F_\alpha(p, N-p-1), +\infin)$

图2 F检验拒绝域构造示意图（阴影部分即为对应显著性水平下的拒绝域。图片来源：百度图片）

当 F 统计量落入拒绝域内时，我们应该拒绝原假设H₀，从而认为模型是显著的，或者说解释变量 X 与被解释变量 Y 之间存在显著的线性相关关系。

4. 总结

在这篇文章中，我们分别研究了单变量的显著性检验和模型的显著性检验。

（1）在单变量检验中，我们构造了假设检验问题：
$H_0: \beta_i=0 \\ H_1: \beta_i\ne0$

构造了检验统计量—— t 统计量：
$\frac {\hat\beta_{OLS,i}}{SE(\hat \beta_{OLS,i})}\thicksim t(N-p-1)$

并给出了拒绝域：
$(-\infin,-t_\frac{\alpha}{2}(N-p-1)) \ \cup \ (t_\frac{\alpha}{2}(N-p-1), +\infin)$
（2）在模型检验中，我们构造了假设检验问题：
$H_0: \beta_1 = \beta_2 = ... = \beta_p =0 \\ H_1: \exist \ i \in \{1,2,...,p\}, s.t. \ \beta_i\ne0$

构造了检验统计量—— F 统计量：
$\frac{ESS/p}{RSS/N-p-1} \thicksim F(p, N-p-1)$

并给出了拒绝域：
$(F_\alpha(p, N-p-1), +\infin)$
至此，我们解决了如何验证各个解释变量对因变量是否存在显著的线性影响，以及模型中涉及到的解释变量总体是否对因变量是否存在显著的线性影响。

参考文献

[1] t分布收敛于标准正态分布的几种证明方法

写在最后

欢迎感兴趣的小伙伴来跟作者一起挑刺儿~ 包括但不限于语言上的、排版上的和内容上的不足和疏漏~ 一起进步呀！
有任何问题，欢迎在本文下方留言，或者将问题发送至勘误邮箱： [email protected]
谢谢大家！

机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
行为识别的方法人工智能专属驿站深度学习
行为识别主要有以下几大类方法，每类方法各有特点及典型算法：传统方法特点：利用手工设计特征对行为进行表征，再用统计学习的分类方法进行识别。需一定专业知识设计特征，耗费人力物力，对复杂场景、遮挡等适应性差，但对简单背景、规则动作识别效果尚可。典型算法：时空关键点（Space-TimeInterestPoints）：基于视频图像中的关键点在时空维度上的变化来提取动作特征，但可能忽略视频细节，泛化能力较弱
最大熵模型（Maximum entropy model） Fang Suk 机器学习最大熵模型最大熵最大熵原理指数族分布
最大熵模型（Maximumentropymodel）本文你将知道：什么是最大熵原理，最大熵模型最大熵模型的推导（约束最优化问题求解）最大熵模型的含义与优缺点1最大熵原理最大熵原理：在满足已知约束条件的模型集合中，选择熵最大的模型。熵最大，对应着随机性最大。最大熵首先要满足已知事实，对于其他未知的情况，不做任何的假设，认为他们是等可能性的，此时随机性最大。2最大熵模型最大熵原理是统计学习的一般原理，
【统计学习方法读书笔记】（四）朴素贝叶斯法 Y.G Bingo 统计学习方法人工智能统计学习概率概率论
终于到了贝叶斯估计这章了，贝叶斯估计在我心中一直是很重要的地位，不过发现书中只用了不到10页介绍这一章，深度内容后，发现贝叶斯估计的基础公式确实不多，但是由于正态分布在生活中的普遍性，贝叶斯估计才应用的非常多吧！默认输入变量用XXX表示，输出变量用YYY表示概率公式描述：P(X=x)P(X=x)P(X=x)：表示当X=xX=xX=x时的概率P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣
【统计学习方法】感知机 jyyym ml苦手机器学习
一、前言感知机是FrankRosenblatt在1957年就职于康奈尔航空实验室时所发明的一种人工神经网络。它可以被视为一种最简单的前馈神经网络，是一种二元线性分类器。Seemoredetailsinwikipdia感知机.本篇blog将从统计学习方法三要素即模型、策略、算法三个方面介绍感知机，并给出相应代码实现。二、模型假设输入空间是x∈Rnx\in{R^n}x∈Rn，输出空间是y∈{−1,+1
赠书 | 李航老师的蓝皮书茗创科技
赠书活动统计学习方法“统计机器学习方法是实现智能化目标的最有效的手段，统计机器学习是各种智能性处理研究领域中的核心技术，并且在这些领域的发展及应用中起着决定性的作用。”作者简介李航，日本京都大学电气电子工程系毕业，日本东京大学计算机科学博士。北京大学、南京大学客座教授，IEEE会士，ACM杰出科学家，CCF高级会员。研究方向包括信息检索，自然语言处理，统计机器学习，及数据挖掘。曾出版过三部学术专著
人工智能值得关注的技术研究方向喜欢打酱油的老鸟人工智能人工智能值得关注的技术研究方向
人工智能值得关注的技术研究方向为了更好地破除上述人工智能技术研究的瓶颈问题，在AI学术研究领域，一些新的技术发展趋势和研究方向也值得关注，包括：(1)从专用人工智能到通用人工智能是大势所趋，一些科技巨头包括国家机构都在布局通用人工智能的研究，微软成立人工智能实验室以挑战通用人工智能为主要目标；(2)可解释的人工智能系统备受关注，也将成为突破统计学习瓶颈问题的一个重要方向。DARPA的报告：第一个波
机器学习入门--支持向量机原理与实践 Dr.Cup 机器学习入门支持向量机机器学习算法
支持向量机模型支持向量机（SupportVectorMachine，SVM）是一种常用的监督学习算法，主要用于分类和回归问题。它的原理简单而强大，在许多实际应用中取得了很好的效果。原理支持向量机（SupportVectorMachine，SVM）是一种常用的机器学习算法，用于分类和回归问题。其原理是基于统计学习理论中的结构风险最小化原则。SVM的主要思想是将数据通过一个高维特征空间进行映射，使得在
统计学习方法（李航）--第二章感知机（比较基础）人間煙火Just
感知机是二分类的线性分类模型，属于判别模型，包括原始形式和对偶形式。（一）感知机模型公式为：f是输出，x是输入，w和b是参数，sign是符号函数（大于0为1，小于0为-1）几何解释：对于特征空间Rn中的一个超平面S，w是S的法向量，b是截距，将超平面空间划分为两个部分，完成2分类任务。（二）学习策略1.数据集的线性可分性：若存在wx+b的超平面可以将数据集完全分割，则称为线性可分。2.学习策略（以
机器学习系列（8）——提升树与GBDT算法陌简宁机器学习
本文介绍提升树模型与GBDT算法。0x01、提升树模型提升树是以分类树或回归树为基本分类器的提升方法。提升树被认为是统计学习中性能最好的方法之一。提升方法实际采用加法模型（即基函数的线性组合）与前向分步算法，以决策树为基函数的提升方法称为提升树（boostingtree）。对分类问题决策树是二叉分类树，对回归问题决策树是二叉回归树。提升树模型可以表示为决策树的加法模型：其中，表示决策树，为决策树的
概率统计学习打卡——数理统计与描述性分析 xtsqmx
1.数理统计的基本概念总体：研究对象的全体（X）个体：组成总体的每个基本单元样本：从总体中抽取的一部分个体（）简单随机样本：具有随机性和独立性的样本，即样本相互独立具有同一分布样本的两重性：抽样前是随机变量，抽样后是具体的数统计量：样本的函数，不含有任何未知参数抽样分布：统计量的分布2.常用的统计量样本均值：用来估计总体均值和对对有关总体均值的假设做检验样本方差：用来估计总体方差和对有关总体方差的
统计学习方法笔记之决策树 Aengus_Sun
更多文章可以访问我的博客Aengus|Blog决策树的概念比较简单，可以将决策树看做一个if-then集合：如果“条件1”，那么...。决策树学习的损失函数通常是正则化后极大似然函数，学习的算法通常是一个递归的选择最优特征，并根据该特征对训练数据进行分割，使得对各个子数据集有一个最好的分类的过程。可以看出，决策树算法一般包含特征选择，决策树的生成与决策树的剪枝过程。特征选择信息增益熵和条件熵在了解
用户体验度量-量化用户体验的统计学方法挖泥巴
用户体验度量-量化用户体验的统计学方法作者：JeffSauro/JamesR.Lewis本书含有大量的统计学方法，用统计学方法来量化用户体验的度量问题。如果会统计学习或有打算往这个方向发展的用研同学可以参考。怎么说也是解决掉了一个大难题，既你的数据客观吗？要客观就按书上的来吧。用户研究的主要工作是对用户、目标、需求和行为能力的系统研究，用于指导产品设计及产品经营体验度量的基础都是围绕可用性测试、参
统计学习03：参数、统计量&标准误、置信区间小贝学生信
要点一：参数与统计量参数(parameter)描述总体(population)的概括性度量；统计参数必须要在整体数据都可被观察的时候才能计算，通常由于数量过大而不便于统计计算；例如，一个完美的人口普查。统计参数一般是固定的，但难以确定；参数一般用希腊字母表示，例如总体均值μ、标准差σ统计量(statistic)描述样本(sample)的概括性度量；一般根据统计量来估计总体参数，即为参数点估计；样本
【深度学习理论】持续更新一轮秋月科研基础深度学习人工智能
文章目录1.统计学习理论1.统计学习理论统计学习理论，一款适合零成本搞深度学习的大冤种的方向从人类学习到机器学习的对比（学习的过程分为归纳和演绎），引出泛化和过拟合的概念。如何表示归纳的函数规律呢？以监督问题为例，需要学习X到Y的映射，先做假设空间，为了使假设空间和真实映射接近，需要损失函数来优化假设空间。学习的目的是学习数据的分布而不是每一个数据点本身，所以希望期望风险最小（期望风险即假设在数据
《统计学习方法：李航》笔记从原理到实现（基于python）-- 第6章逻辑斯谛回归与最大熵模型（2）6.2 最大熵模型北方骑马的萝卜机器学习笔记学习方法笔记 python
文章目录6.2最大熵模型6.2.1最大熵原理6.2.3最大熵模型的学习6.2.4极大似然估计《统计学习方法：李航》笔记从原理到实现（基于python）--第3章k邻近邻法《统计学习方法：李航》笔记从原理到实现（基于python）--第1章统计学习方法概论《统计学习方法：李航》笔记从原理到实现（基于python）--第2章感知机《统计学习方法：李航》笔记从原理到实现（基于python）--第3章k邻
贝叶斯的缺点人机与认知实验室机器学习人工智能
贝叶斯方法是一种统计学习方法，通过利用贝叶斯定理来计算给定先验概率的情况下，后验概率的条件概率。虽然贝叶斯方法在许多领域中应用广泛且有效，但也存在一些缺点。以下是一些贝叶斯方法的缺点的例子：1、先验概率的选择贝叶斯方法依赖于先验概率的选择，先验概率的不准确性可能导致后验概率的不准确性。选择先验概率是非常困难的，特别是在没有明确领域知识或可靠数据支持的情况下。2、计算复杂度在贝叶斯方法中，计算后验概
向量机SVM原理详解 AI-CS研究生人工智能 AI SVM 向量机人工智能
转自：http://www.blogjava.net/zhenandaci/category/31868.html（一）SVM的简介支持向量机(SupportVectorMachine)是Cortes和Vapnik于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC维理论和
SVM入门（一）至（三）Refresh warmbeast
按:之前的文章重新汇编一下,修改了一些错误和不当的说法，一起复习,然后继续SVM之旅.（一）SVM的八股简介支持向量机(SupportVectorMachine)是Cortes和Vapnik于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的
SVM(1-3) discxuwei ML 算法 hyper vector c 出版 blog
从Jasper'Blog转载支持向量机(SupportVectorMachine)是Cortes和Vapnik于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性（即对特定训练样本的学习精度，Accuracy
《深度学习，统计学习，数学基础》人工智能算法工程师手册 La victoria 大数据机器学习
[导读]市面上很多人工智能相关的书籍。大部分的书，面向小白，内容深度不够；小部分教材书或者科研书，内容艰深，又过于复杂。那么有没有，面向算法工程师（程序员）人群的，面向有一定数学基础、算法基础，能够快速上手写代码的人群的人工智能手册呢？有的！而且免费开源，非常有程序员范！《AI算法工程师手册》你值得拥有！作者Github：https://github.com/huaxz1986手册地址：http:
《深度学习，统计学习，数学基础》人工智能算法工程师手册：程序员写的AI书，50 章一网打尽... 数据派THU
来源：专知本文约3400字，建议阅读10+分钟。免费开源人工智能手册，带你快速上手写代码！[导读]市面上很多人工智能相关的书籍。大部分的书，面向小白，内容深度不够；小部分教材书或者科研书，内容艰深，又过于复杂。那么有没有，面向算法工程师（程序员）人群的，面向有一定数学基础、算法基础，能够快速上手写代码的人群的人工智能手册呢？有的！而且免费开源，非常有程序员范！《AI算法工程师手册》你值得拥有！作者
机器学习知识体系总结 qq_36661243 机器学习算法
机器学习知识体系总结什么是机器学习？机器学习体系概括监督学习（SupervisedLearning）十种监督学习方法统计学习方法：模型+策略+学习方法模型策略学习算法无监督学习（UnsupervisedLearning）半监督学习参考所有的知识，无论过去，当下和未来，都可以利用某个单一，通用的学习算法中从数据中获取。–《终极算法》什么是机器学习？机器学习（MachineLearning,ML）是一
白铁时代 —— （监督学习）原理推导人生简洁之道 2020年 -面试笔记人工智能
来自李航《统计学习方法》文章目录-1指标相似度0概论1优化类1.1朴素贝叶斯1.2k近邻-kNN1.3线性判别分析二分类LDA多分类LDA流程LDA和PCA的区别和联系1.4逻辑回归模型&最大熵模型逻辑回归最大熵模型最优化1.5感知机&SVM感知机SVM线性可分SVM线性不可分SVM对偶优化问题&非线性SVM序列最小优化算法SMO1.7概率图模型EM算法EM算法的导出和流程应用举例：高斯混合模型(
最大熵阈值python_李航统计学习方法（六）----逻辑斯谛回归与最大熵模型 weixin_39669638 最大熵阈值python
本文希望通过《统计学习方法》第六章的学习，由表及里地系统学习最大熵模型。文中使用Python实现了逻辑斯谛回归模型的3种梯度下降最优化算法，并制作了可视化动画。针对最大熵，提供一份简明的GIS最优化算法实现，并注解了一个IIS最优化算法的Java实现。本文属于初学者的个人笔记，能力有限，无法对著作中的公式推导做进一步发挥，也无法保证自己的理解是完全正确的，特此说明，恳请指教逻辑斯谛回归模型逻辑斯谛
《统计学习方法：李航》笔记从原理到实现（基于python）-- 第6章逻辑斯谛回归与最大熵模型（1）6.1 逻辑斯谛回归模型北方骑马的萝卜机器学习笔记学习方法笔记 python
文章目录第6章逻辑斯谛回归与最大熵模型6.1逻辑斯谛回归模型6.1.1逻辑斯谛分布6.1.2二项逻辑斯谛回归模型6.1.3模型参数估计6.1.4多项逻辑斯谛回归《统计学习方法：李航》笔记从原理到实现（基于python）--第3章k邻近邻法《统计学习方法：李航》笔记从原理到实现（基于python）--第1章统计学习方法概论《统计学习方法：李航》笔记从原理到实现（基于python）--第2章感知机《统
【动手学大模型】第一章大模型简介 Farah_Y 大模型开发 ai
动手学大模型第一章大模型简述语言建模最早使用统计学习的方法，通过前面的词汇来预测下一个词汇。其在理解复杂语言规则方面存在一定局限性。之后引入了深度学习的思想，使用神经网络模型来更好的捕捉语言中的复杂关系。随着Transformer架构的神经网络模型引入，通过大量的文本数据训练，模型可以深入理解语言规则和模式。同时研究人员发现，随着语言模型规模的扩大，比如增加模型大小和使用更多的训练数据，模型展现出
统计学习复习（知识点+习题）玛卡巴卡_qin 课程学习
复习资料：https://github.com/RuijieZhu94/StatisticalLearning_USTC第一章线性回归1.Fromonetotwo最小二乘课后题有偏/无偏估计加权最小二乘2.Regularization线性回归（二维情况）求解有约束优化问题正则化最小加权二乘不确定答案形式3.BasicFunction核函数岭回归有个关于核函数的推导，但应该不会考4.Bias-var
机器学习强化学习深度学习的区别与联系坠金机器学习机器学习人工智能深度学习
机器学习强化学习深度学习机器学习按道理来说，这个领域（机器学习）应该叫做统计学习（StatisticalLearning），因为它的方法都是由概率统计领域拿来的。这些人中的领军人物很有商业头脑，把统计和物理的数理模型，改名叫做机器，比如**模型（model）就叫**机（machine），把一些层次模型（hierarchicalmodel）说成是“网”（net）。这样，搞出了几个“机”和“网”之后，
李航统计学习方法----决策树章节学习笔记以及python代码詹sir的BLOG 大数据 python 决策树算法剪枝
目录1决策树模型2特征选择2.1数据引入2.2信息熵和信息增益3决策树生成3.1ID3算法3.2C4.5算法4决策树的剪枝5CART算法（classificationandregressiontree）5.1回归树算法5.2分类树的生成5.3CART剪枝6PYTHON代码实例决策树算法可以应用于分类问题与回归问题，李航的书中主要讲解的是分类树，构建决策树分为三个过程，分别是特征选择、决策树生成、决
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key