chinpion

机器学中的参数估计

机器学习中的参数估计方法

原创 2015年01月10日 19:46:14

标签：
机器学习 /
参数估计 /

2778
编辑
删除

前几天上的机器学习课上，老师讲到了参数估计的三种方法：ML，MAP和Bayesian estimation。课后，又查了一些相关资料，以及老师推荐的LDA方面的论文《Parameter estimation for text analysis》。本文主要介绍文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计，以及三者之间的区别。

1、最大似然估计MLE

首先回顾一下贝叶斯公式

$p(\theta|X) = \frac{p(X|\theta) \cdot p(\theta)}{p(X)}$

这个公式也称为逆概率公式，可以将后验概率转化为基于似然函数和先验概率的计算表达式，即

$posterior = \frac{likelihood \cdot prior}{evidence}$

最大似然估计就是要用似然函数取到最大值时的参数值作为估计值，似然函数可以写做

$L(\theta | X) = p(X | \theta) = \prod_{x \in X}{p(X = x | \theta)}$

由于有连乘运算，通常对似然函数取对数计算简便，即对数似然函数。最大似然估计问题可以写成

$\hat{\theta}_{ML} = argmax_\theta L(\theta | X) = argmax_\theta \sum_{x \in X}\log p(x|\theta)$

这是一个关于 $\theta$ 的函数，求解这个优化问题通常对 $\theta$ 求导，得到导数为0的极值点。该函数取得最大值是对应的 $\theta$ 的取值就是我们估计的模型参数。

以扔硬币的伯努利实验为例子，N次实验的结果服从二项分布，参数为P，即每次实验事件发生的概率，不妨设为是得到正面的概率。为了估计P，采用最大似然估计，似然函数可以写作

$\begin{aligned} L &= \log\prod_{i=1}^Np(C=c_i|p)=\sum_{i=1}^N\log p(C=c_i|p) \\ &= n^{(1)}\log p(C = 1|p) + n^{(0)}\log p(C = 0|p)\\ &= n^{(1)}\log p + n^{(0)}\log (1-p) \end{aligned}$

其中表示实验结果为i的次数。下面求似然函数的极值点，有

$\frac{\partial{L}} {\partial{p}} = \frac{n^{(1)}}{p} - \frac{n^{(0)}}{1-p} = 0$

得到参数p的最大似然估计值为

$\hat{p}_{ML} = \frac{n^{(1)}}{n^{(1)} + n^{(0)}} = \frac{n^{(1)}}{N}$

可以看出二项分布中每次事件发的概率p就等于做N次独立重复随机试验中事件发生的概率。

如果我们做20次实验，出现正面12次，反面8次

那么根据最大似然估计得到参数值p为12/20 = 0.6。

2、最大后验估计MAP

最大后验估计与最大似然估计相似，不同点在于估计 $\theta$ 的函数中允许加入一个先验 $p(\theta)$ ，也就是说此时不是要求似然函数最大，而是要求由贝叶斯公式计算出的整个后验概率最大，即

$\begin{aligned} \hat{\theta}_{MAP} &= argmax_\theta \frac{p(X | \theta) p(\theta)}{p(X)}\\ &= argmax_\theta p(X | \theta)p(\theta) \\ &= argmax_\theta \{L(\theta|X) + \log p(\theta)\}\\ &= argmax_\theta \{\sum_{x \in X} \log p(x | \theta) + \log p(\theta)\} \end{aligned}$

注意这里P（X）与参数 $\theta$ 无关，因此等价于要使分子最大。与最大似然估计相比，现在需要多加上一个先验分布概率的对数。在实际应用中，这个先验可以用来描述人们已经知道或者接受的普遍规律。例如在扔硬币的试验中，每次抛出正面发生的概率应该服从一个概率分布，这个概率在0.5处取得最大值，这个分布就是先验分布。先验分布的参数我们称为超参数(hyperparameter)即

$p(\theta)= p(\theta|\alpha)$

同样的道理，当上述后验概率取得最大值时，我们就得到根据MAP估计出的参数值。给定观测到的样本数据，一个新的值 $\tilde{x}$ 发生的概率是

$p(\tilde{x}|X) = \int_{\theta \in \Theta}p(\tilde{x}|\hat{\theta}_{MAP}) p(\theta | X) d\theta = p(\tilde{x}|\hat{\theta}_{MAP})$

下面我们仍然以扔硬币的例子来说明，我们期望先验概率分布在0.5处取得最大值，我们可以选用Beta分布即

$p(p|\alpha, \beta) = \frac{1}{B(\alpha, \beta)}p^{\alpha - 1}(1-p)^{\beta - 1} \stackrel{\triangle}{=}Beta(p|\alpha, \beta)$

其中Beta函数展开是

$B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)}$

当x为正整数时

$\Gamma(n) = (n-1)!\,$

Beta分布的随机变量范围是[0,1],所以可以生成normalised probability values。下图给出了不同参数情况下的Beta分布的概率密度函数

我们取 $\alpha = \beta = 5$ ,这样先验分布在0.5处取得最大值，现在我们来求解MAP估计函数的极值点，同样对p求导数我们有

$\frac{\partial \hat\theta_{MAP}}{\partial p} = \frac{n^{(1)}}{p}-\frac{n^{(0)}}{1-p}+\frac{\alpha - 1}{p}-\frac{\beta - 1}{1 - p} = 0$

得到参数p的的最大后验估计值为

$\hat{p}_{MAP} = \frac{n^{(1)} + \alpha - 1}{n^{(1)} + n^{(0)} + \alpha + \beta - 2} = \frac{n^{(1)} + 4}{n^{(1)} + n^{(0)} + 8}$

和最大似然估计的结果对比可以发现结果中多了 $\alpha -1 , \alpha + \beta -2$ 这样的pseudo-counts,这就是先验在起作用。并且超参数越大，为了改变先验分布传递的belief所需要的观察值就越多，此时对应的Beta函数越聚集，紧缩在其最大值两侧。

如果我们做20次实验，出现正面12次，反面8次，那么

那么根据MAP估计出来的参数p为16/28 = 0.571,小于最大似然估计得到的值0.6，这也显示了“硬币一般是两面均匀的”这一先验对参数估计的影响。

3 贝叶斯估计

贝叶斯估计是在MAP上做进一步拓展，此时不直接估计参数的值，而是允许参数服从一定概率分布。回顾一下贝叶斯公式

$p(\theta|X) = \frac{p(X|\theta) \cdot p(\theta)}{p(X)}$

现在不是要求后验概率最大，这样就需要求,即观察到的evidence的概率，由全概率公式展开可得

$p(X) = \int_{\theta \in \Theta}p(X|\theta)p(\theta)d\theta$

当新的数据被观察到时，后验概率可以自动随之调整。但是通常这个全概率的求法是贝叶斯估计比较有技巧性的地方。

那么如何用贝叶斯估计来做预测呢？如果我们想求一个新值 $\hat{x}$ 的概率，可以由

$p(\hat{x}|X) = \int_{\theta \in \Theta} p(\hat{x} | \theta)p(\theta|X)d\theta=\int_{\theta \in \Theta}p(\hat{x}|\theta)\frac{p(X|\theta)p(\theta)}{p(X)}d\theta$

来计算。注意此时第二项因子在 $\theta \in \Theta$ 上的积分不再等于1，这就是和MLE及MAP很大的不同点。

我们仍然以扔硬币的伯努利实验为例来说明。和MAP中一样，我们假设先验分布为Beta分布，但是构造贝叶斯估计时，不是要求用后验最大时的参数来近似作为参数值，而是求满足Beta分布的参数p的期望，有

注意这里用到了公式

$\int_p\prod_{t=1}^{|T|}P_t^{\alpha_t - 1} = B(\alpha)$

当T为二维的情形可以对Beta分布来应用；T为多维的情形可以对狄利克雷分布应用

根据结果可以知道，根据贝叶斯估计，参数p服从一个新的Beta分布。回忆一下，我们为p选取的先验分布是Beta分布，然后以p为参数的二项分布用贝叶斯估计得到的后验概率仍然服从Beta分布，由此我们说二项分布和Beta分布是共轭分布。在概率语言模型中，通常选取共轭分布作为先验，可以带来计算上的方便性。最典型的就是LDA中每个文档中词的Topic分布服从Multinomial分布，其先验选取共轭分布即Dirichlet分布；每个Topic下词的分布服从Multinomial分布，其先验也同样选取共轭分布即Dirichlet分布。

根据Beta分布的期望和方差计算公式，我们有

可以看出此时估计的p的期望和MLE ，MAP中得到的估计值都不同，此时如果仍然是做20次实验，12次正面，8次反面，那么我们根据贝叶斯估计得到的p满足参数为12+5和8+5的Beta分布，其均值和方差分别是17/30=0.567, 17*13/(31*30^2)=0.0079。可以看到此时求出的p的期望比MLE和MAP得到的估计值都小，更加接近0.5。

综上所述我们可以可视化MLE,MAP和贝叶斯估计对参数的估计结果如下

个人理解是，从MLE到MAP再到贝叶斯估计，对参数的表示越来越精确，得到的参数估计结果也越来越接近0.5这个先验概率，越来越能够反映基于样本的真实参数情况。

4.三者之间的区别

首先我们可以看到,最大似然估计和最大后验估计都是基于一个假设，即把待估计的参数π看做是一个固定的值，只是其取值未知。而最大似然是最简单的形式，其假定参数虽然未知，但是是确定值，就是找到使得样本对数似然分布最大的参数。而最大后验，只是优化函数为后验概率形式，多了一个先验概率项。而贝叶斯估计和二者最大的不同在于，它假定参数是一个随机的变量，不是确定值。在样本分布P(π|χ)上，π是有可能取从0到1的任意一个值的，只是取到的概率不同。而MAP和MLE只取了整个概率分布P(π|χ)上的一个点，丢失了一些观察到的数据χ给予的信息（这也就是经典统计学派和贝叶斯学派最大的分歧所在。）

参考文献：

1.Gregor Heinrich, Parameter estimation for test analysis, technical report

2.文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计 http://blog.csdn.net/yangliuy/article/details/8296481

3.《Gibbs Sampling for the UniniTiated》阅读笔记(上)---参数估计方法及Gibbs Sampling简介 http://crescentmoon.info/2013/06/29/Gibbs%20Sampling%20for%20the%20UniniTiated-1/

阅读全文

本文已收录于以下专栏：

发表评论

参数估计的方法，MLE,MAP,Bayesian estimator

Density estimation是learning中常见的一个task,即估计该分布的参数θ。在有限的样本下，如何判定哪个估计最优，概率论中有两种常用的principle：MLE（Maximum ...

xyqzki
2013年08月29日 20:43
3755

机器学习中三类参数估计的方法

本文主要介绍三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。1、最大似然估计MLE首先回顾一下贝叶斯公式...

wtq1993
2016年04月21日 21:30
1275

贝叶斯参数估计的理解

极大似然估计贝叶斯估计是参数估计中的一种方法，以贝叶斯思想为基础，而贝叶斯思想在机器学习中经常用到。机器学习中常涉及贝叶斯网络，最终的问题都是转化为参数求解。贝叶斯参数估计是这些问题的基础版本。前方高...

jinping_shi
2016年12月03日 13:51
1072

机器学习 - GMM参数估计的EM算法

看理论之前先来【举个例子】：对于一个未知参数的模型，我们观测他的输出，得到下图这样的直方图：我们先假设它是由两个高斯分布混合叠加而成的，那么我们该怎么去得到这两个高斯分布的参数呢？ EM算法！！...

Robin__Chou
2016年11月09日 14:16
1346

EM算法---基于隐变量的参数估计

注：本文中所有公式和思路来自于李航博士的《统计学习方法》一书，我只是为了加深记忆和理解写的本文。】EM算法算是机器学习中有些难度的算法之一，也是非常重要的算法，曾经被誉为10大数据挖掘算法之一，...

u012771351
2016年11月03日 10:31
1155

机器学习中常用的矩阵求导公式

主要copy自新浪微博MachineLearner的博客希望作为自己学习机器学习的工具。矩阵求导好像从来没有学过，讲矩阵的课不讲求导，讲求导的课不讲矩阵。像维基百科什么的查找起来又费劲。其实在实际机器...

xtydtc
2016年04月12日 15:31
8014

机器学习中的损失函数

损失函数（loss function）是用来估量你模型的预测值f(x)与真实值Y的不一致程度，它是一个非负实值函数,通常使用L(Y, f(x))来表示，损失函数越小，模型的鲁棒性就越好。损失函数是经验...

rosenor1
2016年08月24日 17:07
5207

机器学习中的参数与超参数之间的区别

机器学习中的模型参数和模型超参数在作用、来源等方面都有所不同，而模型超参数常被称为模型参数，这样，很容易对初学者造成混淆。本文给出了模型参数和模型超参数的定义，并进行了对比，指出了二者本质上的区别：模...

shenxiaoming77
2017年08月07日 15:38
1536

核密度估计与自适应带宽的核密度估计

最近看论文，发现一个很不错的概率密度估计方法。在此小记一下。先来看看准备知识。密度估计经常在统计学中作为一种使用有限的样本来估计其概率密度函数的方法。我们在研究随机变量的过程中，随机变量的...

ChiXueZhiHun
2017年06月29日 22:26
1683

机器学习之深度学习(Deep Learning)

Deep Learning是机器学习中一个非常接近AI的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，最近研究了机器学习中一些深度学习的相关知识，本文给出一些很有用的资料和心得。...

u014365862
2015年09月04日 20:40
906

贝叶斯 - 《贝叶斯统计》笔记

《贝叶斯统计 - 茆诗松》茆诗松《贝叶斯统计》目前看过的讲贝叶斯方法最通俗易懂的书了下载了在这里第一章先验分布和后验分布1.1 三种信息 统计学的两个主要学派：频率学派，贝叶斯学...

jackxu8
2017年04月21日 17:13
1767

常见的预测算法

常见的预测算法有1.简易平均法，包括几何平均法、算术平均法及加权平均法;2.移动平均法，包括简单移动平均法和加权移动平均法;3,指数平滑法，包括一次指数平滑法和二次指数平滑法，三次指数平滑法;...

konglongaa
2016年05月19日 14:13
20583

参数估计：文本分析的参数估计方法

http://blog.csdn.net/pipisorry/article/details/51482120文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。参数估...

pipisorry
2016年05月23日 17:36
11905

三种参数估计方法（MLE，MAP，贝叶斯估计）

Leo_Xu06
2016年04月22日 18:02
769

参数估计-最大似然估计和贝叶斯参数估计

为什么要进行参数估计　　参数估计是统计学中的经典问题，常用的方法是最大似然估计和贝叶斯估计。为什么机器学习中，也会用到参数估计呢？我们利用训练样本来估计先验概率和条件概率密度，并以此设计分类器。当假...

yujianmin1990
2015年08月18日 23:11
3068

2.数理统计与参数估计

内容简介：A.重要统计量B.重要定理与不等式C.参数估计A.重要统计量一、概率与统计概率：已知总体的分布情况，计算事件的概率统计：总体分布未知，通过样本值估计总体的分布二、概率统...

aidway
2016年05月05日 22:57
1631

系统学习机器学习之参数方法（一）

最大似然估计法的基本思想　　最大似然估计法的思想很简单：在已经得到试验结果的情况下，我们应该寻找使这个结果出现的可能性最大的那个作为真的估计。　　我们分两种情进行分析：　　1．离散型总...

App_12062011
2015年12月15日 09:32
1988

机器学习之极大似然估计

极大似然估计基本思想极大似然估计是在总体类型已知的条件下使用的一种参数估计方法。首先是德国数学家高斯在1821年提出的，然而这个方法常归功于英国统计学家费歇。极大似然法的基本思想通过一...

weiyudang11
2016年05月28日 10:47
1298

系统学习机器学习之参数方法（三）

原文：http://www.cnblogs.com/jerrylead1判别模型与生成模型上篇报告中提到的回归模型是判别模型，也就是根据特征值来求结果的概率。形式化表示为，在参数确定的情况下，求解...

App_12062011
2016年01月19日 09:36
1414

七月算法机器学习笔记1--机器学习中的数学之数理统计和参数估计

数理统计和参数估计首先，看一下概率与统计的关注点概率论问问题的方式：已知总体的可能性，求某种事件发生的概率，如图所示：...

thystar
2016年04月25日 18:06
1442

yt71656

＋关注

原创

粉丝

喜欢

码云

未开通

他的最新文章

他的热门文章

关于LDA学习的一些有用的博客以及大牛写的代码实现
5330
如何确定LDA的topic个数
3575
机器学习中的参数估计方法
2749
一文读懂机器学习，大数据/自然语言处理/算法全有了……
645
从最大似然到EM算法浅解
632

【esp32】VSCODE + esp-idf 使用记录 zscredstone vscode ide 编辑器
旨在进行学习使用过程中的问题记录。esp已经把vscode插件做的不错了，可以直接进行编译调试。使用的是esp32S3内置的usb/jtag主要参考：https://blog.csdn.net/weixin_50993868/article/details/136498570https://blog.csdn.net/weixin_43842462/article/details/12329584
selenium 等待方式不负韶华ღ #selenium selenium python 测试工具
概述在selenium中，等待指的是在执行下一个任务之前需要等待前一个任务完成，在前一个任务没有完成之前，后一个任务会一直处于阻塞状体，有点类似于数据库中的事务。比如，在定位元素之前需要加载完DOM。selenium有三种等待方式：显示等待、隐式等待、流畅等待。方式显示等待WebDriverWait(driver,timeout).until(method,message)显示等待是seleniu
selenium 等待ajax,如何等待Selenium IDE中的所有ajax请求完成？华西怀 selenium 等待ajax
我有一阵子没用过IDE。这是我用于WebDriver的。但算法翻译;JavaScript是JavaScript。这就是说，这取决于你的框架。对于角度，我用这个：publicbooleanwaitForAngularToLoad(WebDriverdriver,intwaitTimeInSeconds){WebDriverWaitwait=newWebDriverWait(driver,waitTi
金融时间序列分析（Yahoo Finance API实战）闲人编程 Python数据分析实战精要金融 yfinance 时间序列波动率数据归一化数据分析 Dash
这里写目录标题金融时间序列分析（YahooFinanceAPI实战）1.引言2.项目背景与意义3.数据集介绍4.GPU加速在数据处理中的应用5.交互式GUI设计与加速处理6.系统整体架构7.数学公式与指标计算8.完整代码实现9.代码自查与BUG排查10.总结与展望金融时间序列分析（YahooFinanceAPI实战）1.引言在当今金融市场中，时间序列数据分析是理解股票、指数以及其他金融产品走势的重
【从零开始学习计算机科学】软件工程（五）软件设计贫苦游商学习软件工程软件开发软件设计敏捷开发极限编程软件需求
【从零开始学习计算机科学】软件工程（五）软件设计软件设计概述良好的设计具有三大特性设计主要包含的方面设计中的一些概念设计的方法与策略体系结构设计体系结构设计的基本问题：体系结构的设计模式体系结构设计的过程构建级设计面向对象构件设计用户接口设计用户接口设计原则：用户接口分析的目标：设计的评审软件设计概述软件的分析偏重于问题域，描述软件要做什么，而设计则偏重于解决方案，描述软件究竟要如何做。设计创建了
【从零开始学习计算机科学】软件工程（一）软件工程中的过程模型贫苦游商学习软件工程过程模型瀑布模型敏捷开发极限编程 V模型
【从零开始学习计算机科学】软件工程（一）软件工程中的过程模型软件与软件工程软件工程具有以下核心要素软件工程中的过程模型惯用过程模型瀑布模型V模型增量过程模型演化过程模型原型模型螺旋模型协同开发模型喷泉模型专用过程模型构件组装模型统一过程模型（RUP）统一过程模型的起源与发展面向对象UMLRUP有9个工作流：敏捷模型敏捷开发的立场极限编程工业级极限编程（IXP）ScrumScrum中有三种角色：Sc
【从零开始学习计算机科学】硬件设计与FPGA原理贫苦游商【从零开始学习计算机】硬件设计 fpga开发学习数字逻辑 verilog HDL 硬件设计硬件工程
硬件设计硬件设计流程在设计硬件电路之前，首先要把大的框架和架构要搞清楚，这要求我们搞清楚要实现什么功能，然后找找有否能实现同样或相似功能的参考电路板（要懂得尽量利用他人的成果，越是有经验的工程师越会懂得借鉴他人的成果）。如果你找到了的参考设计，最好还是先看懂并理解，这一方面能提高我们的电路理解能力，而且能避免设计中的错误。在开始做硬件设计前，根据自己的项目需求，可以去找能够满足硬件功能设计的，有很
新手村：数据预处理-异常值检测方法嘉羽很烦机器学习机器学习
机器学习中异常值检测方法一、前置条件知识领域要求编程基础Python基础（变量、循环、函数）、JupyterNotebook或PyCharm使用。统计学基础理解均值、中位数、标准差、四分位数、正态分布、Z-score等概念。机器学习基础熟悉监督/无监督学习、分类、聚类、回归等基本概念。数据预处理数据清洗、特征缩放（标准化/归一化）、数据可视化（Matplotlib/Seaborn）。二、渐进式学习
新手村：数据预处理-特征缩放嘉羽很烦机器学习线性回归算法机器学习
新手村：数据预处理-特征缩放特征缩放（FeatureScaling）是数据预处理中的一个重要步骤，特别是在应用某些机器学习算法时。特征缩放可以使不同尺度的特征具有相同的量级，从而提高模型训练的效率和性能。常见的特征缩放方法包括标准化（Standardization）和归一化（Normalization）。常见的特征缩放方法标准化（Standardization）将特征转换为均值为0，标准差为1的标
立创EDA设置铺铜设置 dzdesigned 硬件工程
1选中最外面边框，注意选中的时候边框是蓝色的，设置填充样式，网格45°或者90°可选2标准版删除铺铜，点击pcb上的铺铜部分，此时边框变成蓝色，然后点击边框，就可以看到铺铜属性在这个层下，选择编辑，然后删除铺铜就可以删除了
使用Dapper和FastExcel在.NET中将SQL Server数据导出到Excel Tnp____ .net excel oracle .NET
在许多应用程序中，将数据库中的数据导出到Excel是一项常见的需求。在.NET开发中，使用Dapper和FastExcel库可以方便地实现这一目标。Dapper是一个轻量级的ORM（对象关系映射）工具，可以简化数据库访问。而FastExcel是一个高性能的Excel读写库，可以快速地生成Excel文件。本文将介绍如何使用Dapper和FastExcel库从SQLServer数据库中检索数据，并将其
Python在数据处理中的应用：从入门到精通程之编 python 信息可视化开发语言
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！在当今数字化时代，数据处理已成为各个领域不可或缺的一部分。无论是企业决策、科学研究还是日常的个人数据分析，掌握高效的
支持向量机 (SVM) 算法详解 sssugarr 机器学习算法详解 python svm 支持向量机算法 sklearn
支持向量机(SVM)算法详解支持向量机（SupportVectorMachine,SVM）是一种监督学习模型，广泛应用于分类和回归分析。SVM特别适合高维数据，并且在处理复杂非线性数据时表现出色。本文将详细讲解SVM的原理、数学公式、应用场景及其在Python中的实现。什么是支持向量机？支持向量机的目标是找到一个最佳的决策边界（或称超平面）来最大限度地分隔不同类别的数据点。对于线性可分的数据，SV
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？北京华人开创公司北斗卫星授时 NTP时间同步 GPS对时装置 NTP 时间同步服务器网络时间服务器 NTP时间服务器网络系统时钟同步
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？京准电钟分享：医院网络内NTP时间同步服务器作用是什么？时间同步技术必定将是整个大数据处理系统的重要支撑和保障。时间同步技术使数据产生与处理系统的所有节点具有全局的、统一的标准时间，从而使系统中的所有各种消息、事件、节点、数据等具备正确的逻辑性、协调性以及可追溯性。大数据产生与处理系统是各种计算设备集群的，计算设备将统一、同步的标准时间用于记
Redis数据的删除策略 l1050188952 redis 数据库缓存
Redis是一个key-value存储系统。可基于内存亦可持久化的日志型数据库，一般存储高热度数据,所有数据均存放在内存中，通过TTL指令获取目前状态：-1是永久有效的数据-2是已过期/删除或者是未定义的数据。Redis删除的就是已过期的数据，而过期的数据不会真的删除。redis服务器有很多操作需要执行时，CPU的压力会很大，于是redis中的策略是，在内存还够的前提下，先不释放已删除数据的内存空
过拟合：机器学习中的“死记硬背”陷阱彩旗工作室人工智能机器学习人工智能
在机器学习中，过拟合（Overfitting）是一个几乎每个从业者都会遇到的经典问题。它像一把双刃剑：当模型过于“聪明”时，可能会陷入对训练数据的过度依赖，从而失去处理新问题的能力。本文将从原理到实践，深入探讨过拟合的本质及应对策略。1.什么是过拟合？过拟合是指模型在训练数据上表现极佳，但在新数据（测试数据或真实场景数据）上表现显著下降的现象。通俗来说，模型像一个“死记硬背的学生”，记住了训练集中
MongoDB集合（表）自动创建机制 zpjing~.~ mongodb 数据库
开发项目时，要整理上线涉及的表，MongoDB里新创建的表是不用整理发给运维的，因为代码中插入数据时，MongoDB会自动创建哦MongoDB中的集合（表）是在插入数据时自动创建的。当你第一次向一个不存在的集合插入文档时，MongoDB会自动创建该集合。你不需要像在关系型数据库中那样预先定义表结构。例如，执行以下操作时：db.myCollection.insertOne({name:"Alice"
java 对象和变量的区别_JAVA中的类／对象／变量／方法／参数含义及区别和联系... 抱玉于浮光 java 对象和变量的区别
JAVA学习了半月有余，最开始对这些东西的定义还是很清晰的，但越往后面，前面的东西没那么清晰了，返回来在看这些定义，为了以后方便查阅，现在摘录一下，放在这儿。类：类是组成java程序的基本要素。类封装了一类对象的属性和方法。类是用来定义产生对象的模板。类的实现包括两部分：类声明和类体。类体分为两部分：成员变量和局部变量。1、成员变量和局部变更的类型可以是java中的任何一种数据类型.变量定义部分所
harmony Next 基础知识点1 趋势大仙 Harmony harmonyos 华为
容器类—Column和Row布局容器概念Column表示沿垂直方向布局的容器Row表示沿水平方向布局的容器对齐方式justifyContent:设置子元素在主轴方向的对齐格式alignItems:设置子元素在交叉轴方向的对齐格式主轴和交叉轴的概念主轴：在Column容器中的子组件是按照从上到下的垂直方向布局的，其主轴的方向是垂直方向；在Row容器中的组件是按照从左到右的水平方向布局的，其主轴的方向
Adaptive AUTOSAR之诊断模块（DIA） weixin_42130902 Adaptive AUTOSAR 车载系统
ara::dia简介ara::dia模块是ARA（AUTOSARRuntimeforAdaptiveApplications）中的一个关键模块，用于诊断和故障管理。它提供了一系列功能和服务，帮助开发人员进行故障诊断和故障管理，以确保系统的可靠性和稳定性。ara::dia模块包括以下子模块和服务：ara::com：用于通信的模块，支持诊断通信和故障管理通信。ara::diag：用于故障诊断的模块，提
阿里云镜像源安装pip 喝水时间到 pip 服务器
如果出现已经安装过virtualenv，但不在系统PATH中的情况，建议先卸载一次。没下载过的可以忽略。pipuninstallvirtualenvStep1：安装pippipinstall--uservirtualenvStep2：将~/.local/bin添加到PATH：exportPATH="$HOME/.local/bin:$PATH"Step3：创建虚拟环境virtualenvvenvS
方舟字节码原理剖析：架构、特性与实践应用轻口味 HarmonyOS Next harmonyos 深度学习 pytorch harmonyosnext arkts
方舟字节码原理剖析：架构、特性与实践应用一、引言在当今软件行业高速发展的大背景下，应用程序的性能、开发效率以及跨平台兼容性成为了开发者们关注的核心要素。编译器作为软件开发流程中的关键工具，其性能和特性直接影响着软件的质量和开发周期。华为推出的方舟编译器正是为了满足这些需求而诞生的创新成果。方舟字节码（ArkBytecode）作为方舟编译器的核心产物，在整个编译和运行过程中扮演着至关重要的角色。它不
kubernetes集群监控 Kube-Prometheus-Stack xiaojinran k8s prometheus docker 运维 kubernetes prometheus 容器 grafana
kubernetes集群监控概述Kubernetes（K8s）集群监控是指对Kubernetes集群中的各个组件和资源进行实时监测和数据收集，以获取对集群健康状态、性能指标和事件的可视化和告警。Kubernetes集群监控的内容通常包括以下几个方面：基础设施监控：监控物理服务器、虚拟机或云实例的资源使用情况，包括CPU、内存、磁盘和网络等指标。这可以帮助确保集群的底层基础设施正常运行，并及时发现资
数据传输中的守护者：深度解析CRC的错误检测能力不会写算法的小沈网络
文章目录CRC检测能力命名规范单比特错误检测双比特错误检测双比特检测失效突发错误多比特错误检测突发错误长度大于生成多项式的长度突发错误长度小于等于生成多项式的长度能否完全避免比特检测错误人为干扰的检测能力本篇内容为上课受老师启发，在课后加以思考的产物。如果错误，欢迎指出！本内容不讨论任何关于CRC如何计算以及验证的问题，仅仅讨论CRC是如何实现检测错误的。对于仅仅需要备考的朋友们就可以选择忽视该文
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
玻璃可以折射阳光，教育应该照亮未来资深设备全生命周期管理人工智能
From深度求索玻璃可以折射阳光，教育应该照亮未来——百亿民企办学的破局之路正值高考志愿填报季，680万考生家庭陷入集体焦虑：当985毕业生涌入外卖行业，民办二本深陷"招生寒冬"，AI大厂高薪哄抢的"提示词工程师"却无一所高校开设对应专业。在这个教育理想与现实剧烈碰撞的夏天，曹德旺掷出百亿筹建的福耀科技大学，正试图用一块"教育玻璃"折射出破局之光。一、教育内卷困局中的一束光：当流水线教育撞上AI革
如何在github上参与开源项目这个懒人 github 开源软件
1.创建GitHub账号如果你还没有GitHub账号，首先需要注册一个：访问GitHub官网。点击右上角的“Signup”按钮，填写注册信息并完成注册。2.找到感兴趣的项目GitHub上有成千上万的开源项目，你可以通过以下方式找到感兴趣的项目：搜索项目：在GitHub首页的搜索框中输入关键词，例如“机器学习”、“Web开发”等。使用高级搜索功能，通过语言、标签等过滤条件找到合适的项目。浏览Tren
OpenHarmony 应用中的 Axios 封装实践与分层设计（包含请求相应拦截器） qq_55376032 harmonyos 华为
1、下载Axios三包下面是三方仓库地址OpenHarmony三方库中心仓https://ohpm.openharmony.cn/#/cn/home2、如何正确导入Axios包2-1、进入三方库2-2、复制命令行2-3、进入DevEcoStudio下载Axios(进入后我们可以快捷键Ctrl+~打开终端拖动整个目录到终端运行2-2复制的命令行)3、封装Axios方法3-1、封装方法一（全部），后续
使用Python实现无人机路径规划的灰狼优化算法闲人编程 python python 无人机算法灰狼优化路径规划
目录使用Python实现无人机路径规划的灰狼优化算法引言1.灰狼优化算法概述1.1定义1.2算法原理1.3灰狼的狩猎策略1.4算法步骤2.Python中的灰狼优化算法实现2.1安装必要的库2.2定义类2.2.1灰狼类2.2.2群体类2.2.3路径规划类2.3示例程序3.灰狼优化算法的优缺点3.1优点3.2缺点4.改进方向5.应用场景结论使用Python实现无人机路径规划的灰狼优化算法引言无人机的路
TCP/IP协议知识梳理风间琉璃zero 知识梳理 #网络相关网络协议 tcp/ip
TCP/IP协议知识梳理一、计算机网络体系结构分层二、TCP/IP基础1.TCP/IP的具体含义2.数据包3.数据处理流程①应用程序处理②TCP模块的处理③IP模块的处理④网络接口（以太网驱动）的处理⑤网络接口（以太网驱动）的处理⑥IP模块的处理⑦TCP模块的处理⑧应用程序的处理三、传输层中的TCP和UDP1.端口号1.1根据端口号识别应用1.2通过IP地址、端口号、协议号进行通信识别1.3端口号
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

机器学中的参数估计

机器学习中的参数估计方法

参数估计的方法，MLE,MAP,Bayesian estimator

机器学习中三类参数估计的方法

贝叶斯参数估计的理解

机器学习 - GMM参数估计的EM算法

EM算法---基于隐变量的参数估计

机器学习中常用的矩阵求导公式

机器学习中的损失函数

机器学习中的参数与超参数之间的区别

核密度估计与自适应带宽的核密度估计

机器学习之深度学习(Deep Learning)

贝叶斯 - 《贝叶斯统计》笔记

常见的预测算法

参数估计：文本分析的参数估计方法

三种参数估计方法（MLE，MAP，贝叶斯估计）

参数估计-最大似然估计和贝叶斯参数估计

2.数理统计与参数估计

系统学习机器学习之参数方法（一）

机器学习之极大似然估计

系统学习机器学习之参数方法（三）

七月算法机器学习笔记1--机器学习中的数学之数理统计和参数估计

yt71656

他的最新文章

相关推荐

他的热门文章

你可能感兴趣的:(机器学中的参数估计)

机器学中的参数估计

机器学习中的参数估计方法

相关文章推荐

参数估计的方法，MLE,MAP,Bayesian estimator

机器学习中三类参数估计的方法

贝叶斯参数估计的理解

机器学习 - GMM参数估计的EM算法

EM算法---基于隐变量的参数估计

机器学习中常用的矩阵求导公式

机器学习中的损失函数

机器学习中的参数与超参数之间的区别

核密度估计与自适应带宽的核密度估计

机器学习之深度学习(Deep Learning)

贝叶斯 - 《贝叶斯统计》笔记

常见的预测算法

参数估计：文本分析的参数估计方法

三种参数估计方法（MLE，MAP，贝叶斯估计）

参数估计-最大似然估计和贝叶斯参数估计

2.数理统计与参数估计

系统学习机器学习之参数方法（一）

机器学习之极大似然估计

系统学习机器学习之参数方法（三）

七月算法机器学习笔记1--机器学习中的数学之数理统计和参数估计

yt71656

他的最新文章

相关推荐

他的热门文章

你可能感兴趣的:(机器学中的参数估计)