云端FFF

一文看懂 “极大似然估计” 与 “最大后验估计” —— 最大后验估计篇

本文历次修订后全长 2万8000余字，受到 CSDN 博文字数限制，故切分两篇发布，所以现在是两文看懂了… 前篇介绍参数估计背景和极大似然估计；本篇介绍最大后验估计和两种方法对比
请务必先看前文：一文看懂 “极大似然估计” 与 “最大后验估计” —— 极大似然估计篇

文章目录

4. 最大后验估计（MAP）
- 4.1 后验概率密度
- 4.2 样本条件概率密度 $p(X|\mathcal{D})$ （模型分布）
- - 4.2.1 贝叶斯分类器
  - 4.2.2 联系参数后验概率密度 $p(\theta|\mathcal{D})$
  - 4.2.3 小结
- 4.3 最大后验估计的步骤
- 4.4 示例
- - 4.4.1 已知先验概率和条件概率
  - 4.4.2 朴素贝叶斯
5. MLE和MAP的联系

4. 最大后验估计（MAP）

考虑这个问题：贾跃亭老板下周回国的概率为多少？如果从频率派的角度看，因为贾老板跑路后从未回国，只要他不回来，概率就始终为0；但事实上贾老板下周回国的概率可能只是很小而非零，若哪天他的造车计划大获成功或者乐视网情况转好，其回国的可能性还会大大提升，这就比较符合贝叶斯学派的观点。 频率派的一个问题，就是在小的的观测数据集下，最大化似然函数值的方法容易与观测数据过度拟合
记贾老板下周回国为事件 $\Theta$ ，现在我们认为这是一个小概率事件，概率为小量 $p(\Theta)$ ，可以看作一种先验知识。随着时间的推移，发生了事件 $X$ ，比如法拉第新车开始量产，或者法拉第资金链断裂，这时贾老板回国的可能性就会变化，对 $\Theta$ 的估计也应当有相应调整，变成后验概率 $p(\Theta|X)$
最大后验估计寻求使后验概率最大的参数值，相比最大似然估计，这种方法融入了要估计量的先验分布。先验概率包含了人们根据以往经验对事件的一些初步认识，当某些事件 $X$ 发生后，会影响人们原来的认识，贝叶斯公式可以对事件先验概率进行修正，得到事件的后验概率
最大后验估计的示意图如下

4.1 后验概率密度

利用贝叶斯公式，可以得到先验概率 $p(\theta)$ 和后验概率 $p(\theta|x)$ 之间的关系如下
$p(\theta|x) = \frac{p(\theta,x)}{p(x)} = \frac{p(\theta)p(x|\theta)}{p(x)}$ 这个公式提供了利用先验概率 $p(\theta)$ 和条件概率函数值 $p(x|\theta)$ 来计算后验概率 $p(\theta|x)$ 的方法
在后验概率公式中，分母 $\int_\theta p(x|\theta)p(\theta)d\theta$ ，由于对 $\theta$ 所在的参数空间整体进行了积分，因此不影响，有
$p(\theta|x) \propto p(\theta)p(x|\theta)$ 可见，当事件 $x$ 发生时，最大后验估计通过条件概率函数值 $p(x|\theta)$ 对先验 $p(\theta)$ 进行修正。经过整个数据集 $\mathcal{D}$ 的修正后，后验概率密度
$p(\theta|\mathcal{D}) \propto p(\theta)p(\mathcal{D}|\theta)$ 将在合理的估计值 $\hat{\theta}$ 位置形成尖峰
我们的目标是找出最大后验估计值 $\hat{\theta}$ ，即
$\begin{aligned} \hat{\theta} &= \argmax\limits_{\theta} p(\theta|\mathcal{D}) \\ &=\argmax\limits_{\theta}\prod\limits_{x_i\in\mathcal{D}}p(\theta)p(x_i|\theta) \\ &=\argmax\limits_{\theta}[logp(\theta)+\sum_{x_i\in\mathcal{D}}log p(x_i|\theta) ]\\ &=\argmin\limits_{\theta}[-logp(\theta) - \sum_{x_i\in\mathcal{D}}log p(x_i|\theta)] \end{aligned}$

4.2 样本条件概率密度 $p(X|\mathcal{D})$ （模型分布）

1.1 节中我们分析过，参数估计的目的是为了得到模型分布，即数据集条件下的样本分布 $p(X|\mathcal{D})$ ，这时我们必须明确 MAP 和 MLE 的区别
1. MLE 中，参数 $\Theta$ 是一个定值，模型分布仅由其取值 $\theta$ 决定，而 $\theta$ 仅由数据集 $\mathcal{D}$ 决定，也就是只有一个样本条件概率密度 $p(X|\mathcal{D})=p(X|\Theta)$ （似然函数）
2. MAP 中，参数 $\Theta$ 是一个分布 $p(\Theta|\mathcal{D})$ ， $\hat{\Theta}$ 的每一个取值 $\hat{\theta}$ 都唯一地决定了一个模型分布，为了整体考虑需要对 $\theta$ 做积分，即 $p(X|\mathcal{D}) = \int p(X,\theta|\mathcal{D})d\theta$ ，因此 MAP 方法最终往往要做一个复杂的积分
下面通过一个贝叶斯决策的例子说明 $p(X|\mathcal{D})$ 的作用

4.2.1 贝叶斯分类器

考虑构造一个贝叶斯分类器，使用贝叶斯公式计算 类后验概率 如下
$\begin{aligned} p(w_i|x,\mathcal{D}) &= \frac{p(x|w_i,\mathcal{D})p(w_i|\mathcal{D})}{p(x)} \\ &= \frac{p(x|w_i,\mathcal{D})p(w_i|\mathcal{D})}{\sum_j p(x|w_j,\mathcal{D})p(w_j|\mathcal{D})} \end{aligned}$ 贝叶斯分类器使用这个类后验概率密度函数预测任意样本 $x$ 的类别，下面化简符号
1. 通常我们认为类先验概率可以事前得到，所以把 $p(w_i|\mathcal{D})$ 简写为 $p(w_i)$
2. 像 1.1 节中一样将数据集 $\mathcal{D}$ 按样本类别划分为，并假设第 $i$ 类的样本对第 $j\neq i$ 类的类条件概率 $p(w_j|x,\mathcal{D})$ 没有任何影响，这样 $p(x|w_i,\mathcal{D})$ 就可以简化为 $p(x|w_i,\mathcal{D}_i)$
符号化简后，上式变为
$p(w_i|x,\mathcal{D}) = \frac{p(x|w_i,\mathcal{D}_i)p(w_i)}{\sum_j p(x|w_j,\mathcal{D}_j)p(w_j)}$ 假设一共有 $c$ 个类别，这里计算类后验概率密度的核心是估计 $c$ 个类条件概率密度 $p(x|w_i,\mathcal{D})$ ，根据我们的假设，这里相当于处理 $c$ 个独立的问题，每个问题都在单一的类别下发生，形式为

已知一组从 $p (X)$ 中 i.i.d 采样的样本 $\mathcal{D}$ ，估计条件概率 $p(X|\mathcal{D})$

4.2.2 联系参数后验概率密度 $p(\theta|\mathcal{D})$

考虑上一节最后提出的任意一个独立问题，基本目标是计算 $p(X|\mathcal{D})$ ，并且使得它尽量靠近 $p (X)$ ，这里可以把它表示为 $p(X,\theta|\mathcal{D})$ 的边缘概率密度，即
$\begin{aligned} p(X|\mathcal{D}) &= \int p(X,\theta|\mathcal{D})d\theta\\ &= \int p(X|\theta,\mathcal{D})p(\theta|\mathcal{D})d\theta \\ &= \int p(X|\theta)p(\theta|\mathcal{D})d\theta \space\space\space(测试样本X的选取和 \mathcal{D} 独立)\\ \end{aligned}$ 注意其中出现了 MAP 过程中得到的后验概率分布 $p(\theta|\mathcal{D})$ 。这是贝叶斯估计中最核心的公式，它将类条件概率密度 $p(X|\mathcal{D})$ （注意这是 $p(X|w_i,\mathcal{D})$ 的简写）和未知参数的后验概率密度 $p(\theta|\mathcal{D})$ 联系起来。如果 MAP 的估计结果为 $\hat{\theta}$ （即 $p(\theta|\mathcal{D})$ 在 $\hat{\theta}$ 处形成最显著的尖峰），且
1. $p(X|\theta)$ 光滑
2. $p(\theta|\mathcal{D})$ 积分拖尾的影响足够小（就是说 $p(\theta|\mathcal{D})$ 在 $\hat{\theta}$ 处足够尖锐）
则可以如下估计类条件概率密度为 $p(x|w_i,\mathcal{D})\approx p(x|w_i,\hat{\theta})$ 当以上两条件不满足时，即我们对 $\hat{\theta}$ 的把握不是很强时，上面的式子指导我们应该对所有的 $\theta$ 求积分来得到满意的 $p(X|\mathcal{D})$ （注意其实是类条件概率密度 $p(x|w_i,\mathcal{D}_i)$ 的简写）

4.2.3 小结

欲基于贝叶斯估计方法构造贝叶斯分类器，一些基本假设如下
1. 条件概率密度 $p(x|\Theta)$ 的数学形式完全已知，只是 $\Theta$ 取值 $\theta$ 未知
2. 参数向量 $\Theta$ 的先验概率 $p(\Theta)$ 包含了我们对 $\theta$ 的全部先验知识
3. 其余的关于参数向量 $\Theta$ 的信息包含在 i.i.d 采样的数据集 $\mathcal{D}$ 中，他们都服从未知的概率密度函数 $p (X)$
问题的核心在于计算后验概率密度函数 $p(\theta|\mathcal{D})$ ，一旦得到就能如下计算（类）后验概率
$p(X|\mathcal{D}) = \int p(X|\theta)p(\theta|\mathcal{D})d\theta \tag{1}$ 根据贝叶斯公式，有
$p(\theta|\mathcal{D}) = \frac{p(\mathcal{D}|\theta)p(\theta)}{\int p(\mathcal{D}|\theta)p(\theta)d\theta} \tag{2}$ 再利用样本间独立性假设，有
$p(\mathcal{D}|\theta) = \prod_{k=1}^n p(x_k|\theta) \tag{3}$ 这样就完成了对问题的正式解答。构造的贝叶斯分类器示意图如下
这里可以考虑和最大似然估计的关系
1. 假设 $p(\mathcal{D}|\theta)$ 在 $\hat{\theta}$ 处有一个很尖的峰值
2. 若先验概率 $p(\hat{\theta})$ 非零且在附近邻域变化不大，则根据等式 (2) ， $p(\hat{\theta}|\mathcal{D})$ 处也是一个峰值
3. 则根据等式（1）， $p(x|\mathcal{D})$ 将趋近于 $p(x|\hat{\theta})$ ，后者就是最大似然法优化的最大似然函数

4.3 最大后验估计的步骤

找出参数的最大后验估计
1. 和最大似然估计步骤类似，先找出后验概率密度 $p(\theta|\mathcal{D})$ （或其正相关形式）的表示，然后通过令偏导数为 0 找出使后验概率最大的估计值 $\hat{\theta}$
2. 有时我们也可以直接从数据集 $\mathcal{D}$ 中估计出先验概率 $p(\theta)$ 和条件概率函数 $p(\mathcal{D}|\theta)$ ，进而直接计算 $\hat{\theta}$ 各种取值下的后验概率（比如朴素贝叶斯），然后直接取最大即可
如有需要，可以进一步计算类条件概率密度构造贝叶斯分类器

4.4 示例

4.4.1 已知先验概率和条件概率

假设有5个袋子，每个袋子中都有无限饼干（樱桃或柠檬味），已知5个袋子中两种口味混合比例和被拿到的概率如下
1. 10%概率拿到；樱桃100%
2. 20%概率拿到；樱桃75% + 柠檬25%
3. 40%概率拿到；樱桃50% + 柠檬50%
4. 20%概率拿到；樱桃25% + 柠檬75%
5. 10%概率拿到；柠檬100%
现在从同一个袋子中连续拿到了两个柠檬饼干，那么这个袋子最可能是哪个袋子？

分析：设 $\theta_i$ 表示拿到第 $i$ 个袋子，各个袋子被拿到的概率就是先验 $p(\theta_i)$ ，我们需要根据事件 $X$ ：“连续从一个袋子中拿到两个饼干” 这件事在每个袋子中发生的似然性来调整它们。
设从第 $i$ 个袋子中拿出柠檬饼干的概率为 $p_i$ ，拿到第 $i$ 个袋子的概率为 $q_i$ ，根据后验概率公式，优化目标是：
$\begin{aligned} \argmax\limits_{\theta}p(\theta|x) &= \argmax\limits_{\theta}p(\theta_i)p(X|\theta_i) \\ &= \argmax\limits_{\theta}q_i*p_i^2 \end{aligned}$ 分别把五个袋子的数据带入，发现第4个袋子的后验概率最大，因此选择第4个袋子

4.4.2 朴素贝叶斯

朴素贝叶斯是一种基于最大后验估计的分类算法。设输入空间 $\mathcal{X}\in \mathbb{R}^n$ 为 $n$ 维向量集合，输出空间 $\mathcal{Y} = \{c_1,c_2,...,c_k\}$ 。 $X, Y$ 分别是定义在 $\mathcal{X,Y}$ 上的随机向量/变量，从真实分布 $P (X, Y)$ 独立同分布地采样得到训练数据集 $\{(\pmb{x}_1,y_1),(\pmb{x}_2,y_2),...,(\pmb{x}_N,y_N\}$
这是一种生成式方法，利用数据分布估计先验概率 $p(Y=c_k)$ 和条件概率函数 $p(X=x|Y=c_k)$ ，进而得到联合概率分布 $P (X, Y)$ 用于预测

条件独立性假设：考察条件概率分布 $P(X=x|Y=c_k) = P(X^{(1)}=x^{(1)},X^{(2)}=x^{(2)},...,X^{(n)}=x^{(n)}|Y=c_k), \space\space k=1,2,...K$ 假设 $x^{(j)}$ 可取值有 $S_j$ 个， $j = 1, 2, . . ., n$ ， $Y$ 可取值有 $K$ 个，那么参数个数最多为 $\prod_{j=1}^n S_j$ ，参数数量为指数级，因此直接估计 $P (X, Y)$ 是不可行的。为此朴素贝叶斯作了条件独立性假设，即
$\begin{aligned} P(X=x|Y=c_k) &= P(X^{(1)}=x^{(1)},....,X^{(n)}=x^{(n)}|Y=c_k) \\ &= \prod_{j=1}^n P(X^{(j)}=x^{(j)}|Y=c_k) \end{aligned}$ ** **
得到联合分布 $P (X, Y)$ 后，就可以利用贝叶斯公式得到后验概率，再用 MAP 方式估计未见样本类别，即
$\begin{aligned} y = f(\pmb{x}) &= \argmax_{c_k}\frac{P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)}=x^{(j)})|Y=c_k)} \\ &= \argmax_{c_k}P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k) \end{aligned} \space \space\space \space k=1,2,...,K$ 其中先验概率 $P(Y=c_k)$ 和样本每一维（特征）的条件概率 $P(X^{(j)}=a_{jl})$ 都使用极大似然估计方式估计得到，即
$P(Y=c_k) = \frac{\sum_{i=1}^N I(y_i=c_k)}{N} \space\space\space k=1,2,...,K$ 设第 $j$ 个特征 $x^{(j)}$ 可能取值的集合为 ${a_{j1},a_{j2},...,a_{jS_j}\}$ ，条件概率估计为
$P(X^{(j)}=a_{jl}|Y=c_k) = \frac{\sum_{i=1}^N I(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^N I(y_i=c_k)} \\ \space \\ j = 1,2,...,n; \space\space\space l = 1,2,....,S_j;\space\space\space k=1,2,...,K$ 式中 $x_i^{(j)}$ 是第 $i$ 个样本的第 $j$ 个特征； $a_{jl}$ 是第 $j$ 个特征可能取的第 $l$ 个值
示例

5. MLE和MAP的联系

看贝叶斯公式
$p(\Theta|X) = \frac{p(X|\Theta)p(\Theta)}{p(X)}$ 随着数据量的增加，条件概率函数值 $p(X|\Theta)$ 对先验 $p(\Theta)$ 的修正越来越大，参数分布会越来越向数据靠拢，先验的影响力会越来越小。因此在数据量趋向无限时，MAP 得到的参数后验概率一般会收敛到狄拉克函数，这时 MLE 和 MAP 最终会得到相同的估计
如果先验是均匀分布，则贝叶斯方法MAP等价于频率方法MLE，因为先验是均匀分布本质上表示对事物没有任何预判
看最大后验估计的优化目标
$\hat{\theta} = \argmin\limits_{\theta}[-logp(\theta) - \sum_{i=1}^nlog p(x_i|\theta)]$ 可见这里第二项 $\argmin\limits_{\theta}\sum_{i=1}^nlog p(x_i|\theta)$ 正是最大似然估计的优化目标 NLL，所以MLE和MAP在优化时的不同就是在于先验项 $-logp(\theta)$ 。如果我们假设先验是一个高斯分布，即
$p(\theta) = constant \times exp(-\frac{\theta^2}{2\sigma^2})$ 于是有
$-logp(\theta) = constant + \frac{\theta^2}{2\sigma^2}$ 可见，在MAP中使用一个高斯分布的先验等价于在MLE中使用一个L2正则项

青年开发者董翔：在代码世界中探索创新边界程序猿全栈の董（董翔） javascript 开发语言开发者
引言：从兴趣萌芽到技术深耕当大多数00后还在适应大学生活时，2004年出生的董翔已在软件技术领域展现出超越同龄人的探索热情。作为软件技术专业大一学生，他以“技术创新解决实际问题”为核心理念，在前端开发、数据修复等领域构建了独特的研究体系。从高中时期自学编程的懵懂少年，到提出“同源数据互补修复机制”“框架质疑学习法”的青年研究者，董翔的成长轨迹折射出新一代技术人对知识的主动建构与实践突破。一、学术探
【学习】搭建个人Hexo博客网站程序员
一、准备环境1、安装node访问Node.js官网：https://nodejs.org/下载LTS(长期支持版本)安装时保持默认选项即可安装完成后，打开命令提示符验证安装：node-v2、安装npmnpm已包含在Node.js安装包中，安装Node.js时会自动安装打开命令提示符验证安装：npm-v更新npm到最新版本（可选）：npminstall-gnpm3、安装hexo打开命令提示符，以管理
Redis Geo结构详解：从原理到实战，手把手教你玩转地理位置功能码不停蹄的玄黓 redis 数据库缓存
在互联网产品中，“附近的人”“附近的店”“配送范围”这类功能越来越常见。以前做这种功能可能需要依赖MySQL的经纬度计算，或者上专业的GIS数据库（比如PostGIS），但Redis3.2版本后推出的Geo（地理信息）模块，用极简的API和高效的性能，完美解决了这类问题。今天咱们就来深入聊聊RedisGeo的底层原理、常用命令和实战场景。一、为什么需要RedisGeo？先想个场景：你要做一个“附近
图片转字符串存储在SQLite中你就是乌鸦嘴 qt6.3 笔记 qt
将图片转化为字符串放入Sqlite数据库，以BLOB类型存储。一、主要函数1、图片转字符串使用内存读写器，指定格式存入字节数组，字节数组转Base64以Latin1编码输出到文本框。voidMainWindow::on_actPtB_triggered(){ui->plainTextEdit->clear();if(ui->labPhoto->pixmap().isNull()){labtext-
xilinx工具编译ADI官方no-os和HDL工程步骤 ni1978 驱动 fpga c语言驱动开发
以AD738x这款ADC为例，xilinx软件版本为2022.2：HDL工程：下载HDL工程：GitHub-analogdevicesinc/hdlathdl_2022_r2（GitHub-analogdevicesinc/hdlathdl_2022_r2）解压后，打开vivado2022.2，此时不要建工程，在tclconsole里输入cdc:/hdl-hdl_2022_r2/projects/
“Payload document size is larger than maximum of 16793600.“问题解决（MongoDB）阿宇来了 mongodb 数据库
遇到的错误：Payloaddocumentsizeislargerthanmaximumof16793600.表示尝试插入或更新的MongoDB文档大小超过了最大限制（16MB）。错误原因MongoDB对单个文档（document）的大小有硬性限制：最大为16MB。这是为了保证性能和内存使用效率。你当前操作的数据大小已超过这个限制（如提示中的16,793,600bytes≈16MB），因此Mong
WebService SendTimeout 超时问题 SKY徐 webservice binding behavior security wcf .net
System.TimeoutException:请求通道在等待00:01:00以后答复时超时。增加传递给请求调用的超时值，或者增加绑定上的SendTimeout值。分配给此操作的时间可能是更长超时的一部分。WCF中解决方案:1)首先保证客户端每次建立的连接在使用完成后进行关闭.即调用Close()方法,否则此连接会在设置的会话(一般为10分钟)后才自动关闭.期间任何客户端也无法使用此服务.2)如果
管理大数据存储的十大技巧 weixin_34238633 大数据数据库运维
在1990年，每一台应用服务器都倾向拥有直连式系统(DAS)。SAN的构建则是为了更大的规模和更高的效率提供共享的池存储。Hadoop已经逆转了这一趋势回归DAS。每一个Hadoop集群都拥有自身的——虽然是横向扩展型——直连式存储，这有助于Hadoop管理数据本地化，但也放弃了共享存储的规模和效率。如果你拥有多个实例或Hadoop发行版，那么你就将得到多个横向扩展的存储集群。而我们所遇到的最大挑
WebService SendTimeout 超时 weixin_30827565
System.TimeoutException:请求通道在等待00:01:00以后答复时超时。增加传递给请求调用的超时值，或者增加绑定上的SendTimeout值。分配给此操作的时间可能是更长超时的一部分。WCF中解决方案:1)首先保证客户端每次建立的连接在使用完成后进行关闭.即调用Close()方法,否则此连接会在设置的会话(一般为10分钟)后才自动关闭.期间任何客户端也无法使用此服务.2)如果
深度模型训练，加速数据读取遇到显卡跑不满的问题不是吧这都有重名遇到的问题 llama 人工智能 LLM python
实测在pytorch的dataloader中使用prefetch_factor参数的时候，如果数据在机械硬盘上显卡始终是跑不满的，瓶颈在数据预加载速度上，当数据放在固态硬盘的时候就可以跑满。问题排查过程：一直在跑模型，但是数据量比较大，之前有段时间还是比较头疼显卡跑不满的。后来直接用钞能力，加了内存条，将数据缓存后一次性读到内存中终于可以跑满了，然后后面就一直没管这个了，唯一的缺点就是每次开始训练
设计模式系列（10）：结构型模式 - 桥接模式(Bridge)
系列导读：在学习了接口适配后，我们来看如何处理抽象与实现的分离问题。桥接模式解决的是"多维度变化"的设计难题。解决什么问题：将抽象部分与实现部分分离，使它们都可以独立变化。避免在多个维度上变化时出现类爆炸问题。想象一下，你要设计一个图形绘制系统，既要支持不同的形状（圆形、矩形），又要支持不同的绘制方式（Windows绘制、Linux绘制）。如果用继承，你需要WindowsCircle、LinuxC
SQLite和MySQL数据库的区别与应用坚持学习的小菜鸟数据库
简单来说，SQLITE功能简约，小型化，追求最大磁盘效率；MYSQL功能全面，综合化，追求最大并发效率。如果只是单机上用的，数据量不是很大，需要方便移植或者需要频繁读/写磁盘文件的话，就用SQLite比较合适；如果是要满足多用户同时访问，或者是网站访问量比较大是使用MYSQL比较合适。下面详细介绍两者的区别和应用：SQLiteSQLite是非凡的数据库，他可以进程在使用它的应用中。作为一个自包含、
MyBatis Mapper.xml核心属性详解代码的余温 mybatis xml
在MyBatis的Mapper.xml文件中，statement标签（如、等）包含多个关键属性，用于定义SQL语句的行为和映射规则。以下是核心属性及其含义：一、基础属性id作用：当前命名空间下SQL语句的唯一标识，必须与对应Mapper接口的方法名一致。示例：对应接口方法UsergetUserById(intid)。parameterType作用：指定输入参数的类型（如java.lang.Inte
【前端进阶】【实战】【性能优化】前端开发中的事件监听与DOM操作优化实践患得患失949 数字孪生前端性能优化前端
前端开发中的事件监听与DOM操作优化实践在前端开发中，事件监听器的管理和DOM操作的优化是提升应用性能和稳定性的关键。本文将结合具体案例，探讨如何通过技术手段解决这些问题，并分享一些实用的优化技巧。问题背景在一个基于高德地图的应用中，我们实现了一个信息窗口组件（InfoWindow），其中包含视频播放功能和轮播图展示。随着用户交互的增加，我们遇到了以下问题：信息窗口频繁打开关闭后，页面性能明显下降
response.split(“\n“)[0].strip() 是什么 ZhangJiQun&MXP 教学 2021 AI python python 机器学习人工智能语言模型自然语言处理
response.split(“\n”)[0].strip()是什么returnresponse.split("\n")[0].strip()这行代码在Python中通常用于对字符串进行处理并返回处理后的结果response.split("\n")：split()是Python字符串对象的一个方法，用于根据指定的分隔符将字符串拆分成一个列表。在这行代码中，"\n"作为分隔符，表示按照换行符来拆分字
MapReduce数据处理过程2万字保姆级教程大模型大数据攻城狮 mapreduce 大数据 yarn cdh hadoop 大数据面试 shuffle
目录1.MapReduce的核心思想：分而治之的艺术2.HadoopMapReduce的架构：从宏观到微观3.WordCount实例：从代码到执行的完整旅程4.源码剖析：Job.submit的魔法5.Map任务的执行：从分片到键值对6.Shuffle阶段：MapReduce的幕后英雄7.Reduce任务的执行：从数据聚合到最终输出8.Combiner的魔法：提前聚合的性能利器9.Partition
LeetCode1004. 最大连续1的个数 III Zedthm 算法 java leetcode
题目分析本题要求在最多翻转K个0的条件下，找到二进制数组中最长的连续1子数组。翻转操作实际上是将0视为可用资源，用来扩展连续1的区间。解题思路滑动窗口（双指针）：核心思想：维护一个窗口，确保窗口内最多包含K个0（即最多可翻转K次）右指针：遍历数组，扩展窗口左指针：当窗口内0的数量超过K时，收缩窗口直到满足条件关键操作：遇到0时增加计数器当0的数量超过K时，移动左指针直到移除一个0始终记录窗口的最大
.eslintrc.js文件内容/配置eslint/eslint参数是泡沫呀前端工程化 javascript 前端 vue.js webpack npm
首先放一个官网的链接Listofavailablerules-ESLint中文文档然后直接上代码这里以vue项目为例，主要两个文件，1是.eslintrc.js文件（配置），2是.eslintignore（忽略不需要匹配的文件）重点：修改配置文件后，要重启项目才能生效一、这个是.eslintrc.js//ESlint检查配置module.exports={root:true,parserOptio
将conda虚拟环境迁移到新的服务器上 icewithzero conda 服务器运维
文章目录前言1.1修改pip文件1.2修改pip文件前言由于服务器系统崩了，需要新建环境，就把之前备份的conda虚拟环境传到了服务器上，这里迁移的只是envs文件夹。1.1修改pip文件迁移完成后，首先要修改虚拟环境下的pip文件和pip3文件sudochmod777/opt/conda/envs/SOD_wh/bin/pipvim/opt/conda/envs/name/bin/pipsu
QML与C++交互之创建自定义对象
在qml中，我们一般都是希望使用qml做界面展示，而数据处理转由c++处理；在此篇博客，将介绍如何在c++中给qml定义全局对象；在c++中如何定义对象给qml使用。1给qml定义全局对象正常我们定义了一个qml项目后，main函数是这样的：#include#include#includeintmain(intargc,char*argv[]){QCoreApplication::setAttri
5V转4.2V 300mA可调输出LDO芯片AH5233详解 h13728697869 嵌入式硬件
1.芯片概述AH5233是一款超低压差（LDO）稳压芯片，具有宽输入电压范围（1.5V-5.5V）和可调输出电压（0.8V-5.0V），适用于便携式设备、IoT模块等低功耗场景。关键特性：✅输出电压可调：0.8V~5.0V（适用于锂电池供电4.2V）✅最大输出电流：400mA（300mA稳定工作）✅极低压差：100mV@100mA（提高电源效率）✅高精度：±1%（稳定可靠）✅超低静态电流：10μA
解决部分机型浏览器使用pdf.js 出现 undefined is not an object(evaluating ‘response.body.getReader‘) 报错问题 HHH 917 pdf javascript pdf 前端
问题undefinedisnotanobject(evaluating‘response.body.getReader’)参考小王子的笔记本的技术博客仔细分析源码后发现，PDFjs的getDocument方法不仅可以接收URL作为参数，还可以接收多种类型：而fetch方法返回的Response对象恰恰拥有arrayBuffer方法，可以将数据转为ArrayBuffer对象解决PDF.getDocu
SpringCloud Gateway 全局异常处理小脑斧学技术 SpringCloud java gateway 微服务
在全局过滤器中可以处理网络异常请求，但是当设置Gateway请求超时时间，超时后的异常全局过滤器中处理不了。定义CustomWebExceptionHandler类importcom.alibaba.csp.sentinel.slots.block.BlockException;importcom.tigerkin.util.ApiResult;importorg.slf4j.Logger;imp
Pushgateway扩展Prometheus监控 ivwdcwso 运维与云原生 prometheus k8s 云原生
Pushgateway是Prometheus生态系统中的一个重要组件,它允许我们将短期作业或批处理任务的指标推送到Prometheus中。本文将详细介绍如何安装、配置和使用Pushgateway来扩展Prometheus监控。1.Pushgateway简介Pushgateway主要用于解决以下场景:短期作业无法被Prometheus直接抓取批处理任务需要推送指标防火墙后的应用需要主动推送指标它作为
【力扣（LeetCode）】数据挖掘面试题0013：1264. 页面推荐（泛化后，基于MySQL题解）言析数智数据挖掘常见面试题 leetcode 数据挖掘 mysql 笔试笔试题
文章大纲一、题目要求：二、模拟数据构建三、题解参考方案朋友关系列表：Friendship+---------------+---------+|ColumnName|Type|+---------------+---------+|user1_id|int||user2_id|int|+---------------+---------+(user1_id,user2_id)是这张表具有唯一值的列
[netty5: FastThreadLocal]-源码解析
在解析FastThreadLocal之前，我们先了解一下ThreadLocal，它和Thread究竟什么关系。翻看Thread源码,我们可以知道，Thread类里维护了两个ThreadLocal.ThreadLocalMap，这两个字段由ThreadLocal类管理，用来实现线程局部变量的存储和传递。ThreadpublicclassThreadimplementsRunnable{//线程局部变
Subversion简单常用问题解决方案列表 lddongyu maven/ant/svn subversion tortoisesvn svn 服务器 apache eclipse
----------------------------------------eclipse使用subclipse导致jvm崩溃将环境变量APR_ICONV_PATH改为APR_ICONV1_PATH或者下载Subversion1.4.3的zip包，将环境变量APR_ICONV_PATH指向解压后的iconv文件夹。http://doc.iusesvn.com/show-35-1.html---
jdk17+springboot3项目加密部署
最近项目需要在第三方服务器部署，由于没有交付源码。所以需要将项目加密后再部署。网上找了一圈，发现xjar这个开源项目，可以将代码加密后进行部署。看了下正是我需要的。于是按照文档打包加密，但启动的时候居然报错。这个结果结果有点难受！xjar不支持springboot3.！翻了翻issue,看到有个老哥新拉的分支支持springboot3。于是clone新分支代码。继续打包，加密，启动。这下就成功启动
SVN 安装使用教程小奇JAVA面试安装使用教程 svn
一、SVN简介SVN（Subversion）是一个流行的集中式版本控制系统，用于跟踪文件的更改历史，常用于软件开发项目的代码管理。虽然Git更加流行，但SVN仍在很多传统企业和大型项目中被广泛使用。二、SVN安装2.1Windows安装（使用TortoiseSVN）下载地址：https://tortoisesvn.net/downloads.html安装后系统右键菜单会添加SVN功能；推荐安装中文
Hadoop核心组件最全介绍 Cachel wood 大数据开发 hadoop 大数据分布式 spark 数据库计算机网络
文章目录一、Hadoop核心组件1.HDFS(HadoopDistributedFileSystem)2.YARN(YetAnotherResourceNegotiator)3.MapReduce二、数据存储与管理1.HBase2.Hive3.HCatalog4.Phoenix三、数据处理与计算1.Spark2.Flink3.Tez4.Storm5.Presto6.Impala四、资源调度与集群管
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

一文看懂 “极大似然估计” 与 “最大后验估计” —— 最大后验估计篇

文章目录

4. 最大后验估计（MAP）

4.1 后验概率密度

4.2 样本条件概率密度 p ( X ∣ D ) p(X|\mathcal{D}) p(X∣D) （模型分布）

4.2.1 贝叶斯分类器

4.2.2 联系参数后验概率密度 p ( θ ∣ D ) p(\theta|\mathcal{D}) p(θ∣D)

4.2.3 小结

4.3 最大后验估计的步骤

4.4 示例

4.4.1 已知先验概率和条件概率

4.4.2 朴素贝叶斯

5. MLE和MAP的联系

你可能感兴趣的:(#,概率论与数理统计,最大后验估计,参数估计,MAP)

4.2 样本条件概率密度 $p(X|\mathcal{D})$ （模型分布）

4.2.2 联系参数后验概率密度 $p(\theta|\mathcal{D})$