CharlesVan

第七章贝叶斯分类器

7.1 贝叶斯决策论

贝叶斯决策论(Bayesian Decision theory)是概率框架下实施决策的基本方法。

假设有N种情况的类别标记，即 $\left\{ c_{1},c_{2},\ldots,c_{N} \right\}$ , $\lambda_{\text{ij}}$ 是将一个真实的标记为 $c_{j}$ 的样本误分类为 $c_{i}$ 所产生的损失。基于后验概率 $P\left( c_{i} \middle| x \right)$ 可获得将样本x分类为 $c_{i}$ 所产生的期望损失(expected loss)。即在样本x上的“条件风险”(conditional risk)

$R\left( c_{i} \middle| x \right) = \sum_{j = 1}^{N}\lambda_{\text{ij}}P\left( c_{j} \middle| x \right)$

判定准则h： $\chi \rightarrow y$ 以最小化总风险

$R\left( h \right) = \mathbb{E}_{x}\left\lbrack R\left( h\left( x \right) \middle| x \right) \right\rbrack$

贝叶斯判定准则(Bayes decision rule)：为最小化总体风险，只需在每个样本上选择那个能使条件风险 $\mathbf{R}\left( \mathbf{c} \middle| \mathbf{x} \right)$ **最小的类别标记。即

$h^{*}\left( x \right) = arg\operatorname{min}{R\left( c \middle| x \right)}$

$h^{*}\left( x \right)$ 称为贝叶斯最优分类器(Bayes optimal classifier)，与之对应的总体风险 $R\left( h^{*} \right)$ 称为贝叶斯风险(Bayes risk)。 $R\left( h^{*} \right)$ 反映了分类器所能达到的最好性能。

若目标是最小化分类错误率，则误差损失 $\lambda_{\text{ij}}$ 可写为

$\lambda_{\text{ij}} = \left\{ \begin{matrix} 0,\ if\ i = j \\ 1,otherwise \\ \end{matrix} \right.\$

此时条件风险

$R\left( c \middle| x \right) = 1 - P\left( c \middle| x \right)$

则最小化分类误差率的贝叶斯最优分类器为

$h^{*}\left( x \right) = \arg\operatorname{}{P\left( c \middle| x \right)}$

即对每个样本x选择能使后验概率 $P\left( c \middle| x \right)$ 最大的类别标记。

策略

1、判别式模型(discriminative models)：给定x，可通过直接建模 $P\left( c \middle| x \right)$ 来预测c(决策树、BP神经网络、SVM)

2、生成式模型(generative models)：先对联合概率分布 $P\left( x,c \right)$ 建模，然后由此获得 $P\left( c \middle| x \right)$

对生成式模型，必然考虑

$P\left( c \middle| x \right)\frac{P\left( x,c \right)}{P\left( x \right)}$

基于贝叶斯定理， $P\left( c \middle| x \right)$ 可写成

$P\left( c \middle| x \right) = \frac{P\left( c \right)P\left( x \middle| c \right)}{P\left( x \right)}$

其中 $P\left( c \right)$ 是类先验概率(prior probability)， $P\left( x \middle| c \right)$ 是样本x相对于类标记c的类条件概率(class-conditional probability)

7.2 极大似然估计

估计类条件概率的一种策略是先假定某具有某种确定的概率分布形式，再基于训练样本对概率分布的参数进行估计。

概率模型的训练过程就是参数估计(parameter estimation)过程。

极大似然估计(Maximum Likelihood Estimation,MLE)是根据数据采样来估计概率分布参数的经典方法。

令 $D_{c}$ 表示训练集D中第c类样本组合的集合，假设这些样本是独立同分布的，则参数 $\theta_{c}$ 对于数据集 $D_{c}$ 的似然为

$P\left( D_{c} \middle| \theta_{c} \right) = \prod_{x \in D_{c}}^{}{P\left( x \middle| \theta_{c} \right)}$

对 $\theta_{c}$ 进行极大似然估计就是去寻找最大化似然 $P\left( D_{c} \middle| \theta_{c} \right)$ 的参数值 ${\hat{\theta}}_{c}$

上式使用对数似然(log-likelihood)，则

$\text{LL}\left( \theta_{c} \right) = \log{P\left( D_{c} \middle| \theta_{c} \right) = \sum_{x \in D_{c}}^{}{\log{P\left( x \middle| \theta_{c} \right)}}}$

此时参数 $\theta_{c}$ 的极大似然估计 ${\hat{\theta}}_{c}$ 为

${\hat{\theta}}_{c} = \arg\operatorname{}{LL(\theta_{c})}$

7.3 朴素贝叶斯分类器

朴素贝叶斯分类器采用了属性条件独立性假设(attribute conditional independence assumption)：对已知类别，假设所有属性相互独立。

基于属性条件独立性假设，则 $P\left( c \middle| x \right)$ 可重写为

$P\left( c \middle| x \right) = \frac{P\left( c \right)P\left( x \middle| c \right)}{P\left( x \right)} = \frac{P\left( c \right)}{P\left( x \right)}\prod_{i = 1}^{d}{P\left( x_{i} \middle| c \right)}$

其中d为属性数目， $x_{i}$ 为x在第i个属性上的取值。

贝叶斯判定准则为

$h_{\text{nb}}\left( x \right) = \arg\operatorname{}{P\left( c \right)}\prod_{i = 1}^{d}{P\left( x_{i} \middle| c \right)}$

朴素贝叶斯分类器的训练过程就是基于训练集D来估计类先验概率 $P\left( c \right)$ ，并为每个属性估计条件概率 $P\left( x_{i} \middle| c \right)$ 。

令 $D_{c}$ 表示训练集D中第c类样本组合的集合，若有充足的独立同分布样本，则容易估计出类先验概率

$P\left( c \right) = \frac{\left| D_{c} \right|}{\left| D \right|}$

对离散属性，令 $D_{c,x_{i}}$ 表示训练集 $D_{c}$ 中第i个属性上取值为 $x_{i}$ 的样本组合的集合，则条件概率 $P\left( x_{i} \middle| c \right)$ 为

$P\left( x_{i} \middle| c \right) = \frac{\left| D_{c,x_{i}} \right|}{\left| D_{c} \right|}$

对连续属性可考虑概率密度函数，假定 $p\left( x_{i} \middle| c \right)\mathcal{\sim N}\left( \mu_{c,i},\sigma_{c,i}^{2} \right)$ ，其中 $\mu_{c,i}$ 和 $\sigma_{c,i}^{2}$ 分别是第c类样本在第i个属性上取值的均值和方差，则有

$P\left( x_{i} \middle| c \right) = \frac{1}{\sqrt{2\pi}\sigma_{c,i}}\exp\left( - \frac{\left( x_{i} - \mu_{c,i} \right)^{2}}{2\sigma_{c,i}^{2}} \right)$

7.4 半朴素贝叶斯分类器

半朴素贝叶斯分类器的基本想法：适当考虑一部分属性间的相互依赖信息，从而既不进行完全联合概率计算，又不至于彻底忽略了比较强的属性依赖关系。

“独依赖估计”(One-Dependent Estimator, ODE)是半朴素贝叶斯分类器最常用的一种策略。

独依赖：假设每个属性在类别之外最多仅依赖一个其他属性，即

$P\left( c \middle| x \right) \propto P(c)\prod_{i = 1}^{d}{P\left( x_{i} \middle| c,pa_{i} \right)}$

其中 $pa_{i}$ 为属性 $x_{i}$ 所依赖的属性，称为 $x_{i}$ 的父属性。

最直接的做法是假设所有属性都依赖同一个属性，称为超父，然后通过交叉验证等模型选择方法来确定超父属性，由此形成了SPODE(Super-Parent ODE)方法。

TAN(Tree Augmented naïve Bayes)：在最大带权生成树(maximum weighted spanning tree)算法的基础上，通过以下步骤将属性间依赖关系约简为树形结构：

1、计算任意两个属性之间的条件互信息(conditional mutual information)

$I\left( x_{i},x_{j} \middle| y \right) = \sum_{x_{i},x_{j};c \in y}^{}{P\left( x_{i},x_{j} \middle| c \right)}\log\frac{P\left( x_{i},x_{j} \middle| c \right)}{P\left( x_{i} \middle| c \right)P\left( x_{j} \middle| c \right)}$

2、以属性为结点构建完全图，任意两个结点之间边的权重设为 $I\left( x_{i},x_{j} \middle| y \right)$

3、构建此完全图的最大带权生成树，挑选根变量，将边置为有向

4、加入类别结点y，增加从y到每个属性的有向边

AODE(Averaged One-Dependent Estimator)是一种基于集成学习机制、更为强大的独依赖分类器。AODE尝试将每个属性作为超父来构建SPODE，然后将那些具有足够训练数据支撑的SPODE集成起来作为最终结果。即

$P\left( c \middle| x \right) \propto \sum_{\begin{matrix} i = 1 \\ \left| D_{i} \right| \geq m' \\ \end{matrix}}^{d}{P\left( c,x_{i} \right)\prod_{j = 1}^{d}{P\left( x_{j} \middle| c,x_{i} \right)}}$

其中 $D_{x_{i}}$ 是在第i个属性上取值为 $x_{i}$ 的样本的集合， $m^{'}$ 为阈值常数。

AODE需估计 $P\left( c,x_{i} \right)$ 和 $P\left( x_{j} \middle| c,x_{i} \right)$ ，则

$P\left( c,x_{i} \right) = \frac{\left| D_{c,x_{i}} \right| + 1}{\left| D \right| + N \times N_{i}}$

$P\left( x_{j} \middle| c,x_{i} \right) = \frac{\left| D_{c,x_{i},x_{j}} \right| + 1}{\left| D_{c,x_{i}} \right| + N_{j}}$

其中N是D中可能的类别数， $N_{i}$ 是第i个属性可能的取值数， $D_{c,x_{i}}$ 是类别c且在第i个属性上取值为 $x_{i}$ 的样本的集合， $D_{c,x_{i},x_{j}}$ 是类别c且在第i和第j个属性上取值分别为 $x_{i}$ 和 $x_{j}$ 的样本的集合

7.5 贝叶斯网

贝叶斯网(Bayesian network)也称为信念网(belief network)，借助有向无环图(Directed Acyclic Graph,DAG)来刻画属性之间的依赖关系并使用条件概率表(Conditional Probability Table,CPT)来描述属性的联合概率分布。

7.5.1 结构

贝叶斯网结构有效地表达了属性间的条件独立性。

给定父结点集，贝叶斯网假设每个属性与它的非后裔属性独立，于是 $\left\langle G,\Theta \right\rangle$ 将属性 $x_{1},x_{2},\ldots,x_{d}$ 的联合概率分布定义为

$P_{B}\left( x_{1},x_{2},\ldots,x_{d} \right) = \prod_{i = 1}^{d}{P_{B}\left( x_{i} \middle| \pi_{i} \right) = \prod_{i = 1}^{d}\theta_{x_{i}|\pi_{i}}}$

三种典型依赖关系

1、同父结构：给定父结点 $x_{1}$ 的取值，则 $x_{3}$ 和 $x_{4}$ 条件独立

2、V型结构：也称为冲撞结构，给定子结点 $x_{4}$ 的取值， $x_{1}$ 和 $x_{2}$ 必不独立；若 $x_{4}$ 的取值完全未知，则V结构下 $x_{1}$ 和 $x_{2}$ 却是相互独立的，称为边际独立性(marginal independence)。

3、顺序结构：给定x的值，则y和z条件独立

道德图(moral graph)：有向图中V型结构且两个父结点加上无向边连接，将有向边改为无向边产生的无向图。

7.5.2 学习

评分函数：评测贝叶斯网与训练数据的契合程度，并寻找结构最优的贝叶斯网。

常用评分函数通常基于信息论准则，此类准则将学习问题看作一个数据压缩任务，学习的目标是找到一个能以最短编码长度描述训练数据的模型。

编码的长度包括了描述模型自身所需的字节长度和使用该模型描述数据所需的字节长度。

最小描述长度(Minimal Description Length,MDL)准则：综合编码长度最短的贝叶斯网

给定训练集 $\left\{ x_{1},x_{2},\ldots,x_{m} \right\}$ ，贝叶斯网 $\left\langle G,\Theta \right\rangle$ 在D上的评分函数为

$s\left( B \middle| D \right) = f\left( \theta \right)\left| B \right| - LL\left( B \middle| D \right)$

其中 $\left| B \right|$ 是贝叶斯网的参数个数； $f\left( \theta \right)$ 表示描述每个参数 $\theta$ 所需的字节数；而

$\text{LL}\left( B \middle| D \right) = \sum_{i = 1}^{m}{\log{P_{B}\left( x_{i} \right)}}$

是贝叶斯网B的对数似然。

若 $f\left( \theta \right) = 1$ ，即每个参数用1个字节描述，则AIC(Akaike
Information Criterion)评分函数

$\text{AIC}\left( B \middle| D \right) = \left| B \right| - LL\left( B \middle| D \right)$

若 $f\left( \theta \right) = \frac{1}{2}\log m$ ，即每个参数用 $\frac{1}{2}\log m$ 字节描述，则BIC(Bayesian Information Criterion)评分函数

$\text{BIC}\left( B \middle| D \right) = \frac{\log m}{2}\left| B \right| - LL\left( B \middle| D \right)$

若 $f\left( \theta \right) = 0$ ，则评分函数退化为负对数似然，学习任务退化为极大似然估计。

若贝叶斯网 $\left\langle G,\Theta \right\rangle$ 网络结构G固定，则评分函数 $s\left( B \middle| D \right)$ 第一项为常数。参数 $\theta_{x_{i}|\pi_{i}}$ 能直接在训练数据上通过经验估计获得

$\theta_{x_{i}|\pi_{i}} = {\hat{P}}_{D}\left( x_{i} \middle| \pi_{i} \right)$

常用策略：1、贪心法；2、通过给网络结构施加约束来削减搜索空间。

7.5.3 推断

通过一些属性变量的观测值来推测其他属性变量的取值。

推断(inference)：通过已知变量观测值来推测待查询变量的过程

证据(evidence)：变量观测者

吉布斯采样(Gibbs sampling)：在贝叶斯网所有变量的联合状态空间与证据 $E = e$ 一致的子空间进行随机漫步(random walk)。每一步仅依赖前一步的状态(马尔科夫链，Markov chain)。在一定条件下，无论从什么初始状态开始，马尔科夫链第t步的状态分布在 $\rightarrow \infty$ 时必收敛于一个平稳分布(stationary distribution)。

7.6 EM算法

隐变量(latent variable):未观测变量

令X表示已观测变量集，Z表示隐变量集， $\Theta$ 表示模型参数。若对 $\Theta$ 做极大似然估计，则对应最大化对数似然

$\text{LL}\left( \Theta \middle| X,Z \right) = \ln{P\left( X,Z \middle| \Theta \right)}$

计算Z的期望来最大化已观测数据的对数边际似然(marginal likelihood)

$\text{LL}\left( \Theta \middle| X \right) = \ln{P\left( X \middle| \Theta \right) = \ln{\sum_{Z}^{}{P\left( X,Z \middle| \Theta \right)}}}$

EM(Expectation-Maximization)算法是常用的估计参数隐变量的利器，基本思想：若参数 $\Theta$ 已知，则可根据训练数据推断出最优隐变量Z的值(E步)；反之，若Z的值已知，则可方便地对参数 $\Theta$ 做极大似然估计(M步)

以初始值 $\Theta^{0}$ 为起点，上式可迭代执行以下步骤直至收敛：

1、基于 $\Theta^{t}$ 推断变量Z的期望，记为 $Z^{t}$

2、基于已观测变量X和 $Z^{t}$ 对参数 $\Theta$ 做极大似然估计，记为 $\Theta^{t +1}$

基于 $\Theta^{t}$ 计算隐变量Z的概率分布 $P\left( X \middle| Z,\Theta^{t} \right)$ ，则EM算法的两个步骤为

1、E步：以当前参数 $\Theta^{t}$ 推断隐变量分布 $P\left( X \middle| Z,\Theta^{t} \right)$ ,并计算对数似然 $\text{LL}\left( \Theta \middle| X,Z \right)$ 关于Z的期望
$Q\left( \Theta \middle| \Theta^{t} \right) = \mathbb{E}_{Z|X,\Theta^{t}}\text{LL}\left( \Theta \middle| X,Z \right)$

2、M步：寻找参数最大化期望似然
$\Theta^{t + 1} = \arg\operatorname{max}{Q\left( \Theta \middle| \Theta^{t} \right)}$

有关Maven的个人笔记总结
Mavenpom.xml文件详解一级标签bulid(定义了项目的构建配置，包括编译、测试、打包等过程。可以指定插件和构建生命周期。)dependces（列出了项目依赖的所有外部库。每个依赖项都指定了其坐标（groupId,artifactId,version））depencymanagement（用于集中管理依赖版本，确保所有子模块使用相同的依赖版本，用于解决jar包依赖其他jar包产生的版本冲突
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
104. 二叉树的最大深度间歇性发呆
给定一个二叉树，找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明:叶子节点是指没有子节点的节点。示例：给定二叉树[3,9,20,null,null,15,7]，3/\920/\157返回它的最大深度3。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/maximum-depth-of-binary-tree著作权归领扣
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
git 介绍与使用教程叶楊基础知识 gitlab
Git是一个分布式版本控制系统，每个开发者都有一个完整的本地仓库（包含完整历史记录），而远程仓库（如GitHub、GitLab、Gitee）是团队共享的中央仓库。它们的关系如下：本地仓库（LocalRepository）存储在你的计算机上，包含完整的提交历史、分支和代码。你可以独立进行提交（gitcommit）、创建分支（gitbranch）等操作，无需联网。远程仓库（RemoteReposito
docker磁盘空间不足解决办法 win_zcj docker eureka 容器
摘抄自：https://www.cnblogs.com/jun-zhou/p/15086657.html说明：用yuminstalldocker安装的docker默认安装目录在/var/lib/docker/，/var目录很小，需要改换更大的磁盘空间存储1.查看docker镜像存放目录空间大小du-hs/var/lib/docker/2.停止docker服务。systemctlstopdocker
python 基于 httpx 的流式请求
文章目录1.环境介绍2.同步客户端2.1.面向过程2.1.1.流式输出2.1.2.非流式输出2.2.面向对象3.异步客户端3.1.面向过程3.2.面向对象3.3.Attemptedtocallasynciteratoronanasyncstream.参考：https://www.jb51.net/article/262636.htm次要参考：https://blog.csdn.net/gitblo
阿里云ssl证书自动安装及续订（acme） cherishSpring nginx linux #docker容器阿里云 ssl 数据库
目录一、shell命令安装二、dockerrun安装三、dockercompose安装一、shell命令安装#安装acmecurlhttps://get.acme.sh|[email protected]#注册zerossl.acme.sh/[email protected]#获取证书exportA
粘的ScalersTalk第七轮新概念朗读持续力训练Day 75 211228 粘_NIAN
练习材料：Lesson75SOSWhenalightpassengerplaneflewoffcoursesometimeago,itcrashedinthemountainsanditspilotwaskilled.Theonlypassengers,ayoungwomanandhertwobabydaughters,wereunhurt.Itwasthemiddleofwinter.Snowl
Python打卡Day11 常见的调参方式
核心知识：1.模型=算法+实例化设置的外参（超参数）+训练得到的内参2.只要调参就需要考2次所以如果不做交叉验证，就需要划分验证集和测试集，但是很多调参方法中都默认有交叉验证，所以实际中可以省去划分验证集和测试集的步骤基线模型（基准模型）:首先运行一个使用默认参数的模型，记录其性能作为比较的基准。超参数调整数据1.网格搜索(GridSearchCV):-需要定义参数的网格（param_grid），
python学智能算法（二十七）|SVM-拉格朗日函数求解上西猫雷婶机器学习人工智能 python学习笔记支持向量机 python 机器学习算法人工智能
【1】引言前序学习进程中，我们已经掌握了支持向量机算法中，为寻找最佳分割超平面，如何用向量表达超平面方程，如何为超平面方程建立拉格朗日函数。本篇文章的学习目标是：求解SVM拉格朗日函数。【2】求解方法【2.1】待求解函数支持量机算法的拉格朗日函数为：L(w,b,α)=12∥w∥2−∑i=1mαi[yi(w⋅xi+b−1)]L(w,b,\alpha)=\frac{1}{2}{\left\|w\rig
Unit5 复盘黄静怡
Part11，从本单元中我学到的最重要的理念（精读和视听说分别总结）视听说：urbanpulse精读：Animalsalsohaveemotions2，我在本片文章／音频／视频中学到的怦然心动的单词（精读和视听说分别总结）3，在本片文章／音频／视频中我最喜欢的一句话（精读和视听说分别总结）视听说：Ilikethemixofpeopleandallthedifferentthingsthatyouc
grafana10.x报错 Failed to upgrade legacy queries Datasource x was not found 每天靠近一点点 grafana
问题grafana从6.x升级到10.x后，导入json文件后报错，数据源x查询不到，grafana不显示数据；TemplatingFailedtoupgradelegacyqueriesDatasourcexwasnotfound解决方法可能grafana升级后数据源找不到，在面板上重新选择数据源保存后，点击Inspect中的PanelJSON文件，查看更新后数据源的uid，在导入的json文件
Linux部署Milvus数据库及Attu UI工具完全指南
一、准备工作1.1环境要求操作系统：Ubuntu20.04/Debian11/CentOS7+硬件配置：至少8GB内存，4核CPU，50GB磁盘空间网络要求：可访问互联网（用于拉取Docker镜像）1.2安装Docker和DockerCompose1.2.1安装Dockersudoapt-getupdatesudoapt-getinstall-ydocker.iosudosystemctlstar
clean bat javarecipes F#
@echooffdel/f/s/q%systemdrive%\*.tmpdel/f/s/q%systemdrive%\*._mpdel/f/s/q%systemdrive%\*.logdel/f/s/q%systemdrive%\*.giddel/f/s/q%systemdrive%\*.chkdel/f/s/q%systemdrive%\*.olddel/f/s/q%systemdrive%\r
劳力士日志高仿一般多少钱（精仿日志手表售价一览表）星耀腕表
在现在的仿表市场上，各种手表的款式让你眼花缭乱，价格也是千差万别，厂家让你犹豫不决。我的目标是让每一位顾客以最合理的价格买到质量最好的手表。我没有华丽的辞藻，我只有真心为你保驾护航，对你坦诚相待，给你最有保障的服务。详细加微信咨询：85857133劳力士日志高仿一般多少钱？劳力士日志是劳力士最经典的系列之一，以其简约时尚、高品质而闻名于世。然而，正版劳力士日志的高昂价格使得许多人望而却步。因此，市
开学日秀琴sukin
开学日，定了6点的闹钟起床，昨晚还失眠了，11点睡觉，辗转12点多还没睡着。可不是因为开心兴奋得睡不着，一些陈年旧事缠绕着我。起床后洗头洗澡，煮粥。写了三张卡片。老大7点15下楼，看书，吃药，然后吃早饭，磨叽着8点20才出门。骑上电瓶车时，发现骑不动，没有电了。过年回家，直到现在才骑，不知是不是放久了没电了。老大急得哭起来，报名时间是8点半。我给老公打电话，让他来送。我也急着去老二幼儿园开8点半的
Python.03 唯怡委员 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程是Linux中资源分配的基本单位，代表程序在内存中的执行实例，拥有独立的地址空间和系统资源。通过ps、top命令查看，kill命令终止，或使用systemctl管理服务进程。线程是进程内的轻量级执行单元，共享进程资源（如内存），切换开销小。Linux通过POSIX线程（pthread）库实现，可用htop查
uniapp 引入高德api 白月光和意难平 uni-app javascript 前端
mounted(){if(typeofwindow.AMap==='function'){this.initAmap()}else{constscript=document.createElement('script');script.async="async";script.src='https://webapi.amap.com/mapsv=2.0&key=你的key&plugin=AMap.
【算法-贪心算法-python】柠檬水找零檀越@新空间 P1 算法与数据结构 s1 Python 算法贪心算法 python
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
uniapp写好的弹窗组件 A了LONE uni-app 前端
效果图view部分点击打开弹窗确认退款是否确认申请退款？取消确定js部分data(){return{miniShowModal:false,//默认隐藏弹框}},methods:{//点击按钮弹出弹框miniToMdel(){this.miniShowModal=true;},//点击确定按钮时关闭弹框confirm(){this.closeOn()},//点击蒙版时关闭按钮miniHideMod
《where was the money》 translation（Part4 P352-353） W14 伯涵子弟
Theymademetheguestofhonor,theytreatedmelikeaking.Theyevenhadapresenttogiveme,gift-wrappedandeverything.Asweater.AndwhenKatherinearrivedwiththeNewsreporter,EdKirkman,andthephotographer,GordonRynders,Jo
uniApp出现【ReferenceError: computed is not defined】
1·问题uniApp出现【ReferenceError:computedisnotdefined】2·解##标题决在当前页导入：import{computed}from'vue'
Template execution failed: ReferenceError: name is not defined An_s 技术（javascript）配置（环境）reactjs vue.js webpack
问题我们使用了html-webpack-plugin（webpack）进行编译html，导致的错误。排查结果连接地址html-webpack-plugin版本低(2.30.1)，html模板里面不能有``符号，注释都不行``//varreg=newRegExp(`(^|&)${name}=([^&]*)(&|$),"i”)这样也不支持varreg=newRegExp(`(^|&)${name}=(
并发编程原理与实战（十八）ReentrantLock API全面解析
上一篇讲解了Lock接口核心API和相比于synchronized的关键优势，本文来进一步学习Lock接口的具体实现类ReentrantLock。认识ReentrantLock基本行为和语义下面我们先看ReentrantLock的定义。/***Areentrantmutualexclusion{@linkLock}withthesamebasic*behaviorandsemanticsasthe
【算法】贪心算法——柠檬水找零
题解：柠檬水找零(贪心算法)目录1.题目2.题解3.参考代码4.证明5.总结1.题目题目链接：LINK2.题解分情况讨论+贪心算法当顾客为5元时，收下当顾客为10元时，收下10元并找回5元当顾客为20元时，收下20元并找回10+5元或者5+5+5元这里仅20元时候找钱会有分歧，所以这里我们用贪心算法，即优先留下尽可能多的5元，尽快把10元扔出去。原因：5元是“万金油”，既可以给10元找零，也可以给
AI驱动型论文搜索工具司南锤 AI 工具
✅一、AI驱动型论文搜索工具（强烈推荐）1.Consensus官网：consensus.app特点：输入自然语言问题（如“Doesgreenspacereduceurbanheatislandeffect?”），系统会自动返回论文中直接回答该问题的句子，标明支持/不支持的证据。适合人群：科研人员、政策制定者、想快速得到文献共识的人。2.ScispaceCopilot（原SemanticSchola
树莓派vsftpd文件传输服务器的配置方法 czliutz 笔记 linux 服务器 linux ftp
在树莓派上安装和配置vsftpd（VerySecureFTPDaemon）服务器的步骤如下：1.安装vsftpd打开终端，执行以下命令安装vsftpd：sudoaptupdatesudoaptinstallvsftpd安装完成后，vsftpd会自动启动。可以通过以下命令验证服务状态：sudosystemctlstatusvsftpd2.备份原始配置文件在修改配置前，先备份原始配置文件：sudocp
［江城梅花引＊汝心］蓝脸青衣L
蓝脸青衣秋风吹皱半池云。正粼粼，倒粼粼。枝鲤衔花，含碎子青襟。才是翻荷颜色好，无穷碧，嫰香飞、似汝心。汝心，汝心。忍相亲。媲海沉，媲海深。溺了溺了，溺了罢，前事今身。哪管萦荦，哪管世情浑。一任禅花修不尽，十数愿，百浮屠，懒做神。图片发自App
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

第七章 贝叶斯分类器

第七章 贝叶斯分类器

7.1 贝叶斯决策论

7.2 极大似然估计

7.3 朴素贝叶斯分类器

7.4 半朴素贝叶斯分类器

7.5 贝叶斯网

7.5.1 结构

7.5.2 学习

7.5.3 推断

7.6 EM算法

你可能感兴趣的:(Machine,Learning,贝叶斯决策论,朴素贝叶斯,半朴素贝叶斯,EM算法)

第七章贝叶斯分类器

第七章贝叶斯分类器