u013524655

EM算法

转载自：http://blog.sina.com.cn/s/blog_68ffc7a40100uec5.html

所谓EM算法，指的是就是Expect-Maximum算法，是一种非常有用的算法。假设这么一个问题，我们有一堆样本集合X，我们已知该样本总体的分布类型（比如是高斯分布），但是我们不知道这个分布的参数具体是多少，我们希望有方法能够根据这些观测到的样本集合来估计出这个分布的参数。怎么办呢？于是就有了极大似然估计，该方法思路很简单，设计出一个样本同时出现的概率公式，这个公式也叫似然函数，这个似然函数表示的是样本同时出现的前提下，参数分布的概率，该公式肯定包含了这些参数作为公式的因子。我们的目标是使得该样本出现的概率最大，那么剩下的问题就是一个数学问题了，选择合适的参数值使得这个公式的值最大，比如求导等等。极大似然估计的的思路很直接，选择一个目标函数，使该目标函数最大。本质上最大似然估计是根据贝叶斯公式，计算出一个公式，该公式表示的是在样本出现的前提下，参数的分布概率。通过选取合适的参数值，使得这个分布概率最大。

如果我们在对上述问题再加一点难度，除了分布参数我们不知道，另外还有一些隐藏的变量我们也不知道，或者说观测到得数据不完整，在这种情况下，包含了隐藏变量的目标函数往往没有解析解，因此无法估算出这些参数变量。那我们又该怎么估计出这些参数和这些缺失的隐藏变量呢？解决的方法就是EM算法。关于EM算法，52npl上有一篇博客做了比较深刻的说明，请参阅。这里对其说明进行一些评注，便于大家理解。

EM算法的目标是找出有隐性变量的概率模型的最大可能性解，它分为2个步骤，E-step和M-step，E-step根据最初假设的模型参数值或者上一步的模型参数计算出隐性变量的后验概率，其实就是隐性变量的期望，M-step根据这个E-step的后验概率重新计算出模型参数，然后再重复这两个步骤，直至目标函数收敛。

观测到的变量组成的向量我们表示成X，所有隐性变量组成的向量为Z，模型的参数表示成

所谓EM算法，指的是就是Expect-Maximum算法，是一种非常有用的算法。假设这么一个问题，我们有一堆样本集合X，我们已知该样本总体的分布类型（比如是高斯分布），但是我们不知道这个分布的参数具体是多少，我们希望有方法能够根据这些观测到的样本集合来估计出这个分布的参数。怎么办呢？于是就有了极大似然估计，该方法思路很简单，计算出这些样本出现的分布概率公式，该公式肯定包含了这些参数作为公式的因子。我们的目标是使得该样本出现的概率最大，那么剩下的问题就是一个数学问题了，选择合适的参数值使得这个公式的值最大，比如求导等等。极大似然估计的的思路很直接，选择一个目标函数，使该目标函数最大。

观测到的变量组成的向量我们表示成X，所有隐性变量组成的向量为Z，模型的参数表示成（一个或多个参数）。在分类问题中，Z就表示的是可能的潜在分类，X就是需要分类的数据，我们得目标是找出模型的参数和隐性变量来使得X出现的概率最大，也就是最大（其实本来可以写成，但是不是随机变量而是一个参数，所以将 | 改成；）

由于很多模型的概率都带有指数，所以在上加一个对数ln，这个对数并不影响其极值，的最大值也就是ln的最大值。

假设是上的一个概率分布，那么就有，

公式（1）

最后一步是基于琴生不等式，所谓琴生不等式

需要注意的是，中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function在某些国内的数学书中指凹函数。Concave Function指凸函数。但在中国大陆涉及经济学的很多书中，凹凸性的提法和国外的提法是一致的，也就是和数学教材是反的。举个例子，同济大学高等数学教材对函数的凹凸性定义与本文相反，本条目的凹凸性是指其上方图是凹集或凸集，而同济大学高等数学教材则是指其下方图是凹集或凸集，两者定义正好相反。

在本文中，ln是一个凹函数。

根据公式（1），我们看到了的下界是多少。EM算法分为2步：

第一步：E-step

其目的是计算出的下界，以及在此下界时，的值。

根据琴声不等式，我们得知在到达下界时的条件为

公式（2）

c为常数。我们已知，那么此临界条件下由公式（2）就有

公式2变化一下如下

公式3

第二步：M-step

在E-step中，我们得到了的下界以及此下界时的值，那么在M-step中我们的目标就变成了通过变换参数来最大化这个下界。下界提高了，那么值也会提高。

M-step本质上就是求ln的极值点，求极值点的方法就不用再啰嗦了吧，求偏导，通过_求参数

_{EM算法概要如下}

EM算法通过不断提高目标函数的下界的方法来寻找目标函数的最大值，因为通过M-step使得的下界不断提高，只要存在最大值，那么EM算法一定会收敛。

做了这么多分析，举两个例子，可能会更容易理解。先看第一个例子，来自文献[3]：

混合高斯模型

数据X是一个实例集合，它由k个不同的正态分布混合而成的分布生成，这里涉及k个不同的正态分布的混合，而且我们还不知道哪个变量实例由哪个分布生成的。因此这是一个涉及隐藏变量的典型例子。可以把每个实例完整描述成，其中xi是第i个实例的观测值，表示k个正态分布中的哪一个用于生成xi，确切得讲，当xi由第j个正态分布产生时，zij为1，否则为0。由此Z向量只有一个分量为1，其它分量为0。这里xi是实例描述中已经观察到的变量，是隐藏变量。k个正态分布的均值就是我们需要估计的模型参数。

算法伊始，我们首先假设一个模型参数初始值，接下来就是计算我们的目标函数，该目标函数的公式推导如下：

公式2

接下来就是E-step.我们的目标是选择一个概率分布使得达到下界，我们就有

那此时我们目标函数的值根据公式2就是

公式3

接下来就是M-step，在确定的情况下，选择合适参数使得最大化，根据公式2，这就是一个数学问题，对公式3求偏导，你会发现参数的极值点为

然后算法就利用估算出的参数再重复计算E-step，M-step直至收敛。

因子分析

所谓因子分析，就是指从变量群中提取公共因子的方法，该因子是用来描述隐藏在观测变量中的一些更基本的，但又无法直接测量到的隐性变量。EM算法也可以用来解决这样的问题，从而能够估算出隐藏的公共因子及该模型的参数。文献4的博客给出了一个很好的说明，讲得比较清楚。这里主要是引用这篇文章的内容，加入一些自己的评论，使其更便于理解。

举个因子分析的例子，有m个n维特征向量的样本集，每个样本实例表示为，样本实例的生成模型为

其中是样本点，其维度为n，其表示为

代表因子，该因子存在于一个k维向量空间，该k维空间就代表因子的维度空间，也就是说每一个实例变量实际上是由这k维的因子所决定的，我们目标就是估算出实例变量的k维因子。其公式表示如下

因子遵循多元正态分布，。表示单位矩阵，对角线元素为1，其他元素为0.

是一个变换矩阵，有时也被称为装载矩阵，其目的是将因子映射到样本的n维空间。

是一个n维向量，其含义是样本的中心点。

是一个n维向量，表示的是真实样本和模型的误差，同一样，它也遵循多元高斯分布，其中是一个n x n对角矩阵

下面来分析EM算法的使用，首先明确我们的目标，我们的目标是根据样本实例集估算出参数值，，。有了这三个参数我们就能根据模型以及样本实例计算出每个样本对应的因子向量（也就是隐藏变量），一个矩阵方程组变化而已。

回想EM算法，那么对应因子分析，其E-step如下：

我们将观测到得实例变量X和隐藏变量Z组成一个联合的变量Y，该联合变量Y也符合多元高斯分布。为什么Y也符合多元高斯分布呢？很简单，首先Z是一个多元高斯分布，而X是多元高斯分布变量Z的一个线性变化，所以X也是一个多元高斯分布(参见文献[5]，多元正态分布的线性变化仍然是)，那么X，Z组合成的变量Y也符合高斯分布。其公式代表如下：

参见文献[5]，你会发现多元正态分布的另外一个特性，多元正态分布的条件分布仍然是多元正态分布

该特性表述如下：

对应我们的例子,就有

这个过程中利用了z和独立假设()

公式如下

那么就可以得到Y的分布：

、

套用上述的特性-性质6，就有

这就是我们的目标。E-step就到此为止。再看M-step，M-step的目标函数如下

分别对3个参数求该目标函数的偏导，得到3个偏导公式，让其都为0，组成一个方程组。该方程组的解就是我们待沽参数。

具体的公式推导参见文献[4]，文献[4]给出了比较详细的推导，如果对多元高斯分布了解的比较深入的话，该推导应该不难读懂。

个人觉得文献[3]中关于EM的讲述有一些瑕疵，讲得不是很清楚，但是文中的例子倒是可以作为参考。文献[4],[5]对此讲述的比较清楚，是个非常不错的参考，值得一读。

参考文献：

[1]理解EM算法 52nlp

[2]http://zh.wikipedia.org/wiki/凸函数

[3]数据挖掘原理与算法-毛国君

[4] http://www.cnblogs.com/jerrylead/archive/2011/05/11/2043317.html

[5]多维高斯分布讲解 http://www.docin.com/p-121202383.html

[6] EM算法http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

[7] The Top Ten Algorithms in Data Mining

[7] http://zh.wikipedia.org/zh-cn/似然函数

从决策树到随机森林：Python机器学习里的“树形家族“深度实战与原理拆解小张在编程机器学习决策树随机森林
引言在机器学习的算法森林中，有一对"树形兄弟"始终占据着C位——决策树像个逻辑清晰的"老教授"，用可视化的树状结构把复杂决策过程拆解成"是/否"的简单判断；而它的进阶版随机森林更像一支"精英军团"，通过多棵决策树的"投票表决"，在准确性与抗过拟合能力上实现了质的飞跃。无论是医疗诊断中的疾病预测，还是金融风控里的违约判别，这对组合都用强大的适应性证明着自己的"算法常青树"地位。今天，我们就从原理到实
什么是 PoS（权益证明） MonkeyKing.sun pos
PoS（ProofofStake，权益证明）是区块链中常用的一种共识算法，作为PoW（工作量证明）的替代方案，它通过“持币数量+持有时间”决定谁有权记账（打包区块），从而降低能耗、提升效率。一、什么是PoS（权益证明）？PoS是一种基于“持有代币数量”的区块链共识机制，持币越多、持币越久，获得打包新区块机会的概率越高。换句话说，不是靠算力挖矿，而是靠“你拥有多少币”来竞争记账权。二、PoS的核心原
BaiduSitemap - Typecho站点地图生成与多搜索引擎推送插件独立开发者阿乐原创 javascript 云计算自动化大数据数据分析
文章目录BaiduSitemap-Typecho站点地图生成与多搜索引擎推送插件✨功能特点插件架构核心模块文件结构安装方法方法一：手动安装方法二：Git克隆⚙️配置说明站点地图基本设置搜索引擎配置百度搜索引擎必应（Bing）搜索引擎谷歌（Google）搜索引擎使用指南站点地图访问手动操作站点地图包含内容高级功能图片索引优化推送状态监控技术实现详解站点地图生成流程搜索引擎推送机制缓存机制❓常见问题站
Definition of a Requirement workflower 软件需求软件工程需求分析敏捷流程开发语言
IEEE给出的需求定义Firstofall,whatismeantbyarequirement?HereisatypicaldefinitiondrawnfromIEEE-STD-1220-1998(IEEE1998):Requirement:astatementthatidentifiesaproductorprocessoperational,functional,ordesigncharac
Definition of a Stakeholder workflower 软件工程开发语言软件需求需求分析敏捷流程
利益相关者定义Theterm“stakeholder”hasalreadybeenusedwithoutgivingadefinition:Stakeholder:Anindividual,groupofpeople,organisationorotherentitythathasadirectorindirectinterest(orstake)inasystem.Astakeholder’si
实现make_power_of_two函数洞阳 c++面试 c++
目录代码make_power_of_two函数解析：将数值转换为大于等于它的最小2的幂一、函数功能与核心逻辑二、代码实现与逐行解析三、逐步骤原理解析四、位运算的数学原理五、不同输入的转换示例六、算法复杂度与适用场景七、与其他实现方式的对比八、注意事项总结代码该函数将任意n转换为大于等于n的最小2的幂（如n=10→16，n=16→16）size_tmake_power_of_two(size_tn)
git的author和commiter的修改 weixin_34161032 git 开发工具 python
2019独角兽企业重金招聘Python工程师标准>>>git的author和commiter的修改.git的文件夹，进去，就会看到有一个config文件,编辑,加上===========================================[user]#设置用户名name=xxx#设置用户的邮箱[email protected],=========================
具身智能基础 frostmelody 人工智能
1.MuJoCo：高保真物理仿真的核心引擎技术本质定义：MuJoCo（Multi-JointDynamicswithContact）是由EmoTodorov开发的物理仿真引擎，专注于多关节系统接触动力学的高效计算。核心突破：约束动力学模型：采用约束优化（而非传统弹簧阻尼模型）模拟物体接触，避免穿透和数值不稳定（公式：min12q˙TMq˙+q˙Tf\text{min}\frac{1}{2}\dot
Tailwind CSS自定义用法 TE-茶叶蛋面试复习系列 css css 前端
文章目录前言✅一、集成TailwindCSS到React项目1.安装依赖2.配置`tailwind.config.js`3.创建全局样式文件（如`src/index.css`）@tailwindbase;@tailwindcomponents;@tailwindutilities;4.在`main.tsx`或`main.jsx`中引入样式✅二、自定义样式方式汇总1.`theme.extend`自定
git Author 和 Committer 区别张紫娃 GIT git
Author（作者）最初编写该提交内容的人,通常是你用gitcommit提交时设置的名字。gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"Committer（提交者）最终将改动合并进仓库的人。gitcommit-m"fix:buginlogin"#%an=YourName#%cn=Your
深入详解：随机森林算法——概念、原理、实现与应用场景猿享天开算法随机森林机器学习
深入详解：随机森林算法——概念、原理、实现与应用场景随机森林（RandomForest,RF）是一种经典的集成学习算法，广泛应用于机器学习任务。本文将通过图文结合的方式，全面解析随机森林的核心原理、实现细节和应用实践，帮助读者建立系统认知。1.核心概念与直观理解1.1什么是随机森林？随机森林是一种基于决策树的集成学习算法，通过构建多棵决策树进行协同预测。其核心思想是"三个臭皮匠，顶个诸葛亮"——多
「Ant Design 组件库探索」一：整体结构+工程化设置梦玄海 elasticsearch 大数据搜索引擎
本篇文章是学习了整体结构以及工程化配置后的总结，所以内容很长，不用从头读到尾，请结合实际项目和兴趣点进行分节点阅读。AIIDE设置这里的IDE设置主要是针对cursor的，看得出来，cursor是非常的火，这个库也支持了；这个cursor的目录结构是这样的：.cursor/└──rules/├──demo.mdc├──docs.mdc├──git.mdc├──locale.mdc├──naming
星际争霸多智能体挑战赛（SMAC）资源存储库多智能体强化学习人工智能
目录TheStarCraftMulti-AgentChallenge星际争霸多智能体挑战赛Abstract摘要1Introduction1引言2RelatedWork2相关工作3Multi-AgentReinforcementLearning3多智能体强化学习Dec-POMDPs12-POMDPs（十二月-POMDP）Centralisedtrainingwithdecentralisedexec
【项目实战】Redis使用场景之基于Redis实现分布式限流本本本添哥 002 -进阶开发能力 003 -数据库 redis 分布式数据库
一、技术概览1.1定义分布式限流是指在分布式系统中限制请求的速率，以保护后端服务不被过多的请求压垮。它可以帮助我们控制系统的负载，保证服务的稳定性。Redis是一个高性能的键值存储系统，常用于缓存、消息队列和实时分析等场景。由于其支持丰富的数据结构和原子操作，非常适合用来实现分布式限流。专业术语:令牌桶算法(TokenBucket):一种流量整形算法，允许突发流量但不超过平均速度。漏桶算法(Lea
人工智能大模型原理与应用实战：大模型在金融风控中的应用 AI天才研究院 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
文章目录人工智能大模型原理与应用实战：大模型在金融风控中的应用01.背景介绍1.1金融风控的挑战1.2大模型的优势2.核心概念与联系2.1大模型在金融风控中的应用场景2.2大模型与传统风控技术的结合3.核心算法原理具体操作步骤3.1基于大模型的欺诈检测3.2基于大模型的信用评估4.数学模型和公式详细讲解举例说明4.1逻辑回归模型4.2XGBoost模型5.项目实践：代码实例和详细解释说明5.1基于
Go项目限流全攻略：超越中间件的全方位解决方案码农老gou golang 中间件开发语言
引言：限流在分布式系统中的重要性在当今高并发的互联网应用中，流量控制已成为保障系统稳定性的关键手段。一次突发的流量洪峰可能导致整个系统崩溃，造成不可估量的损失。作为Go开发者，我们常常会面临这样的面试问题：Go项目中如何实现限流？仅仅使用中间件就足够了吗？本文将深入探讨Go项目中的限流策略，分析中间件的局限性，并介绍超越中间件的全方位解决方案。一、常见限流算法解析1.令牌桶算法（TokenBuck
随机森林详解：原理、优势与应用实践大千AI助手人工智能 Python #OTHER 随机森林算法机器学习决策树人工智能 DecisionTree 数据挖掘
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！随机森林介绍1.定义：随机森林是一种强大的、高度灵活的集成学习（EnsembleLearning）算法，主要用于分类和回归任务。它的核心思想是构建多棵决策树（DecisionTree），并将这些树的预测结果进行组合（例如，分类任务采用投票，回归任务采用
Date与LocalDate互转 chi_666 JAVA java
1、Date转LocalDateDatetoDay=newDate();LocalDatelocalDate=toDay.toInstant().atZone(ZoneId.systemDefault()).toLocalDate();2、LocalDate转DateLocalDatelocalDate=LocalDate.parse("2023-01-01",DateTimeFormatter.
【第二章:机器学习与神经网络概述】03.类算法理论与实践-(3)决策树分类器 IT古董人工智能课程机器学习算法神经网络
第二章:机器学习与神经网络概述第三部分：类算法理论与实践第三节：决策树分类器内容：信息增益、剪枝技术、过拟合与泛化能力。决策树是一种常用于分类和回归的树状结构模型，它通过一系列特征判断进行决策，有良好的可解释性。一、基本概念节点（Node）：表示特征判断条件边（Branch）：表示特征判断的结果路径叶子节点（Leaf）：表示分类结果二、划分准则：信息增益（InformationGain）信息增益衡
算法练习-02 亮亮爱刷题算法数据结构 c++
今天给大家带来的是第二天的几道练习题，包括几道思路特别巧妙的算法题，以及提升的背包问题，相信这类问题对大家算法能力的提升还是十分有帮助的，希望大家学完可以给博主点一个关注。第一题：问题描述给定一个长度为n的数组a，小蓝希望从数组中选择若干个元素（可以不连续），并将它们重新排列，使得这些元素能够形成一个先严格递增然后严格递减的子序列（可以没有递增部分或递减部分）。你需要求出在满足这个条件下，最多可以
我的世界模组开发进阶教程——机械动力的数据生成（2） lemon_sjdk 我的世界模组开发 java
==这篇文字继续来看看机械动力的数据生成==Create源码AssetLookupAssetLookup是Minecraft模组开发中用于简化数据生成的工具类，专注于自动处理方块（Block）和物品（Item）的模型（Model）文件路径生成与状态映射。其核心功能是根据规则动态构造资源路径，并适配不同状态（如供电状态、指示器数值）的模型。以下从两个维度详细解析：一、String...语法：Java
基于Redis分布式的限流 chi_666 redis 分布式数据库
以下是基于Redis实现分布式限流的Java解决方案，包含多种限流算法和完整实现代码：一、限流算法选择与实现1.固定窗口算法（SimpleRateLimiter）publicclassRedisFixedWindowRateLimiter{privatefinalStringRedisTemplateredisTemplate;privatefinalStringscript="localcurr
Launcher3源码分析(CellLayout) pnying
CellLayout是workspace的屏幕。CellLayout中的一些重要属性:intmCellWidth;intmCellHeight;//每一个屏幕的行列数intmCountX;//每一行的item个数intmCountY;//每一列的item个数//item之间的距离intmWidthGap;//item之间的宽度intmHeightGap;//item之间的高度构造方法publicC
Web中间件性能调优指南：线程池、长连接与负载均衡的最佳实践编程实战派-李工《Java 负载均衡中间件优化 Tomcat调优 Nginx配置性能工程线程池技术 Keep-Alive优化
目录引言一、Web容器线程池配置不当1.1线程池参数的核心作用与影响1.2线程池大小计算模型1.3动态调优实践二、Keep-Alive机制配置缺陷2.1Keep-Alive的工作原理2.2典型配置问题与影响2.3优化配置建议三、负载均衡策略缺失3.1负载均衡的核心价值3.2主流负载均衡算法对比3.3Nginx关键配置优化四、全链路压测与调优方案4.1压测实施流程4.2典型优化案例4.3持续监控体系
从入门到精通：前端工程师必学的 JSON 全解析前端视界前端 json 状态模式 ai
从入门到精通：前端工程师必学的JSON全解析关键词：JSON、前端工程师、数据交换、JavaScript、数据格式摘要：本文围绕前端工程师必学的JSON展开全面解析。从JSON的基本概念、背景知识入手，深入探讨其核心原理、算法实现、数学模型等方面。通过详细的代码示例和实际应用场景分析，帮助前端工程师从入门到精通掌握JSON的使用。同时，提供了丰富的学习资源、开发工具和相关论文推荐，最后对JSON的
Docker安装Mysql、配置文件挂载、修改Mysql编码武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
1.下载mysql镜像dockerpullmysql:5.72.查看镜像dockerimages3.启动mysql镜像#1.设置端口映射3306:3306、#2.设置文件挂载#3.设置mysql密码为“root”sudodockerrun-p3306:3306--namemysql\-v/mydata/mysql/mysql-files:/var/lib/mysql-files\-v/mydata
【网络安全】对称密码体制 Hacker_xingchen web安全安全网络
1.对称密码体制概述1.1定义与特点对称密码体制，也称为单钥密码体制，是一种加密方法，其中加密和解密过程使用相同的密钥。这种加密方式的主要特点包括简单、高效和计算速度快，适合于大量数据的快速加密和解密。对称密码体制的安全性完全依赖于密钥的保密性，一旦密钥被泄露，加密的安全性就会受到威胁。效率：对称密码算法通常比非对称密码算法要快，因为它们的算法结构相对简单，计算量较小。密钥管理：对称密码体制的密钥
并发编程——并发基础：守护线程和非守护线程 zlj1217 并发编程 java 后台线程守护线程并发基础
前言最近在复习的时候，发现一个运行线程池拒绝策略demo中的main方法在运行了之后，进程并没有关闭。看了jconsole线程池中的线程都处于waiting状态。这里是跟我设置线程池的线程工厂中的设置线程是否为后台线程有关。后台线程和非后台线程后台线程，也叫守护线程，指的是在程序运行的时候后台提供一种通用服务的线程，比如jvm里垃圾回收线程，这种线程并不属于程序中不可或缺的部分。因此，当所有的非守
【AI大模型】Spring AI 基于Redis实现对话持久存储详解小码农叔叔 AI 大模型应用到项目实战高手 springboot 入门到精通项目实战 Spring AI会话存储 Spring AI会话记忆 Spring AI持久化会话 Spring AI会话持久化 Spring AI会话 Spring AI记忆
目录一、前言二、SpringAI会话记忆介绍2.1SpringAI会话记忆概述2.2常用的会话记忆实现方式2.2.1集成数据库持久存储会话实现步骤2.3适用场景三、SpringAI基于内存会话记忆存储3.1本地开发环境准备3.2工程搭建与集成3.2.1添加核心依赖3.3.2添加配置文件3.3.3添加测试接口3.2ChatMemory介绍3.2.1ChatMemory概述3.2.2InMemoryC
SpringBoot-jdbcTemplate访问数据库 xiatianit springboot spring boot 数据库 java
在实际的企业级应用开发中，却很少有人直接使用原生的JDBCAPI进行开发，这是因为使用JDBCAPI对数据库进行操作十分繁琐，需要我们对每一步都做到“步步把控，处处关心”，例如我们需要手动控制数据库连接的开启，异常处理、事务处理、最后还要手动关闭连接释放资源等等。Spring提供了一个SpringJDBC模块，它对JDBCAPI进行了封装，其的主要目的降低JDBCAPI的使用难度，以一种更直接、更
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

EM算法

你可能感兴趣的:(EM算法)