yutianzuijin

基于隐马尔可夫模型的有监督词性标注

代码下载：基于隐马尔可夫模型的有监督词性标注

词性标注（Part-of-Speech tagging 或 POS tagging)是指对于句子中的每个词都指派一个合适的词性，也就是要确定每个词是名词、动词、形容词或其他词性的过程，又称词类标注或者简称标注。词性标注是自然语言处理中的一项基础任务，在语音识别、信息检索及自然语言处理的许多领域都发挥着重要的作用。

词性标注本质上是一个分类问题，对于句子中的每一个单词W，找到一个合适的词类类别T，也就是词性标记，不过词性标注考虑的是整体标记的好坏，既整个句子的序列标记问题。对于分类问题，有很多现成的数学模型和框架可以套用，譬如HMM、最大熵模型、条件随机场、SVM等等，在本博客中我们介绍基于隐马尔可夫模型（HMM）的词性标注。

1 隐马尔可夫模型（HMM）

隐马尔科夫模型(HMM)是什么？说白了，就是一个数学模型，用一堆数学符号和参数表示而已，包括隐藏状态集合、观察状态集合、初始概率向量, 状态转移矩阵A，混淆矩阵B。

在wiki上一个比较好的HMM例子，浅显易懂地介绍了HMM的基本概念和问题，初次接触HMM的人可以首先看一下这个例子。在Hidden Markov Models网站，更加详细地介绍了HMM，在此我们借用该网站中的例子和图进一步介绍HMM。

想象一个这样的场景：一个诗人因为抨击当权派被打入地牢中，在暗无天日的地牢中诗人不想无所事事，整日沉沦，所以他每天都在墙上写诗抒发情感。某日，他在地牢的墙角发现一些苔藓。在毫无生机的地牢里能发现另一种生命让他深感欣慰，每天都与苔藓对话。几天之后他发现一个现象，苔藓有时湿润，有时干燥，他猜想这可能和外面未知的天气有关。

根据上面的描述，我们可以构造一个HMM，然后利用苔藓的状态来预测天气。首先，天气是未知的状态，是需要推测的量，在HMM中就是隐藏状态。为了简化起见，假设诗人被捕的地牢外面只有三种天气状态：晴天（Sun）、雨天（Rain）和阴天（Cloud），如图一所示。

图一天气状态转换图

状态转换可以分为确定型的和非确定型的，交通灯的状态转换是确定型的，也即在红灯之后我们肯定知道下一个状态是绿灯。但是天气状态的转换是非确定型的，也即今天是晴天，不能确定明天是什么天气（即使现在的天气预报非常准确，我们还是无法100%知道明天的天气，其实明天的世界有很大的不确定型）。不确定型的状态转换需要采用概率模型来描述它们之间的状态变化。图二描述了地牢外面天气的状态转移矩阵：

图二天气的状态转移矩阵

上述矩阵是行随机的（row stochastic），每一行的概率相加是1，含义是不管昨天什么天气，今天肯定是（sun,cloud,rain）天气中的一种，只是每一种天气发生的概率不同。假设有N个状态，隐藏状态的状态转移矩阵就是一个N*N的矩阵，通常称为A。

此外，我们还需要一个不同天气发生的先验概率，也即地牢外面常年统计获得的三种天气发生概率，通常称为

。假定（sun,cloud,rain）发生的先验概率为：

现在我们已经有HMM的两个参数，还缺一个关于观测状态的参数。在地牢中，诗人可以观测的量只有苔藓的状态，为简化起见，假设苔藓的变化只有四种状态：非常潮湿（Soggy）、潮湿（Damp）、干燥（Dryish）和非常干燥（Dry）。这些可观测的状态都和隐藏的天气相关，如图三所示。每一个隐藏的天气状态都可能会产生苔藓的四种状态，又只是概率不同而已。为了描述这个概率，需要引入一个混淆矩阵（confuse matrix），又叫发射矩阵。用来描述不同天气状态下产生苔藓不同状态的概率，如图四所示。

图三隐藏天气状态和观测状态之间的关系

混淆矩阵描述了HMM的第三个参数，通常称为B。假定有M个可观测状态，则混淆矩阵是N*M的矩阵，并且每一行的概率为1，表示在某个天气状态下，苔藓肯定属于（Soggy，Damp，Dryish，Dry）中的一种状态。

图四 HMM的混淆矩阵

整个HMM就是由上述三元组构成，可以用HMM表示。知道了这三个参数，我们就可以完全了解整个HMM。HMM可以用来解决三个问题：

给定一个模型，如何计算某个特定的观测序列的概率；
给定一个模型和某个特定的观测序列，如何找到最可能产生这个输出的隐藏状态序列；
给定足够的观测数据，如何估计HMM的三个参数。

在语音识别领域，主要关注第一和第三个问题，在词性标注中主要关注第二和第三个问题。解决第一个问题的用途是：在有多个HMM的情况下，选择使概率最大的HMM。在语音识别领域，需要对每个词构建一个HMM模型，就将语音识别成概率最大的HMM对应的词。解决第二个问题的用途是可以知道观测序列最有可能的隐藏状态序列，词性标注就是解决这个问题。第三个问题对所有应用HMM的人来说都非常重要，但是也最难，也即训练模型参数。HMM的三个参数并不是凭空想出来的，而是训出来的。

第一个问题可以通过前向算法快速解决，第二个问题需要利用Viterbi算法解决，第三个问题则有两种方法解决：有监督或者无监督。有监督的参数训练通过标注训练集统计获得相关参数，难度较低；无监督的参数训练则通过鲍姆-韦尔奇算法迭代训练获得，难度很大。在此我们介绍有监督的词性标注，也即HMM参数的训练通过统计语料库获得。

2 词性标注

词性标注的目的就是对给定的句子先分词，然后给每一个词标注不同的词性。很明显可以看出，HMM中的可观测序列就是词性标注中给定句子的分词，而隐藏状态就是不同的词性，词性的先验概率即是参数所以，为了实现对句子的词性标注，我们需要首先利用语料库训练一个HMM，然后再对句子进行分词和标注。

2.1 中文分词

我们首先介绍中文分词。这是因为用户输入的是一个完整的句子，并不能直接得到可观测序列。采用统计语言模型的中文分词，效果已经非常好，可以认为中文分词是一个已经解决了的问题。不过，这又需要训练一个新的马尔可夫模型，不属于本博客考虑的范围。在此，我们实现了一种最简单的中文分词：总左往右扫描句子，然后查找词库，找到最长的词匹配，遇到不认识的字串就分割成单字词。

在代码中，我们有一个接近35w的词库，词库中的词语按照unicode码排序，可以方便地查找。在分词时，首先将词库读到内存中，然后将句子按照从左往右最长匹配原则查找词库。由于词库按照unicode码排序，所以我们可以采用二分快速查找词组。查找时，我们首先读取原始句子的第一个字，定位到该字在词库中的起始位置和结束位置，然后进行二分查找即可。在查找的过程中记录起始和结束位置之间所有词的最大长度，然后从最大长度开始查找词库，长度逐一递减，直到找到为止。图五简单描述了分词的过程：

图五中文分词示意图

2.2 HMM参数训练

HMM需要训练的参数有三个，即。表示词性的先验概率，A表示词性之间的状态转移矩阵，B表示词性到词的发射矩阵或者混淆矩阵。本博客采用有监督的方式训练上述三个参数。有监督的方式，也即通过统计语料库中的相关信息训练参数。图六是我们采用的语料库的部分截图，每一行都是一个完整的被标注过的句子。

图六部分语料库

HMM参数训练就是通过分析上述语料库获得HMM的三个参数。通过解析上述语料库我们可以获得：每个词性出现的次数，每个词性及其后继词性出现的次数和词性对应的词。统计完这些信息之后就可以以频率代替概率获得三个参数的值。

统计上述信息的关键是解析语料库，解析通过下面三句正则表达式完成：

// 获取预料语料库中的一个个不同的词组(以空格分开)，词组后附有相应的词性
text = content.toString().split("\\s{1,}"); 
// 去除词性标注，只保存词组
phrase = content.toString().split("(/[a-z]*\\s{0,})");//"/"后面跟着一个或者多个字母然后是多个空格
// 获取语料库中从前往后的所有词组的词性
characters = content.toString().split("[0-9|-]*/|\\s{1,}[^a-z]*"); //开头的日期或者空格+非字母作为分隔符

注释已经详细解释了正则表达式的含义，在此不再赘述。获得上述信息之后，我们就可以很容易地统计相关信息，进而利用频率算概率。词性先验概率的计算没有任何难度。隐藏状态转移矩阵按照公式：

来计算，

表示不同的两个词性前后出现的次数，

表示词性

出现的次数。可观测状态的发射矩阵按照公式：

来计算，

表示某个词和某个词性同时出现的次数。在计算频率的时候，由于有些值非常小，为了避免后面计算过程中的下溢，我们统一将计算的结果乘以100。个人不能保证这种方法的可靠性，事实上，对于频数为零或者频数很小的情况，我们需要按照古德-图灵估计重新计算（数学之美P34），之后求最优隐藏序列需要采用log方式。在此，为了简便，忽略这些细节（不要在意这些细节☺）。假设通过分析语料库，最后获得了N个词性，M个词组，则

就是一个长度为N的向量，A是一个N*N的句子，B就是一个N*M的矩阵。后面对句子进行词性标注时，要确保分词后的词组都在M中，否则就超出了HMM的处理能力。

2.3 再次分词

一般情况下，完成HMM参数训练之后，我们就可以利用HMM完成一些具体的事情。不过，在这之前对于我们的词性标注系统，还需要进一步分词。我们采用的分词方法是从左往右，最大匹配模式。但是程序中采用的语料库却倾向于最小匹配模式。所以我们初次分词的结果有可能不在语料库中。在此我们将语料库不能识别的词组再次进行分词尝试让算法找到更多的词。

再次分词的算法很简单。既然我们已经统计了HMM中出现过的所有可观测状态M，则将分词的结果在所有的状态中查找即可。找不到的分词分成两部分作为新的分词。

2.4 Viterbi算法

终于要说到大名鼎鼎的Viterbi算法了，但是从难度上来说，它远不如模型的参数训练麻烦，所以其实它很简单。为了更数学化的描述该算法，我们先声明几个符号：

：隐藏状态的先验概率；
：隐藏状态的转移矩阵，每一项表示从状态转移到状态的概率；
：隐藏状态产生观测状态的发射矩阵或混淆矩阵，每一项表示隐藏状态产生观测状态的概率；

在介绍Viterbi算法在计算隐藏状态序列的优越性之前，我们先考虑穷举算法。还是考虑一开始的诗人天气预测问题。假设诗人连续三天观测到苔藓的状态为（dry，damp，soggy），现在要求最可能的天气状态。最简单但是最笨的方法是将三天的所有天气组合罗列出来，然后求每一种组合的概率，选择概率最大的组合即可，如图七所示。

图七观测序列的所有可能隐藏序列组合

按照上面穷举算法，最可能的状态序列求法如下：

假定有T个可观测状态，给定一个隐藏状态序列，计算复杂度为O(2T)，所以总的复杂度为O(2TN^T)。显然这个复杂度为指数级，无法应用到实际中，基于动态规划的Viterbi算法应运而生。

既然要求最可能的隐藏状态序列，则其必然满足该序列发生的可能性最大，同时子序列也满足最优子结构： x₀,x₁,…,x_t发生的概率也必须最大，否则可以替换成概率更大的序列，从而产生更好的序列，这与前提矛盾。DP算法有两个关键点：递归方程和初始化。假定我们现在已经求得了最可能发生的前 t个隐藏状态，在求 t+1个状态时，我们需要从第 t个状态中选择最优的一个状态。由于在时刻 t，共有 N个可以选择的隐藏状态，所以 t+1时刻的计算就是从这 N个状态中选择一个使 t+1状态概率最大的。初始化主要是依赖于先验概率。由此可得Viterbi算法的步骤：

令，i=0,1,…,N-1；
对t=1,2,…,T-1，i=0,1,…,N-1，计算：
在时刻T-1会得到以N个不同状态结尾的概率，选择概率最大的状态：
计算最大概率不是目的，目的是要找到使概率最大的隐藏序列，这就需要保存每一步计算过程中选择的最优状态，然后回溯即可。

Viterbi算法的计算可以通过图八说明。黄色的一列是需要初始化的列，红色方格的计算依赖绿色的列，最后结果是蓝色列中的最大值。计算完成之后，再通过回溯找到最优的隐藏状态序列。

图八Viterbi算法的矩阵计算过程

有了Viterbi算法，我们就可以快速获得最优的隐藏序列，由于图八中的矩阵总共有N*T个元素，每个元素的计算复杂度为O(N)，所以总的复杂度为O(TN²)。在实际的实现过程中，我们最好将隐藏状态和观测状态交换一下位置，也即对上述矩阵进行转置，这是因为如果按照图八的方式，每一列元素实际上是不相邻的，这会导致非常严重的cache缺失，从而会使计算性能下降，图示只是为了描述方便才这样画的。

3 总结

针对词性标注，我们在利用HMM时需要解决两个问题：HMM三个参数的训练和寻找最优隐藏序列。在词性标注领域，存在非常多的语料库，所以我们采用有监督的训练方式获得HMM参数，然后利用Viterbi算法求最优隐藏序列。整个算法的关键在于理解HMM，只有真正理解了，后面的所有任务都可以轻而易举地解决。

4 参考资料

[1] 数学之美3,4,5,26章；

[2] 隐马尔可夫模型；

[3] A revealing introduction to hiddenmarkov models；

[4] HMM在自然语言处理中的应用一：词性标注。

K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
OpenCV3最常用的基本操作 HeoLis
OpenCV介绍OpenCV的全称是OpenSourceComputerVisionLibrary，是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。该程序库也可以使用英特尔公司的IPP进行加速处理。以上是维基百科关于OpenCV的介绍，简单来说它就是处理图
EI检索-机器视觉、图像处理与影像技术国际学术会议（MVIPIT 2023）邀您参会！诗远Yolanda 图像处理人工智能计算机视觉
机器视觉是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。而图像处理等技术的快速发展也推动了机器视觉的发展。机器视觉在我国具有广泛的工业应用，核心功能包括：测量，检测，识别，定位等。第一届机器视觉、图像处理与影像技术国际学术会议（MVIPIT2023）将于2023年7月26日-28日在浙江杭
Java在智能数据挖掘系统的应用 lizi88888 java 数据挖掘开发语言
智能数据挖掘系统是利用机器学习、统计分析等技术从大量数据中自动或半自动地发现模式和知识的系统。Java作为一种流行的编程语言，因其强大的性能和丰富的生态系统，在智能数据挖掘领域的应用非常广泛。本文将探讨Java在智能数据挖掘系统中的应用，并提供示例代码。智能数据挖掘系统概述智能数据挖掘系统通常具备以下功能：数据预处理：包括数据清洗、归一化、特征选择等。模式识别：识别数据中的模式，如分类、聚类、关联
图形几何算法 -- 凸包算法 CAD三维软件二次开发算法学习算法 c#3d 几何学
前言常用凸包算法包括GrahamScan算法和JarvisMarch(GiftWrapping)算法，在这里要简单介绍的是GrahamScan算法。1、概念凸包是一个点集所包围的最小的凸多边形。可以想象用一根绳子围绕着一群钉子，绳子所形成的轮廓便是这些钉子的凸包。在计算几何中，凸包得到了广泛的应用，涉及领域包括模式识别、图像处理和优化问题等。2、算法原理凸包算法的目标是从给定的点集（在二维平面中）
深度学习入门：使用 PyTorch 构建和训练你的第一个神经网络 Mr' 郑深度学习 pytorch 神经网络
引言深度学习是机器学习的一个分支，它利用多层非线性处理单元（即神经网络）来解决复杂的模式识别问题。PyTorch是一个强大的深度学习框架，它提供了灵活的API和动态计算图，非常适合初学者和研究者使用。安装PyTorch确保安装了Python和pip。然后通过以下命令安装PyTorch：pipinstalltorchtorchvision导入库我们需要导入一些必要的库：importtorchimpo
机器学习算法深度总结(5)-逻辑回归婉妃
1.模型定义逻辑回归属于基于概率分类的学习法.基于概率的模式识别是指对模式x所对应的类别y的后验概率禁行学习.其所属类别为后验概率最大时的类别:预测类别的后验概率,可理解为模式x所属类别y的可信度.逻辑回归(logistic),使用线性对数函数对分类后验概率进行模型化:上式,分母是满足概率总和为1的约束条件的正则化项,参数向量维数为:考虑二分类问题:使用上述关系式,logistic模型的参数个数从
计算机视觉概念科普极客代码玩转AI 人工智能图像处理计算机视觉深度学习
计算机视觉（ComputerVision,CV）是一门多学科交叉的科学，旨在让计算机具备“看”的能力，即通过图像或视频数据来理解世界。它结合了信号处理、图像处理、模式识别、机器学习等多个领域的技术，让计算机能够执行诸如识别、分类、追踪等复杂的视觉任务。本文将深入探讨计算机视觉的核心概念和技术。一、计算机视觉概述计算机视觉是一门研究如何让计算机“看”世界并从中获取信息的科学。它主要关注如何处理、分析
机器学习（ML）算法分类活蹦乱跳酸菜鱼机器学习
机器学习（ML）算法是一个广泛而多样的领域，涵盖了多种用于数据分析和模式识别的技术。以下是一些常见的机器学习算法分类及其具体算法：一、监督学习算法监督学习算法使用标记（即已知结果）的训练数据来训练模型，以便对新数据进行预测。线性回归：用于建立连续变量之间的关系，通过拟合一条直线或超平面来预测新数据的输出值。逻辑回归：虽然名称中包含“回归”，但实际上是用于分类问题，特别是二分类问题。通过将线性回归模
让数据说话：人工智能与六西格玛的完美结合张驰课堂人工智能六西格玛
当人工智能与六西格玛结合，企业可以充分利用人工智能技术的数据处理、预测分析和智能决策支持能力，实现数据驱动的决策、质量控制和流程优化，从而提高企业的效率和竞争力。下面张驰咨询给大家具体的介绍：1、数据驱动决策六西格玛侧重于数据分析和决策制定，而人工智能可以提供更强大的数据处理和分析能力。通过人工智能技术，可以自动收集和整理大量的数据，并进行有效的数据挖掘和模式识别。这些数据分析结果可以为六西格玛项
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
基于Python和OpenCV的产品码识别与验证案例 GT开发算法工程师 python opencv 开发语言人工智能计算机视觉
引言：本案例展示了如何使用Python结合OpenCV库来实现产品码的识别与验证。首先，通过图像预处理技术（如灰度化、二值化、降噪等）优化产品码图像，然后利用OpenCV中的模板匹配或机器学习算法（如SVM、神经网络等）来定位并识别产品码。目录原理：代码部分：注意：原理：产品码识别与验证的核心在于图像处理与模式识别技术。首先，通过图像处理技术提取出产品码区域，去除背景干扰，增强产品码的可识别性。然
《模式识别与机器学习》第一章 CS_Zero 机器学习人工智能
C1符号含义x\boldxx：向量，曲线拟合问题中的x坐标数值序列。元素个数为N。t\boldtt：向量，曲线拟合问题中的y坐标(target)数值序列。w\boldww：向量，曲线拟合问题中的待估计的参数，即M阶多项式的各阶系数。β\betaβ：标量，协方差的倒数，表示样本的精度。α\alphaα：标量，同上，曲线拟合例子中的先验的精度。多项式曲线拟合E(w)=12∑n=1N{y(xn,w)−t
六、图像的几何变换云峰天际计算机视觉人工智能 opencv 人工智能计算机视觉
文章目录前言一、镜像变换二、缩放变换前言在计算机视觉中，图像几何变换是指对图像进行平移、旋转、缩放、仿射变换和镜像变换等操作，以改变图像的位置、尺寸、形状或视角，而不改变图像的内容。这些变换在图像处理、模式识别、机器人视觉、医学影像处理等领域具有广泛的应用。通过图像几何变换，可以实现图像的校正、配准、增强和重建等功能，为后续的图像分析和理解提供了重要的基础。一、镜像变换水平镜像（水平翻转）其原理是
RBF神经网络中的RBF的英文全称是什么，是用来干什么的？神笔馬良神经网络人工智能深度学习
问题描述：RBF神经网络中的RBF的英文全称是什么，是用来干什么的？问题解答：RBF神经网络中的RBF是径向基函数（RadialBasisFunction）的缩写。径向基函数是一种在机器学习和模式识别中常用的函数类型，它们通常用于构建非线性模型。在RBF神经网络中，径向基函数被用作隐藏层的激活函数，用来将输入数据从输入空间映射到一个高维的特征空间，从而实现非线性的数据拟合和模式识别。具体来说，径向
用脑想问题还是用心驱动脑? 风口猪炒股指标抢财猫股票课堂我的思想大火拼脑心关系
昨天回答了几个朋友的问题，我发现提问题的人很少，这让我想起之前讲的小妞子的故事，我问了她好几个月的同一句话：你有问题吗？结果她很反感，嘿嘿。其实吧，我讲的很多东西都是实的，反而我们感知不到的日常以为真的东西其实是不真实的。比如说眼见为实，真正是眼睛看到的是你认识的真实的吗？不是，因为你脑子里有模式识别了才被识别出来，如果脑子里没有模式就无法识别，即便眼睛看到了也会忽略掉。那追问下去，如果脑子无法识
【专题】2023年中国手术机器人行业专题报告PDF合集分享（附原数据表）
原文链接：https://tecdat.cn/?p=34144仿生机器人作为一类结合了仿生学原理的机器人，具备自主决策和规划行动的能力，正逐渐进入大众视野。它们的核心技术要素包括感知与认知技术、运动与控制技术、人机交互技术和自主决策技术。阅读原文，获取专题报告合集全文，解锁文末68份仿生机器人相关行业研究报告。感知与认知技术涵盖了各种传感器的应用、模式识别和情感理解等高级认知能力，而运动与控制技术
计算机视觉主要知识点 superdont 计算机视觉人工智能
计算机视觉是指利用计算机和算法来解析和理解图片和视频中的内容。这是一个跨学科领域，融合了计算机科学、图像处理、机器学习和模式识别等多方面的技术。以下是一些计算机视觉入门的基本知识点：图像基础：像素：图片的最基本组成单元，包含了颜色信息。色彩空间：如RGB（红、绿、蓝）、HSV（色调、饱和度、明度）等，不同色彩空间代表图像色彩的方式不同。图像类型：位图（Bitmap）与矢量图（Vector），位图由
探索未来：集成存储器计算(IMC)与深度神经网络(DNN)的机遇与挑战繁依Fanyi dnn 人工智能神经网络深度学习机器学习 git windows
开篇部分：人工智能、深度神经网络与内存计算的交汇在当今数字化时代，人工智能（AI）已经成为科技领域的一股强大力量，而深度神经网络（DNN）则是AI的核心引擎之一。DNN是一种模仿人类神经系统运作方式的计算模型，通过层层堆叠的神经元网络来实现复杂的模式识别和数据处理任务。从图像识别、语音识别到自然语言处理，DNN已经在各个领域展现了惊人的能力。然而，随着DNN模型的不断演进和复杂化，对计算资源的需求
机器学习系列——（十七）聚类飞影铠甲机器学习机器学习聚类人工智能
引言在当今数据驱动的时代，机器学习已经成为了解锁数据潜能的关键技术之一。其中，聚类作为机器学习领域的一个重要分支，广泛应用于数据挖掘、模式识别、图像分析等多个领域。本文旨在深入探讨聚类技术的原理、类型及其应用，为读者提供一个全面而深入的了解。一、什么是聚类？聚类是一种无监督学习（UnsupervisedLearning）技术，它的目标是将相似的对象分组到一起，形成簇（Cluster）。与有监督学习
「论文搬运」王亦洲课题组 CVPR 2021 入选论文解读：时间序列疾病预测的因果隐马尔可夫模型 Sternstunden 论文计算机视觉人工智能深度学习 cvpr
本文是对发表于计算机视觉和模式识别领域的顶级会议CVPR2021的论文“CausalHiddenMarkovModelforTimeSeriesDiseaseForecasting（时间序列疾病预测的因果隐马尔可夫模型）”的解读。该论文由北京大学王亦洲课题组与深睿医疗等单位合作，针对时间序列疾病预测的问题，提出了因果隐马尔可夫模型描述疾病的动态发展过程，并使用基于VAE的变分框架进行学习。通过对图
探秘深度学习的巅峰之作：ResNet101与其在图像识别领域的革命性应用程序员Chino的日记深度学习人工智能
引言深度学习和图像识别的世界已经被深度卷积神经网络的引入所革命化，而在这些网络中，ResNet101架构作为一个重要的里程碑脱颖而出。本文旨在详细探讨ResNet101架构、其设计、功能和应用。ResNet革命2015年在计算机视觉和模式识别会议（CVPR）上介绍的ResNet（残差网络）家族，标志着深度学习图像识别的一个转折点。这些网络引入了残差学习的概念，解决了深度神经网络中的梯度消失问题，使
LSTM进行时间序列预测还有哪些创新点，有什么推荐的好发论文的模型和代码？电力系统爱好者 lstm 人工智能 rnn
LSTM进行时间序列预测还有哪些创新点，有什么推荐的好发论文的模型和代码？时间序列分析是处理时间相关数据的一种方法，常用于预测、趋势分析和模式识别等应用。下面是一些常见的时间序列分析方法和相应的MATLAB代码示例：移动平均法：%计算简单移动平均data=[1,2,3,4,5,6];windowSize=3;movingAverage=movmean(data,windowSize);自回归模型（
机器学习简要概述 @Duang~ 机器学习机器学习人工智能算法
一、基本概念及应用传统机器学习算法首先需要对数据进行特征提取，采用分类器（如决策树、人工神经网络、贝叶斯、集成学习、支持向量机等）进行分类。机器学习：特征提取+分类器分类特征提取难，制约发展。深度学习出现，一定程度解决了特征提取的难题，机器学习繁荣起来。机器学习+数据库=数据挖掘+工业应用=模式识别+图像处理=机器视觉+语音处理=语音识别+文本处理=自然语言处理二、数据集及模型数据集的划分：方法：
大脑的工作原理珊珊_带你重返年轻
今天继续阅读《微习惯》第二章，大脑的工作原理。今天这一章有点烧脑。大脑分成两个部分-潜意识部分和意识部分。重复就是（潜意识）大脑使用的语言。建立习惯的目标是用重复来改变大脑。事实上改变习惯的两个关键点是重复和回报，如果有回报，大脑更愿意重复做一件事。我们的行为中有45%是自动完成的，无须思考的。大脑是由执行决策和进行自动行为模式识别的两部分组成的系统。前额皮层的管理功能相当活跃，反应灵敏，但同时也
计算机视觉比较有名的期刊和会议 anycedo
中文SCI级：《物理学报》《红外与毫米波学报》etc.（IF比较低，也不是特别专门针对计算机视觉）EI级：《自动化学报》《光学精密工程》《电子学报》《软件学报》《计算机研究与发展》《计算机学报》《计算机辅助设计与图形学学报》《系统工程与电子技术》、一些大学的学报，etc.（质量参差不齐）中文核心《中国图象图形学报》《模式识别与人工智能》《机器人》《图学学报》《电光与控制》etc.国际会议1.ICC
工信部颁发的《计算机视觉处理设计开发工程师》中级证书人工智能技术与咨询人工智能计算机视觉自然语言处理
计算机视觉（ComputerVision）是一门研究如何让计算机能够理解和分析数字图像或视频的学科。简单来说，计算机视觉的目标是让计算机能够像人类一样对视觉信息进行处理和理解。为实现这个目标，计算机视觉结合了图像处理、机器学习、模式识别、计算几何等多个领域的理论和技术。计算机视觉在许多领域和行业中具有广泛应用，如自动驾驶、医疗影像分析、无人机、智能监控、虚拟现实（VR）和增强现实（AR）等。随着深
【大厂AI课学习笔记】1.5 AI技术领域（2）语音识别 giszz 学习笔记人工智能人工智能学习笔记
今天来梳理语音识别相关的关键技术和发展脉络。语音识别：定义、关键技术、技术发展、应用场景与商业化成功一、语音识别的定义语音识别，也称为自动语音识别（ASR），是指将人类的语音转换为机器可读的文本或命令的技术。它是人机交互的重要组成部分，旨在让计算机能够理解并执行人类的语音指令。语音识别技术涉及到信号处理、模式识别、自然语言处理等多个领域的知识。二、关键技术信号处理和特征提取：语音信号是一种复杂的时
深度学习在智能交互中的应用：人与机器的和谐共生 wd90119 深度学习人工智能
深度学习与人类的智能交互是当前人工智能领域研究的热点之一。深度学习作为机器学习的一个重要分支，具有强大的特征学习和模式识别能力，可以模拟人脑的神经网络进行数据分析和预测。而人类的智能交互则是指人类与机器之间的信息交流和操作互动，包括语音识别、图像识别、自然语言处理等技术。深度学习与人类的智能交互相结合，可以实现更加自然、高效和智能的人机交互方式。例如，通过深度学习的语音识别技术，机器可以理解和识别
深度学习的进展 csdn_aspnet 深度学习人工智能
一、深度学习的基本原理和算法：深度学习是一种基于神经网络的机器学习方法，其基本原理是模仿人脑神经网络的结构和功能，通过多层次的神经网络模型来实现对数据的学习和模式识别。以下是深度学习的基本原理和算法：1、输入层：深度学习的输入层接收原始数据，这可以是图像、文本、音频等各种形式的数据。2、隐藏层：深度学习的核心是多层的隐藏层。每一层都由大量的神经元（节点）组成，每个神经元都与上一层的所有神经元相连，
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理