weixin_39569051

hmm 求隐藏序列_一文说懂HMM到CRF的内在关系

这篇文章都讲些啥？

关于HMM和CRF的文章很多，但是大多数都是一上来就直接讲概率学习问题、预测问题。而没有交代这两个算法适用于解决哪些问题，有什么内在的关系，算法又是依据什么思路想出来的。这篇文章就试图回答这些问题。文章会讲解模型训练的一些计算细节和训练思路，但更多的是想通过理清这些过程，来实现从具象到抽象的理解过程。如果直接上来就讲抽象的认识，记忆和理解都会不够深刻。

一、HMM的适用场景和模型训练

在NLP任务中，词性识别是很早期的一个经典任务，HMM就是为了解决这个问题而诞生的，当然它也适用于所有具有隐状态的序列事件，通过观测序列来找出序列中各个事件背后的隐状态。

HMM和CRF都是概率模型和图模型的结合。HMM由贝叶斯模型发展而来，其精华在于能对具有隐状态的事物的变化过程建模，它的局限性在于当利用当前事物的状态来预测隐状态时，假设太多，一是假设事件的观测值只和当前的隐状态有关，二是假设事件的隐状态只和前一个事件隐状态有关。但是事实上并不是这样。比如就文本而言，一个词的生成可能和前面的好几个隐状态都有关系，像介词后面会加名词，那么介词这个隐状态就影响到了文本到底会生成哪一个名词。

下面简单交代一下使用HMM主要需要解决的三大问题。它们分别是训练模型时的参数学习问题，然后运用模型时的概率计算问题和预测状态问题。每个问题中具体参数代表的含义，以及计算过程大家可以参考别的帖子，毕竟这方面已经有很多很好的帖子，重新把已有的东西再说一遍也没有意义。

1.1 模型学习问题

已知观测序列

，估计模型λ=(A,B,π)的参数，使得在该模型下观测序列概率P(O|λ)最大。这里有两种方法，有监督和无监督方法。有监督就是通过人工将文本序列背后的隐状态，比如每个词是哪种词性都标识出来，只需要统计个数，就能够得到(A,B,π)这三个参数。而无监督方法则是EM算法求解得到参数，具体过程可以参考：

一只懒羊：一文说懂EM算法及其在HMM和GMM中的应用zhuanlan.zhihu.com

1.2 模型概率计算问题

给定了模型λ=(A,B,π)和观测序列

，计算该观测序列任意长度出现的概率。我们可以使用直接计算法，列举所有可能的长度为T的状态序列

，然后求各个状态序列

和观测序列

的联合概率P(O,I|λ)，但是这样的计算复杂度会很高。既然不想列举所有的状态，但是又不知道每个文本对应的隐状态是什么，那么就在每一步都考虑所有的状态。这就是前向和后向算法。他们的区别只在于计算概率的方向不同，前者是从序列的头开始计算概率，后者从序列的尾部开始计算。

为了简单说明，我们假设事件只有2种隐状态A和B，从时刻t到时刻t+1，假设时刻t+1隐状态为

，那么从观测序列得到状态A的概率为

，考虑到时刻t也有两种隐状态

，都可能导致

，所以把他们分别相乘然后相加得到

，那么再对

做相同的操作，得到

，最后两者相加就是目前长度下文本的概率，即P(O|λ)。

1.3 预测问题

所谓预测问题，就是已知模型和观测序列

，求对给定观测序列条件概率P(I|O)最大的状态序列

。

在这里我们先来想一下动态规划的精髓，什么情况下能用动态规划。那就是全局最优路径一定包含局部最优路径。这是什么意思呢？依然假设事件有2种隐状态A和B，时刻t的两种隐状态
，都可能到达

，即文本序列中，当前时刻的任意隐状态都可以到达下一时刻的任意隐状态，这时候路径是连通的，也就意味着算法可以找到局部最优路径，也就意味着可以用动态规划，而用于预测问题中（inference）的动态规划就是维特比算法！

一个反例是这样：

如果路径如上图所示，第二层的节点和第三层的一部分节点之间没有连通（节点间的转移概率未知），那就无法使用动态规划了。而现在的情况如下图所示，每一层节点之间状态转移的概率都已知。

比如在考虑t+1时刻的状态A时，会计算t时刻的各个状态，在我们例子中是

，到状态

的概率，找出最大概率是由t时刻的哪个状态得到的，从而确定这两个时刻之间的路径

。这样沿着序列不断的计算每个状态的概率，我们可以得到整个序列前后两个时刻之间的路径，通过找到序列结尾的最大概率的状态，我们可以溯源前一个时刻的状态，因为之前在计算每个状态的概率时就已经保存了得到最大概率的路径，从而溯源得到整个序列的状态。

维特比算法大大改善了算法的时间复杂度，原来的穷举法时间复杂度为O(2^N)，N是文本序列的长度，而维特比的时间复杂度为O(N*(m^2))，其中m表示隐状态的数量，之所以是m^2，是因为维比特每次只需要考虑两个观测变量之间的隐变量的转移概率

具体计算过程可以参考以下的链接：

隐马尔科夫模型HMM（四）维特比算法解码隐藏状态序列 - 刘建平Pinard - 博客园www.cnblogs.com

二、从HMM到MEMM，再到CRF

2.1 CRF是怎么来的？

我们知道HMM的缺陷在于它假设某个观测结果只受当前隐状态的影响，那么我们能否改变模型，让某个观测结果能受到多个隐状态的影响呢？于是我们尝试将模型变成下面的模型：

这样一来，我们原来的表达式

将变成下面下面的式子：

对于式子中的每一项

，如果使用有监督方法去统计的话，很有可能无法出现概率为0的情况，而如果使用EM算法的话，即便计算出

，它也无法计算出

。因此我们想是否能将模型转变一下。

也就是MEMM模型，它改变了依赖关系，认为隐状态取决于前一个时刻的隐状态和整个观测序列，那么模型表达式将变成

。假设我们统计了给定当前隐状态和观测序列，转移到下一时刻每个隐状态的概率，如下图所示，那么我们通过连乘就能找到观测序列的最大概率。这里不同于HMM，并没有发射概率，因为观测序列和隐状态一起用于统计状态转移的概率值了。

这样的计算方法会有什么问题呢？我们可以看到隐状态1只有两种转移可能，而隐状态2却有5种转移可能，而各种转移概率之和需要等于1，这使得在计算连乘时，隐状态2天然就没有优势，无法准确的反映出真实的转移概率。这就是所谓的标签偏置问题。所以我们希望用分数，而不是概率来衡量隐状态之间转移的可能性。因此我们将模型改变成

这就是我们的CRF模型！CRF考虑的是节点之间双向联系的紧密程度，而HMM和MEMM考虑的则是单向的依赖关系。

2.2 CRF的参数学习问题和隐状态预测

那么节点间的联系怎么衡量呢，在这里我们使用无向图的对数线性模型（log-linear model）来衡量节点间的联系。具体表达式如下：

当我们不考虑序列时，我们在上图中衡量节点关系的对数线性函数

，其实就是逻辑回归函数，在逻辑回归函数场景中，可以认为这是在判断一个样本比如

，是否和另一个类比如

有关系，有关系则属于这个类，标记为1，没关系则不属于这个类标记为0，每一个样本由J个特征。之所以叫对数线性函数，是因为取了log以后，函数就会变成线性的形式。

当我们考虑时序时，由于将无向图中的节点分成了几个子团，在CRF模型中，我们将整个观测序列

和

作为一个子团，比如下图红色虚线的三个子团。因此对数线性函数有两个维度，一个是子团的数量T，一个是每个子团特征的数量J。我们现在有了计算子团之间紧密程度的函数，但我们最终要计算得到的是概率值，因此我们需要除以分母

进行归一化。

再仔细看特征函数

，它衡量的是子团中两个隐状态之间以及隐状态和观测序列之间的联系紧密程度，因此我们需要分别定义转移特征和状态特征去表示。建模的具体公式为：

为i处的转移特征，对应权重

,每个

都有J个特征,转移特征针对的是前后token之间的限定。比如：

为i处的状态特征，对应权重

，每个tokeni都有L个特征，比如：

2.2.1 参数学习问题

得到了模型的表达式，我们就需要求解参数，类似于HMM使用EM算法求解参数，只不过CRF是使用求导的方法求转移特征和状态特征的权重。

通过计算可知，要求出对

的导数，需要先求出

的期望E，那么就需要求出式子3，关键就在于求分子和分母，我们先看分母的i怎么求

，也就是所有可能的隐状态序列的求和。那么这里就可以用前向算法来计算，类似于HMM中的概率计算，求t时刻所有特征到t+1时刻的某一特征的状态转移分数，并对t+1时刻的其他隐状态做相同的操作，直到计算到最后的时刻，然后将最后时刻所有隐状态的分数相加，就得到了

。

那么分子怎么求呢？我们求导的是某个子团内部两个隐状态之间的特征权重，因此分子计算只涉及到两个相邻隐状态，这也是下图中从（2）到（3）转换的依据。

而第（3）到第（4）步中两个求和符号

的出现，表示在这两个隐状态确定时，序列中别的状态可能的任何值，需要对所有的取值情况求和。对这两个隐状态之前的概率需要用前向算法计算，它们之后的概率则需要用后向算法计算，而它们之间的概率则使用打分函数即

计算,最后三者相乘除以上面求得的

，才是概率值。

2.2.2 隐状态预测问题

这里和HMM的预测问题类似，都是使用维特比算法来寻找前一个最佳隐状态，通过计算出最大概率来回溯隐状态。

三、HMM与CRF在各方面的对比

3.1 计算上的区别

在HMM单向依赖关系下，使用的是不同隐状态之间的转移概率，以及发射概率来分别表示观测节点和隐状态之间、隐状态和隐状态之间的依赖程度，所以这是我们要求的参数。而在CRF把整个观测序列当做一个节点，考虑这个节点和两个隐状态以及隐状态之间双向的联系程度，这个联系程度使用一个打分函数来衡量，而这个打分函数则需要用多个维度的特征，所以每个特征的权重w是CRF要求的参数。

3.2 适用场景上的区别

HMM模型是一个有向图，有向图即节点之间有明确关系的图，而CRF是无向图，无向图即节点间并没有明确的关系，只知道相互有关联，并且整个图中的节点根据一些内在的性质能被划分为不同的子团。此外，无向图更有利于优化模型，比如上面的MEMM由于不同的隐状态转移的状态数量会不同，概率需要归一化，造成了计算上的不合理，而使用CRF因为约束更宽泛，可以使用更为一般的函数来表示两个隐状态之间的关系。

讲到这里，我们下次在面对问题做模型选择的时候，就应该考虑这个场景的事件间关系是否明确，比如是否单向依赖，某个事件的出现是否只和前一个事件相关，还是和别的所有事件都相关，整个场景属于无向还是有向图。从而决定使用什么模型来解决问题。

3.3 两个模型之间的联系

HMM其实是CRF的特殊形式，CRF的一般性体现在两点，一是CRF考虑了多个特征值，并且用分数来衡量特征值，而非像HMM使用概率衡量。二是CRF考虑了整个观测序列（子团的构成部分）来决定当前的隐状态，而非像HMM只使用当前的观测状态。

如果CRF模型中的

和

取对应HMM中的概率值，且f特征只考虑相邻两个观测值是否相连，而不考虑别的特征，即f函数的结果只取0或1，那么CRF就退化成了HMM模型。

四、关于生成式和判别式模型

讲完了HMM和CRF，我们回过头来看一下文章的头图，HMM是生成式模型，CRF是判别式模型，那么这两个模型的定义是什么，又有什么区别呢？我们用HMM和CRF做例子来详细说明

4.1 生成式模型和判别式模型的区别

生成式模型的表达式为

，y表示标签，在HMM模型中的

就是

，

就是

，事实上这里只用到了

中的参数B和π，也就是初始矩阵和发射矩阵），而

是

，这部分使用了

中的参数A，也就是转移矩阵。在计算概率之前，我们需要先学习参数，从而计算出

这个离散的概率分布。有了概率分布，我们就可以从中生成数据，这就是生成式模型“生成”二字的含义。再比如高斯混合模型中，我们通过学习得到分模型，即男女生的正态分布模型，这里的模型时连续的模型，通过这两个模型采样生成男生和女生的数据。

而判别式模型的表达式是

，顾名思义，即给定一些事物的特征，模型来判定这个事物属于什么事物。比如根据给定的文本，我们可以获得其特征，然后输入CRF模型中，获得文本的隐状态序列。判别式模型适用于拥有大量数据的场景，并且只做判定，所以准确率更高，而生成式模型由于可以生成数据，可以用于数据量不大的场景，当然生成式模型也可以做预测，但是准确率没那么高。

4.2 生成式模型和判别式模型的联系

生成式模型可以表示成

，也可以表示成

，后者的

就是判别式模型，所以说生成式模型可以转换成判别式模型，用于做分类（判别）任务。

【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
基础实验3-2.4 出栈序列的合法性(栈和队列的运用c语言) Feliz.. 数据结构数据结构
题目:给定一个最大容量为m的堆栈，将n个数字按1,2,3,...,n的顺序入栈，允许按任何顺序出栈，则哪些数字序列是不可能得到的？例如给定m=5、n=7，则我们有可能得到{1,2,3,4,5,6,7}，但不可能得到{3,2,1,7,5,6,4}。输入格式：输入第一行给出3个不超过1000的正整数：m（堆栈最大容量）、n（入栈元素个数）、k（待检查的出栈序列个数）。最后k行，每行给出n个数字的出栈序
桥接模式 (Bridge Pattern) 直隶码农二十三种设计模式桥接模式 c++设计模式
桥接模式(BridgePattern)是一种结构型设计模式，它将抽象部分与实现部分分离，使它们可以独立变化。一、基础1意图将抽象部分与实现部分分离，使它们可以独立变化。2适用场景当你不希望在抽象和实现部分之间有固定的绑定关系时。当类的抽象以及它的实现都应该可以通过生成子类的方法加以扩充时。当对一个抽象的实现部分的修改应对客户不产生影响时。当你想对客户完全隐藏抽象的实现部分时。当你有许多类要生成的类
C++：类（通识版）愚戏师 C++c++开发语言数据结构算法
类的基本思想是数据抽象（dataabstraction）和封装（encapsulation）。数据抽象是一种依赖于接口（interface）和实现（implementation）分离的编程（以及设计）技术。类的接口包括用户所能执行的操作；类的实现则包括类的数据成员、负责接口实现的函数体以及定义类所需的各种私有函数。封装实现了类的接口和实现的分离。封装后的类隐藏了它的实现细节，也就是说，类的用户只能
P1706 全排列问题及 P1157 组合的输出 wwjjjww 算法深度优先图论
全排列:题目描述按照字典序输出自然数1到n所有不重复的排列，即n的全排列，要求所产生的任一数字序列中不允许出现重复的数字。输入格式一个整数n。输出格式由1∼n组成的所有不重复的数字序列，每行一个序列。#includeusingnamespacestd;intn;boolv[100];inta[100];voiddfs(intpos){if(pos==n+1){for(inti=1;i>n;dfs(
Python列表的创建只是没遇到 python
Python3列表序列是Python中最基本的数据结构。序列中的每个值都有对应的位置值，称之为索引，第一个索引是0，第二个索引是1，依此类推。Python有6个序列的内置类型，但最常见的是列表和元组。列表都可以进行的操作包括索引，切片，加，乘，检查成员。此外，Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现
Python列表1 cfjybgkmf Python python 开发语言
#coding:utf-8print("————————————列表——————————————")'''列表是指一系列按照特定顺序排列的元素组成是Python中内置的可变序列使用[]定义列表，元素与元素之间使用英文的逗号分隔列表中的元素可以是任意的数据类型''''''列表的创建：（1）使用[]直接创建列表列表名=[element1,element2,...,elementN]（2）使用内置函数l
opencv对图像处理 syfirst1111 图像处理 opencv 计算机视觉
形态学转换：基于图像形状的操作，通常在二进制图像上执行。腐蚀、膨胀：腐蚀：求局部最小值，原图高亮部分被蚕食膨胀：求局部最大值，原图高亮部分部分扩张img=cv.imread(path)kenel=np.ones((5,5),np.uint8)#创建核结构img2=cv.erode(img,kenel)#腐蚀去噪img1=cv.dilate(img,kenel)#膨胀目标增大，填充孔洞图像平滑（去噪
【蓝桥杯】真题 2386染色时间（优先队列BFS）遥感小萌新蓝桥杯蓝桥杯宽度优先职场和发展
思路这里每一个格子染色多了时间这一层限制，相当于图的每一边有了权重的限制，那么我们就不能直接用双向队列求最短路。而是使用优先队列。规则是这样的：每一个节点可以多次入队，但是只有第一次出队有效。所以这次我们不会在加入队列时更改标签vis，而是在出队时更改标签。如果在出队时发现vis已经更改，这说明这个元素以前出过队列（不是第一次出队），则直接continuecode我们额外设置两个数组，vis标签数
【MySQL】事务熬夜超级玩家 MySQL数据库 mysql android 数据库
目录基本概念事务操作自动提交事务开启事务提交事务回滚事务代码示例事务的特性ACID事务的隔离级别读未提交readuncommitted读已提交readcommitted可重复读repeatableread序列化（串行）serializable操作示例基本概念在MySQL中的事务（Transaction）是由存储引擎实现的，在MySQL中，只有InnoDB存储引擎才支持事务事务处理可以用来维护数据库
【蓝桥杯】4535勇闯魔堡（多源BFS + 二分）遥感小萌新蓝桥杯蓝桥杯宽度优先职场和发展
思路k有一个范围（0到怪物攻击的最大值），求满足要求的k的最小值。很明显的二分套路。关键是check函数怎么写，我们需要找到一条从第一行到最后一行的路径，每一次可以从上下左右四个方向前进，那么我么可以用BFS来查找是否存在。这里还有一个思维上的关键点，在开始时我们可以随机选一个点出发，如果我们用遍历第一行满足要求的格子，用bfs依次判断，那么这题样例只能过60%。实际上只需把所有满足要求的格子都加
CAD二次开发踩过的坑我的sun&shine CAD二次开发 c++
CAD二次开发踩过的坑CAD二次开发踩过的坑一、3D图形编译不过二、智能指针三、多文档操作规范流程四、CAD系统变量（参数）大全五、细节注意CAD图纸在软件中出现许多连接线线怎么关闭C++try无法展开无调试信息：重新生成变量已被优化掉,因而不可用两个列表中选中第一个再选第二个时第一个的选中见了预览时无法找到k3DDrawing无法缩放：静态框的通知打开intersectWith无法求交点对话框老
逐行讲解大模型解码超参数大全（temperature、top-k、top-p等所有参数） Gaffey大杂烩大模型机器学习人工智能
目录简介宏观概览解码策略实现逻辑常见的解码超参数temperature温度系数top_ktop_prepetition_penalty重复惩罚不常见的解码超参数min_ptypical解码ϵ采样η采样Classifier-FreeGuidance(CFG)序列偏置干预HammingDiversity编码器重复惩罚n-gram重复惩罚编码器n-gram重复惩罚bad_token惩罚最小长度限制最小新
动态规划算法--找零方式大王算法数据结构和算法实战宝典算法动态规划 c++
一、问题介绍给定数组arr，arr中所有的值都为正数且不重复。每个值代表一种面值的货币，每种面值的货币可以使用任意张，再给定一个整数aim，代表要找的钱数，求所有的找零方法有多少种。二、算法思路枚举法，列出使用某张钞票n次的所有可能。1、暴力递归intprocess1(intn,intarr[],intindex,intrest){if(index==n)returnrest==0?1:0;int
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
松下空调全国售后服务指南及维修 2503_90926332 eclipse
松下空调全国官网售后服务点热线号码4OO-675-8161故障报修：4OO-675-8161服务为先，满意为念，服务无/极/限，真/诚/到永远。讲诚信、树新风、诚以待人、信以立世、认真负责、精益求精、积极热情，本公司为厂家全国维修服务!全/天候、全/天蔬诚为您服务。维修服务网点致力于为客户摄供及时、专/业、用心的佳服务,让千万家庭/感/受/到“家”的感觉!!维修服务承/诺:1、严格按照维修及操作规
springboot使用kafka自定义JSON序列化器和反序列化器 zhou_zhao_xu Kafka spring
1.序列化器packagecom.springboot.kafkademo.serialization;importcom.alibaba.fastjson.JSON;importcom.alibaba.fastjson.JSONObject;importorg.apache.kafka.common.serialization.Serializer;importjava.util.Map;/**
自定义kafka高效的protoStuff序列化 _夜渐凉 ●Java kafka protoStuff 序列化
Duang，最近搭建了一个自己的博客小破站，欢迎各位小伙伴来访吖：https://www.ares-stack.cn/blog_service/#/game目前序列化领域中，谷歌的protobuf应该是性能好，效率高的了，并且protobuf支持多种语言，可跨平台，跨语言但使用起来并不像其他序列化那么简单（首先要写.proto文件，然后编译.proto文件，生成对应的.java文件）protost
算法及数据结构系列 - 动态规划诺亚凹凸曼算法及数据结构算法数据结构动态规划
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法文章目录框架思路子序列问题解题模板一维dp数组二维dp数组经典题型322.零钱兑换暴力递归带备忘录的暴力递归动态规划300.最长上升子序列1143.最长公共子序列72.编辑距离框架思路动态规划问题的一般形式就是求最值。动态规划其实是运筹学的一种最优化方法，只不过在计算机问题上应用比较多，比如说求最长递增子序列，最小编辑距离等等。
05.列表标签龙哥带你学编程 #html css
一、列表简介列表是网页中最常用的一种数据排列方式。有序列表：有先后顺序之分无序列表：无先后顺序之分定义列表：带有特殊含义的列表二、有序列表1、语法格式有序列表中的各个列表项是有顺序的…列表项列表项注意：ol和li是配合一起使用的，不可以单独使用；ol的子标签只能是li标签，不能是其他标签。2、基本特征有序列表是由有顺序的列表项组成的有序列表一般采用数字或字母作为顺序，默认采用数字顺序是块元素独占一
一文读懂什么是服务器小熊猫Q 服务器科普服务器运维
服务器基础介绍介绍服务器相关基础知识，如服务器分类、组成、机箱内部构造等，个人公众号：SRE杂谈，欢迎关注1、什么是服务器？服务器品牌有惠普、戴尔、浪潮、华为、华三、曙光等，各厂商服务器型号存在差异，惠普DL380G10、戴尔PowerEdgeR750、浪潮NF5280M5、华为2288HV5、曙光R6230HA一般用SN序列号和资产编号来对服务器进行标识，其中SN为唯一标识2、服务器演进2.1、
C语言求自幂数张同学吧 c++
如果在一个固定的进制中，一个n位自然数等于自身各个数位上数字的n次幂之和，则称此数为自幂数。例如：在十进制中，153是一个三位数，各个数位的3次幂之和为1^3+5^3+3^3=153，所以153是十进制中的自幂数。我们熟知的水仙花数只是自幂数的一种，严格来说3位数的3次幂数才称为水仙花数。一位自幂数：独身数、两位自幂数：没有、三位自幂数：水仙花数、四位自幂数：四叶玫瑰数、五位自幂数：五角星数、六位
华为OD机试 - DNA序列（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比
【元婴境】mysql的MVCC（详解） jstart千语 mysql 数据库
目录MVCC介绍隐藏字段undologReadView示例：流程总结MVCC介绍大家好，我是jstart千语。上篇我们讲到mysql的事务隔离级别，其中MVCC就是控制事务隔离级别的重要组成部分，也是实现事务四大特性之一隔离性的重要手段。那么接下来我将通透地讲解MVCC，让大家对mysql的隔离性有一个更深刻的理解。MVCC全称Multi-VersionConcurrencyControl，也就是
实验7-2-3 求矩阵的局部极大值范德蒙蒙矩阵算法数据结构 c语言
#includeintmain(){intm,n;scanf("%d%d",&m,&n);inta[m+1][n+1];//编号从1开始for(inti=1;ia[i-1][j]&&a[i][j]>a[i+1][j]&&a[i][j]>a[i][j-1]&&a[i][j]>a[i][j+1]){printf("%d%d%d\n",a[i][j],i,j);you=1;}}}if(you==0){p
Java基础 3.22 anlogic java java 开发语言 jvm
1.break练习//1-100之内的数求和，求当和第一次大于20的当前数ipublicclassBreak01{publicstaticvoidmain(String[]args){intn=0;intcount=0;for(inti=1;i20){n=i;System.out.println("和大于20，退出循环，当前i为"+n);break;}}}}//实现登录验证，有3次机会，如果用户名
在 Spring Boot 结合 MyBatis 的项目中，实现字段脱敏（如手机号、身份证号、银行卡号等敏感信息的部分隐藏）可以通过以下方案实现冷冷清清中的风风火火笔记 springboot spring boot mybatis 后端
在SpringBoot结合MyBatis的项目中，实现字段脱敏（如手机号、身份证号、银行卡号等敏感信息的部分隐藏）可以通过以下方案实现。以下是分步说明和完整代码示例：一、实现方案选择1.方案一：自定义注解+Jackson序列化脱敏适用场景：数据返回给前端时动态脱敏，数据库存储原始数据。优点：无侵入性，通过注解灵活控制脱敏字段，与业务逻辑解耦。核心实现：利用Jackson的JsonSerialize
python 标准库之 functools 模块 36度道 python系列学习笔记 python
functools模块提供了一系列用于处理函数的工具。其中，像partial可以创建一个新的可调用对象，这个对象固定了原函数的部分参数，有点像给函数穿上了“参数防护服”；reduce能对一个序列进行累积计算，就好比是一个勤劳的小会计，按顺序把序列里的数加起来或者做其他运算；wraps主要用于装饰器，它能帮助装饰器函数保留被装饰函数的元信息，比如函数名、文档字符串等，让被装饰函数“表里如一”。底层原
聚焦热点 | ISC 2022软件供应链安全治理与运营论坛圆满落幕悬镜安全荣誉资质网络安全行业动态安全 DevSecOps 网络安全软件供应链安全积极防御
“软件供应链的开源化使得软件供应链的各个环节都不可避免地受到开源应用的影响。尤其是开源应用的安全性，将直接影响着软件供应链的安全性。除开源应用开发者在开发过程中引入安全缺陷之外，也可能会存在开发者有目的性地预留的安全缺陷，甚至存在攻击者将含有隐藏性恶意功能的异常行为代码上传到上游开源代码托管平台，以便实施定向软件供应链攻击的安全风险。上述开源应用中存在的众多安全问题，都将导致软件供应链安全隐患大大
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st