一只幻想飞翔的猪

机器学习系列7-隐马尔科夫模型

前言

最近一直在看机器学习算法模型，但是总是在各种原理以及推导中迷失，感觉自己理解了，但是放下书本却又不知所以然，这种“差不多理解了”现象相信也会困扰很多初学者，于是我就想，能不能有一种方式，简单，通俗，易懂，印象深刻的为大家呈现机器学习这种看上去很“深奥”的知识。

恰巧本周组内小伙伴分享“自然语言处理-中文分词的一些常用方法”，分享过程中两件事情使我印象深刻，第一：很多知识点，总是讲到结果就结束了，没有讲为什么我们需要这样做，比如，讲到基于规则或词典的分词方法时，正向最大匹配法开始使用5个字符进行匹配，如果没有匹配上，则从最后截取一位丢掉，剩下四个字符继续匹配，依次类推。但是，为什么设定5个字符，而不是6个，7个呢？第二：讲到基于统计的分词方法时，隐马尔可夫模型被提到了重点上，但是如何使用隐马尔可夫进行分词，以及隐马尔可夫怎么应用到其他场景，我觉得这是一个模型的重点，模型的思想固然重要，但是怎么讲具体场景抽象到模型上，似乎更为重要，对于一个不是专门搞算法的人来讲。

恰好自己之前看了部分HMM的原理，被同事一讲，豁然开朗，所以准备用自己的理解将HMM讲的更加直观一点。

隐马尔可夫（HMM）基本概念

隐马尔可夫模型是一个概率统计模型，主要包含五个部分：

（1）初始概率（PI）：用于描述t1（初始）时刻各个隐藏状态发生的可能性

（2）状态序列（H）：用于描述隐藏状态的发生序列

（3）观测序列（O）：用于描述隐藏状态产生的可观测序列

（4）转移矩阵（A）：用于描述各个隐含状态之间转移的概率分布

（5）发射矩阵（B）：用于描述隐含状态到观测状态之间的概率分布

一般，一个模型的确定即M=（PI，A，B）

机器学习系列7-隐马尔科夫模型_第1张图片

隐马尔可夫（HMM）模型的假设前提

HMM模型成立的前提是做了两个基本假设：

（1）齐次马尔可夫性假设：即假设隐藏的马尔可夫链在任一时刻t的状态只依赖于前一个时刻的状态，与其他状态和观测无关，也与t时刻无关。

（2）观测独立性假设：即任意时刻的观测状态只依赖于该时刻的马尔可夫链状态（隐藏状态），与其他观测状态无关。

隐马尔可夫（HMM）能做什么

在HMM中有三类典型问题：

（1）概率计算问题：已知模型参数M=（PI，A，B），计算某一个给定的观测状态序列（O）的概率，即P（O|M）

（2）解码问题：已知可观测状态序列（O）和模型参数M=（PI，A，B），找到一个最有可能的隐藏状态序列（H），即P（H|O，M）

（3）学习问题：已知可观测状态序列集（O），找到一个最可能的HMM模型（模型各种参数（A，B），使用最大似然估计的方法）

解决以上三类问题，通常我们会有对应的方法来解决：

（1）概率计算问题：直接计算方法（概念可行但计算不可行），前向算法，后向算法

（2）解码问题：近似算法与维特比算法（Viterbi）

（3）学习问题：监督学习算法（训练数据包含观测序列和对应的状态序列），非监督学习算法（Baum-Welch算法即EM算法）

隐马尔可夫应用实例

隐马尔可夫模型应用的一个难点就是如何将问题进行抽象，映射到模型的几个元素上，接下来我将几个常见的博客中的问题进行一下简单抽象。

（1）天气预测问题

观测状态：去公园，在家，去购物

隐藏状态：晴天，雨天，多云

转移概率：晴天到雨天概率，晴天到多云概率。。。。

发射概率：晴天去公园概率，晴天在家概率。。。。。

最终，通过去观察一个人的事件来预测最近几天的天气序列。

机器学习系列7-隐马尔科夫模型_第2张图片

机器学习系列7-隐马尔科夫模型_第3张图片

（2）骰子作弊问题

观测状态：骰子掷出来的观测值（1，2，3，4.。。。。）

隐藏状态：使用的骰子类型（八面骰，六面骰。。。。）

转移概率：八面骰到六面骰概率，六面骰到四面骰概率。。。。

发射概率：八面骰掷出1的概率，八面骰掷出2的概率，六面骰掷出2的概率。。。。。

最终，通过去观察一串掷出的骰子序列来预测使用的骰子类型序列。

机器学习系列7-隐马尔科夫模型_第4张图片

机器学习系列7-隐马尔科夫模型_第5张图片

（3）中文分词问题

观测状态：中文字（我，是。。。。）

隐藏状态：中文状态，B（一个词的开始），M（一个词的中间），E（一个词的结尾），S（单独一个词）

转移概率：开始词到中间词的概率，单字到开始词的概率。。。。

发射概率：开始词到我的概率，开始词到是的概率。。。。。

最终，通过去观察一个中文序列来预测每个字的状态，最后通过状态就可以将词分割出来。

机器学习系列7-隐马尔科夫模型_第6张图片

机器学习系列7-隐马尔科夫模型_第7张图片

（4）词性标注问题

观测状态：中文词（我，是，男人。。。）

隐藏状态：词性（动词，名词。。。）

转移概率：动词到名词的概率，名词到动词的概率。。。。

发射概率：动态到我的概率，名词词到我的概率。。。。。

最终，通过去观察一个中文词序列来预测每个词的状态，即每个词是什么词性。

机器学习系列7-隐马尔科夫模型_第8张图片

机器学习系列7-隐马尔科夫模型_第9张图片

ps：以上示例的前提是模型参数已经训练出来，直接进行预测。其实隐马尔可夫模型要解决的三个问题是有内在关联的。即

（1）在不知道模型参数前提下，需要解决学习问题，即通过训练数据，确定模型参数，训练出来模型

（2）在模型通过学习问题学习出来后（或者已知参数，一般教程使用，实际应用不现实），在进行概率计算或者上面示例的预测（解码）

分割线

如果只是想使用隐马尔可夫模型解决实际应用问题，那么上面的内容应该可以满足业务需求的。可以不用向下看了，因为目前很多框架对于模型的集成已经很成熟了，以上内容足够支撑你做一个合格的调参侠了。

如果想对模型的原理进行了解，请跟我来，接下来将分别针对HMM解决的三个问题进行原理分析。

概率计算问题

前向算法：

机器学习系列7-隐马尔科夫模型_第10张图片

后向算法

机器学习系列7-隐马尔科夫模型_第11张图片

学习问题

（1）训练样本中包含观测状态和对应的状态序列

a.转移概率

机器学习系列7-隐马尔科夫模型_第12张图片

转移概率矩阵

b.发射概率

机器学习系列7-隐马尔科夫模型_第13张图片

发射概率矩阵

c.初始状态矩阵

根据训练样本的初始值频数计算概率

（2）Baum-Welch算法（EM算法）

后面在EM算法那一篇博客进行讲解

预测（标注）问题

（1）近似算法

机器学习系列7-隐马尔科夫模型_第14张图片

近似算法原理

但是近似算法的缺点是不能保证预测的状态序列整体是最有可能出现的序列，因为上述方法得到的状态序列中可能存在转移概率为0的相邻状态。

（2）维特比算法

维特比算法实际是使用动态规划解决HMM预测问题。

机器学习系列7-隐马尔科夫模型_第15张图片

维特比算法

求的最优路径

参考文献

（1）http://www.52nlp.cn/tag/隐马尔可夫模型

你可能感兴趣的:(机器学习系列7-隐马尔科夫模型)

力扣2 两数相加 C++ _楠_ 力扣数据结构
题目描述给出两个非空的链表用来表示两个非负的整数。其中，它们各自的位数是按照逆序的方式存储的，并且它们的每个节点只能存储一位数字。如果，我们将这两个数相加起来，则会返回一个新的链表来表示它们的和。您可以假设除了数字0之外，这两个数都不会以0开头。示例：输入：(2->4->3)+(5->6->4)输出：7->0->8原因：342+465=807题目解法/***Definitionforsingly-
104. Merge K Sorted Lists 鸭蛋蛋_8441
DescriptionMergeksortedlinkedlistsandreturnitasonesortedlist.Analyzeanddescribeitscomplexity.ExampleExample1:Input:[2->4->null,null,-1->null]Output:-1->2->4->nullExample2:Input:[2->6->null,5->null,7->
HMM 隐马尔可夫模型初学（二）小贝学生信
1、HMM，HiddenMarkovmodel隐马尔科夫模型（1）天气举例假设不能直接观察天气阴晴雨情况，只能看到地面的潮湿情况（假如分为非常潮湿，一般潮湿，不潮湿三种对应A，B，C三种评级）。现在我一连观察了一周的地面潮湿情况（AABBCBA），是否能够判断这一周的天气？如上所述，有两类状态：一类是地面潮湿状态observationstata（A、B、C）；一类是天气情况latentstata（
机器学习系列12：反向传播算法 SuperFengCode 机器学习系列机器学习神经网络反向传播算法梯度检验机器学习笔记
当我们要运用高级算法进行梯度下降时，需要计算两个值，代价函数和代价函数的偏导数：代价函数我们之前已经知道怎么求了，现在只需要求代价函数的偏导数即可。采用如下方法，先进行前向传播算法，然后再进行反向传播算法（BackpropagationAlgorithm），反向传播算法与前向传播算法方向相反，它用来求代价函数的偏导数。具体过程看下图：用δ作为误差，计算方法为：有时我们在运用反向传播算法时会遇到bu
基于Python的机器学习系列（18）：梯度提升分类（Gradient Boosting Classification）会飞的Anthony 信息系统机器学习人工智能机器学习 python 分类
简介梯度提升（GradientBoosting）是一种集成学习方法，通过逐步添加新的预测器来改进模型。在回归问题中，我们使用梯度来最小化残差。在分类问题中，我们可以利用梯度提升来进行二分类或多分类任务。与回归不同，分类问题需要使用如softmax这样的概率模型来处理类别标签。梯度提升分类的工作原理梯度提升分类的基本步骤与回归类似，但在分类任务中，我们使用概率模型来处理预测结果：初始化模型：选择一个
基于Python的机器学习系列（17）：梯度提升回归（Gradient Boosting Regression）会飞的Anthony 人工智能信息系统机器学习机器学习 python 回归
简介梯度提升（GradientBoosting）是一种强大的集成学习方法，类似于AdaBoost，但与其不同的是，梯度提升通过在每一步添加新的预测器来减少前一步预测器的残差。这种方法通过逐步改进模型，能够有效提高预测准确性。梯度提升回归的工作原理在梯度提升回归中，我们逐步添加预测器来修正模型的残差。以下是梯度提升的基本步骤：初始化模型：选择一个初始预测器h0(x)，计算该预测器的预测值。计算残差：
基于Python的机器学习系列（16）：扩展 - AdaBoost 会飞的Anthony 信息系统机器学习人工智能 python 机器学习开发语言
简介在本篇中，我们将扩展之前的AdaBoost算法实现，深入探索其细节并进行一些修改。我们将重点修复代码中的潜在问题，并对AdaBoost的实现进行一些调整，以提高其准确性和可用性。1.修复Alpha计算中的问题在AdaBoost中，如果分类器的错误率e为0，则计算出的权重α将是未定义的。为了解决这个问题，我们可以在计算过程中向分母中添加一个非常小的值，以避免除零错误。2.调整学习率sklearn
深度学习100问7-向量降维的算法有那些不断持续学习ing 深度学习机器学习人工智能
一、主成分分析（PCA）PCA就像你整理一堆考试成绩单。假如成绩单上有好多科目成绩，这就像一个高维向量。但有些科目成绩关系很紧密，比如数学好的同学一般物理也不错，化学也还行。那PCA就会找这些成绩单里最主要的特点，把关系近的科目合成几个新的“大科目”。这样就把原来很多科目的高维向量变成几个“大科目”的低维向量啦。二、奇异值分解（SVD）SVD呢，就好比你有一本很厚的书。书的每一页上的字可以看成一个
Visionpro二次开发学习笔记7-使用CogToolDisplay控件 ꧁༺℘₨风、凌๓༻꧂ C#visonpro二次开发笔记 c#计算机视觉
CogToolDisplay控件可显示与视觉工具记录相关的图像，图形和其他状态信息。它使用CogRecord和ICogTool接口将图像和图形连接到CogDisplay。图片清单控件的CogComboBox列出当前记录及其子记录中的图像和图形。您可以单击列表并选择要显示的图像或图形。如果记录层次结构仅包含一个图像，则CogComboBox被禁用，但显示图像名称。如果没有可用的图像，则CogComb
必记宋词35首（上）余秋雨新作《中国文化课》推荐小狮子王后
1-苏轼-《念奴娇·赤壁怀古》（大江东去）2-苏轼-《水调歌头·中秋》（明月几时有）3-苏轼-《卜算子·黄州定慧院寓居所》（缺月挂疏桐）4-苏轼-《江城子·乙卯正月二十日夜记梦》（十年生死两茫茫）5-苏轼-《蝶恋花·春景》（花褪残红青杏小）6-苏轼-《定风波》（莫听穿林打叶声）7-苏轼-《临江仙·夜归临皋》（夜饮东坡醒复醉）8-苏轼-《江城子密州出猎》（老夫聊发少年狂）9-李清照-《声声慢》（寻寻
8 - Medium - 奇偶链表 1f872d1e3817
给定一个单链表，把所有的奇数节点和偶数节点分别排在一起。请注意，这里的奇数节点和偶数节点指的是节点编号的奇偶性，而不是节点的值的奇偶性。请尝试使用原地算法完成。你的算法的空间复杂度应为O(1)，时间复杂度应为O(nodes)，nodes为节点总数。示例1:输入:1->2->3->4->5->NULL输出:1->3->5->2->4->NULL示例2:输入:2->1->3->5->6->4->7->
线性回归（1） zidea
MachineLearninginMarketing感谢李宏毅《回归-案例研究》部分内容为听取李宏毅老师讲座的笔记，也融入了自己对机器学习理解，个人推荐李宏毅老师的机器学习系列课程，尤其对于初学者强烈推荐。课程设计相对其他课程要容易理解。在机器学习中算法通常分为回归和分类两种，今天我们探讨什么线性回归。以及如何设计一个线性回归模型。什么回归简单理解通过数据最终预测出来一个值。回归问题的实例就是找到
【C++航海王：追寻罗杰的编程之路】类与对象你学会了吗？(中) 枫叶丹4 C++c++开发语言 visualstudio 后端
目录1->类的六个默认成员函数2->构造函数2.1->概念2.2->特性3->析构函数3.1->概念3.2->特性4->拷贝构造函数4.1->概念4.2->特征5->赋值运算符重载5.1->运算符重载5.2->赋值运算符重载5.3->前置++和后置++重载6->日期类的实现7->const成员8->取地址及const取地址操作符重载1->类的六个默认成员函数如果一个类中什么成员都没有，简称为空类。
【C++航海王：追寻罗杰的编程之路】类与对象你学会了吗？(上) 枫叶丹4 C++c++开发语言 visualstudio 后端
目录1->面向过程与面向对象的初步认识2->类的引入3->类的定义4->类的访问限定符及封装4.1->访问限定符4.2->封装5->类的作用域6->类的实例化7->类对象模型7.1->如何计算类对象的大小7.2->类对象存储方式的猜测7.3->结构体内存对齐规则8->this指针8.1->this指针的引出8.2->this指针的特性8.3->C语言和C++实现Stack的对比1->面向过程与面向
隐马尔科夫模型1（了解整体知识架构） -麦_子- 人工智能
当你去学习一个算法的时候，你首先要去搞清楚它是什么，能用来做什么。如果上来就进行公式推导，那样只会让你更加迷糊，只有彻底了解了之后学起来才会事半功倍。本篇文章主要有两个目的：1、让大家了解什么是隐马尔科夫模型。为了让大家深入理解，会先介绍什么是马尔科夫模型，然后介绍什么是隐马尔可夫模型，然后总结两者的联系和区别。2、带大家认识马尔可夫模型的三种应用场景。大家可以理解为能解决哪三种问题，以及三种场景
2022-03-16 sangrea1
20210316《掌控习惯》1-意识先于欲望2-幸福即无欲3-幸福转瞬即逝4-幸福是追求不到的，只能尾随而来5-任何行为的第一步是观察6-好奇心总比头脑灵活好7-促使行为的是欲望而不是智力8-情绪驱动行为9-情绪先于理性和逻辑10-感觉在先，理性在后，两者协同，发挥极佳效果；反之不合逻辑、感情用事。11-痛苦推动进步，根源是改变现状的渴望12-行为揭示你想要得到的程度13-期望决定了满意度14-满
Vue路由的传参 cssl-虞老师 VUE入门 vue.js javascript 前端
Vue传参方式可以划分为params传参（参数隐藏在路径中）和query传参（参数在？后）俩种方式1.使用router-link标签跳转路由要注意to和:to的不同：to不带参数，:to带参数（1）使用params传参vue页面测试7-路由要修改路由文件(router目录下的js),注意：{path:'/ts7/:tid/:title',name:'Test7',component:()=>imp
BFS——C++ 松定 c++宽度优先算法
BFS常使用于寻找最短路径，使用队列实现。在学习使用BFS的时候有一难点是如何合理使用队列以及搞清楚为什么要使用队列来帮助完成BFS。为方便理解，这里摘用一下CodePotato在讲解BFS的时候的图片这是一个树，想要通过BFS来遍历这个树的顺序应该是1->2->5->3->4->9->7->6->8->10但是如何使用队列来完成呢？请看图片辅助理解。首先理解了如何使用队列以及为什么要使用队列，然
五.实战软件部署 1-3实战章节-前言&MYSQL 5.7版本在centos系统安装&MYSQL 8.0版本在centos系统安装金灰 Linux adb 安全 linux 网络安全数据库 mysql
目录五.实战软件部署1-实战章节-前言五.实战软件部署2-MYSQL5.7版本在centos系统安装1-配置yum仓库2-使用yum安装mysql3-安装完成后，启动mysql并配置开机自启动4-检查mysql的运行状态--配置1-获取mysql的初识密码2-登录mysql数据库系统3-修改root用户密码4-配置root的简单密码5-配置root运行远程登录6-退出mysql控制台页面7-检查端
2018-09-17 342 + 465 = 807. 最美下雨天
题目来源：https://github.com/Blankj/awesome-java-leetcode/blob/master/note/002/README.md是github上的一位作者分享的解题思路：342+465=807/***Input:(2->4->3)+(5->6->4)*Output:7->0->8*Explanation:342+465=807.**Definitionfors
LNMP环境部署-CentOS 6.10/7-第一章码上版码
LNMP简介LNMP（Linux+Ngnix+Mysql+PHP）与LAMP（Linux+Apache+Mysql+PHP）相比消耗的资源更少，支持的并发连接效率更高，反向代理功能效率高，静态文件处理快等。手把手使用yum和源码安装LNMP环境，并部署常见测试管理工具所需环境。Linux：Linux内核最初只是由芬兰人李纳斯·托瓦兹（LinusTorvalds）在赫尔辛基大学上学时出于个人爱好而编
机器学习系列（8）——提升树与GBDT算法陌简宁机器学习
本文介绍提升树模型与GBDT算法。0x01、提升树模型提升树是以分类树或回归树为基本分类器的提升方法。提升树被认为是统计学习中性能最好的方法之一。提升方法实际采用加法模型（即基函数的线性组合）与前向分步算法，以决策树为基函数的提升方法称为提升树（boostingtree）。对分类问题决策树是二叉分类树，对回归问题决策树是二叉回归树。提升树模型可以表示为决策树的加法模型：其中，表示决策树，为决策树的
寒假7-贪心要成为编程高手的Yu 算法数据结构图论
#includeusingnamespacestd;#include#includestructbisai{ints;inte;};boolCompare(bisaib1,bisaib2){returnb1.e>b2.e;}intmain(){intn;cin>>n;vectorv;bisaib;for(inti=1;i>b.s>>b.e;v.push_back(b);}sort(v.begin(
机器学习系列——（十三）多项式回归飞影铠甲机器学习机器学习回归人工智能
引言在机器学习领域，线性回归是一种常见且简单的模型。然而，在某些情况下，变量之间的关系并不是线性的，这时候我们就需要使用多项式回归来建模非线性关系。多项式回归通过引入高次项来扩展线性回归模型，从而更好地拟合数据。本文将详细介绍多项式回归的原理、应用场景和实现步骤，并通过一个实际案例演示如何使用多项式回归进行预测。一、原理多项式回归是一种形式上为多项式的函数与自变量之间的线性回归关系。其基本原理是通
机器学习系列——（二十二）结语飞影铠甲机器学习机器学习人工智能
随着我们的机器学习系列的探索画上句号，我们不禁感慨于这一领域的广阔和深邃。从最初的基础概念到复杂的算法，从理论的探讨到实际应用的示例，我们一起经历了一段非凡的旅程。机器学习不仅是当前技术创新的核心驱动力之一，也是塑造未来的关键因素。在这个结语中，让我们回顾这段旅程的亮点，并展望机器学习将如何继续改变我们的世界。回顾学习之旅我们的系列文章涵盖了机器学习的各个方面，从监督学习到无监督学习，从简单的线性
机器学习系列——（二十一）神经网络飞影铠甲机器学习机器学习神经网络人工智能
引言在当今数字化时代，机器学习技术正日益成为各行各业的核心。而在机器学习领域中，神经网络是一种备受瞩目的模型，因其出色的性能和广泛的应用而备受关注。本文将深入介绍神经网络，探讨其原理、结构以及应用。一、简介神经网络是一种受到人类神经系统启发而设计的计算模型。它由大量的人工神经元组成，这些神经元之间通过连接进行信息传递和处理。神经网络的主要目标是从数据中学习规律，并能够进行预测、分类、识别等任务。二
机器学习系列——（二十）密度聚类飞影铠甲机器学习机器学习聚类支持向量机
引言在机器学习的无监督学习领域，聚类算法是一种关键的技术，用于发现数据集中的内在结构和模式。与传统的基于距离的聚类方法（如K-Means）不同，密度聚类关注于数据分布的密度，旨在识别被低密度区域分隔的高密度区域。这种方法在处理具有复杂形状和大小的聚类时表现出色，尤其擅长于识别噪声和异常值。本文将详细介绍密度聚类的概念、主要算法及其应用。一、概述密度聚类基于一个核心思想：聚类可以通过连接密度相似的点
机器学习系列——（十九）层次聚类飞影铠甲机器学习机器学习聚类人工智能
引言在机器学习和数据挖掘领域，聚类算法是一种重要的无监督学习方法，它试图将数据集中的样本分组，使得同一组内的样本相似度高，不同组间的样本相似度低。层次聚类（HierarchicalClustering）是聚类算法中的一种，以其独特的层次分解方式，在各种应用场景中得到广泛应用，如生物信息学、图像分析、社交网络分析等。一、概述层次聚类算法主要分为两大类：凝聚的层次聚类（AgglomerativeHie
随记7-一百斤的我要减肥了! 稻花三千
一直以来也不觉得自己胖。体重长期稳定在一个固定的数值范围。直到今天同事说。她从105斤减到了93斤。发现，从105到100以内，是一个世界。从100以内到95以内，又感受到了另一个世界。听到此话的我。忍不住向往95斤的世界。开始减肥。
机器学习系列——（十七）聚类飞影铠甲机器学习机器学习聚类人工智能
引言在当今数据驱动的时代，机器学习已经成为了解锁数据潜能的关键技术之一。其中，聚类作为机器学习领域的一个重要分支，广泛应用于数据挖掘、模式识别、图像分析等多个领域。本文旨在深入探讨聚类技术的原理、类型及其应用，为读者提供一个全面而深入的了解。一、什么是聚类？聚类是一种无监督学习（UnsupervisedLearning）技术，它的目标是将相似的对象分组到一起，形成簇（Cluster）。与有监督学习
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他