公众号：数海星辰

最大熵模型

转载自：http://blog.csdn.net/chjjunking/article/details/6452223

最大熵模型：读书笔记

胡江堂，北京大学软件学院

1. 物理学的熵

2. 信息论的熵

3. 熵和主观概率（一个简单注释

4. 熵的性质

4.1. 当所有概率相等时，熵取得最大值

4.2. 小概率事件发生时携带的信息量比大概率事件发生时携带的信息量多

5. 最大熵原理：直觉讨论

6. 最大熵原理：一个手工例子

7. 最大熵原理：正式表述

8. 最大熵模型的训练：GIS算法

9. 最大熵模型：金融领域内的应用

参考文献

这篇读书笔记主要写了对熵的理解、对最大熵原则的理解，还有一个手工计算的例子。在处理一般化的最大熵模型时，我采用了我偏爱的连续随机变量形式，而不是一般有助于计算机理解的离散形式。连续而非离散的处理方式的一个好处就是，它能非常方便地推出最大熵模型的解是一个指数形式。如果使用离散形式，一样的结论，那符号就看着复杂多了。

所有的东西都来自篇末的参考资料。

1. 物理学的熵

熵是一个物理学概念，它是描述事物无序性的参数，熵越大则无序性越强。从宏观方面讲（根据热力学定律），一个体系的熵等于其可逆过程吸收或耗散的热量除以它的绝对温度；从微观讲，熵是大量微观粒子的位置和速度的分布概率的函数。自然界的一个基本规律就是熵递增原理，即，一个孤立系统的熵，自发性地趋于极大，随着熵的增加，有序状态逐步变为混沌状态，不可能自发地产生新的有序结构，这意味着自然界越变越无序。

2. 信息论的熵

在物理学中，熵是描述客观事物无序性的参数。信息论的开创者香农认为，信息（知识）是人们对事物了解的不确定性的消除或减少。他把不确定的程度称为信息熵。假设每种可能的状态都有概率，我们用关于被占据状态的未知信息来量化不确定性，这个信息熵即为：

其中是以2为底的对数，所以这个信息用位衡量。前面说过，在物理学的背景下，这个不确定性被称为熵（在通讯系统中，关于传输的实际信息的不确定性也被称为数据源的熵）。

扩展到连续情形。假设连续变量的概率密度函数是，与离散随机变量的熵的定义类似，信息熵的连续定义为：

上式就是我们定义的随机变量的微分熵。当被解释为一个随机连续向量时，就是的联合概率密度函数。

3. 熵和主观概率（一个简单注释）

因为熵用概率表示，所以这涉及到主观概率。概率用于处理知识的缺乏（概率值为1表明对知识的完全掌握，这就不需要概率了），而一个人可能比另一个人有着更多的知识，所以两个观察者可能会使用不同的概率分布，也就是说，概率（以及所有基于概率的物理量）都是主观的。在现代的主流概率论教材中，都采用这种主观概率的处理方法。

4. 熵的性质

4.1. 当所有概率相等时，熵取得最大值

上面关于熵的公式有一个性质：假设可能状态的数量有限，当所有概率相等时，熵取得最大值。证明如下：

在只有两个状态的例子中，要使熵最大，每个状态发生的概率都是1/2，如下图所示：

4.2. 小概率事件发生时携带的信息量比大概率事件发生时携带的信息量多

证明略，可以简要说明一下，也挺直观的。如果事件发生的概率为1，在这种情况下，事件发生就没有什么“惊奇”了，并且不传达任何“信息”，因为我们已经知道这“信息”是什么，没有任何的“不确定”；反之，如果事件发生的概率很小，这就有更大的“惊奇”和有“信息”了。这里，“不确定”、“惊奇”和“信息”是相关的，信息量与事件发生的概率成反比。

5. 最大熵原理：直觉讨论

最大熵原理是根据样本信息对某个未知分布做出推断的一种方法。日常生活中，很多事情的发生表现出一定的随机性，试验的结果往往是不确定的，而且也不知道这个随机现象所服从的概率分布，所有的只有一些试验样本或样本特征，统计学常常关心的一个问题，在这种情况下如何对分布作出一个合理的推断？最大熵采取的原则就是：保留全部的不确定性，将风险降到最小。在金融理论中，一个类似的教训是，为了降低风险，投资应该多样化，不要把所有的鸡蛋都放在一个篮子里。

吴军（2006）举了一个例子。对一个均匀的骰子，问它每个面朝上的概率分别是多少。所有人都会说是1/6。这种“猜测”当然是对的，因为对这个“一无所知”的色子，假定它每一个朝上概率均等是最安全的做法，你不应该假设它被做了手脚。从信息论的角度讲，就是保留了最大的不确定性，让熵达到最大（从投资的角度来看，这就是风险最小的做法）。但是，如果这个骰子被灌过铅，已知四点朝上的概率是1/3，在这种情况下，每个面朝上的概率是多少？当然，根据简单的条件概率计算，除去四点的概率是 1/3外，其余的概率都是 2/15。也就是说，除已知的条件（四点概率为 1/3）必须满足外，对其它各点的概率，我们仍然无从知道，也只好认为它们相等。这种基于直觉的猜测之所以准确，是因为它恰好符合了最大熵原理。

回到物理学例子中。在涉及物理系统的情形中，一般要确定该系统可以存在的多种状态，需要了解约束下的所有参数。比如能量、电荷和其他与每个状态相关的物理量都假设为已知。为了完成这个任务常常需要量子力学。我们不假设在这个步骤系统处于特定状态；事实上我们假定我们不知道也不可能知道这一点，所以我们反而可以处理被占据的每个状态的概率。这样把概率当作应对知识缺乏的一种方法。我们很自然地想避免假定了比我们实际有的更多的知识，最大熵原理就是完成这个的方法。

这里可以总结出最大熵对待已知事物和未知事物的原则：承认已知事物（知识）；对未知事物不做任何假设，没有任何偏见。最大熵原理指出，当我们需要对一个随机事件的概率分布进行预测时，我们的预测应当满足全部已知的条件，而对未知的情况不要做任何主观假设（不做主观假设，这点很重要。）在这种情况下，概率分布最均匀，预测的风险最小。因为这时概率分布的信息熵最大，所以人们称这种模型叫“最大熵模型”。我们常说，不要把所有的鸡蛋放在一个篮子里，其实就是最大熵原理的一个朴素的说法，因为当我们遇到不确定性时，就要保留各种可能性。

6. 最大熵原理：一个手工例子

举个例子，一个快餐店提供3种食品：汉堡(B)、鸡肉(C)、鱼(F)。价格分别是1元、2元、3元。已知人们在这家店的平均消费是1.75元，求顾客购买这3种食品的概率。如果你假设一半人买鱼另一半人买鸡肉，那么根据熵公式，这不确定性就是1位（熵等于1）。但是这个假设很不合适，因为它超过了你所知道的事情。我们已知的信息是：

以及关于对概率分布的不确定性度量，熵：

对前两个约束，两个未知概率可以由第三个量来表示，可以得到：

把上式代入熵的表达式中，熵就可以用单个概率来表示：

对这个单变量优化问题，很容易求出时熵最大，有，和。

总结一下。以上，我们根据未知的概率分布表示了约束条件，又用这些约束条件消去了两个变量，用剩下的变量表示熵，最后求出了熵最大时剩余变量的值，结果就求出了一个符合约束条件的概率分布，它有最大不确定性，我们在概率估计中没有引入任何偏差。

7. 最大熵原理：正式表述

假设有一个随机系统，已知一组状态，但不知道其概率，而且我们知道这些状态的概率分布的一些限制条件。这些限制条件或者是已知一定的总体平均值，或者是它们的一些界限。在给定关于模型的先验知识的条件下，问题是选择一个在某种意义下最佳的概率模型。Jaynes(1957)提出了一个最大熵原则：当根据不完整的信息作为依据进行推断时，应该由满足分布限制条件的具有最大熵的概率分布推得。也就是说，熵的概念在概率分布空间定义一种度量，使得具有较高熵的分布比其它的分布具有更大的值。显然，“最大熵问题”是一个带约束的最优化问题。

为方便叙述，考虑最大微分熵

对所有随机变量的概率密度函数，满足以下约束条件：

其中，是的一个函数。约束1和约束2描述的是概率密度函数的基本属性，约束3定义变量的矩，它随函数的表达式不同而发生变化，它综合了随机变量的所有可用的先验知识。为了解这个约束最优化问题，利用拉格朗日乘子法，目标函数为：

其中，是拉格朗日乘子。对被积函数求的微分，并令其为0，有：

解得：

我们看到这个概率密度函数具有指数形式。匈牙利数学家Csiszar曾经证明，对任何一组不自相矛盾的信息，最大熵模型不仅存在，而且是唯一的。而且它们都有同一个非常简单的形式 -- 指数函数。我们还可以得到，在所有零均值随机向量可达到的微分熵中，多元正态分布具有最大的微分熵。最大熵的解，同时是最吻合样本数据分布的解。

8. 最大熵模型的训练：GIS算法和其他

上节我们得到，一个最大熵模型可以有效地把各种信息综合在一起（无偏见地对待不确定性），而且具有指数函数的形式，下面模型的训练就要确定这个指数函数的各个参数。最原始的最大熵模型的训练方法是一种称为通用迭代算法 GIS(generalized iterative scaling) 的迭代算法，由 Darroch 和 Ratcliff 在七十年代提出，大致可以概括为以下几个步骤：

1. 假定第零次迭代的初始模型为等概率的均匀分布。
2. 用第 N 次迭代的模型来估算每种信息特征在训练数据中的分布，如果超过了实际的，就把相应的模型参数变小；否则，将它们便大。
3. 重复步骤 2 直到收敛。

Darroch 和 Ratcliff没有能对这种算法的物理含义进行很好地解释，后来是由Csiszar解释清楚的，因此，人们在谈到这个算法时，总是同时引用 Darroch 和Ratcliff 以及希萨的两篇论文。GIS 算法每次迭代的时间都很长，需要迭代很多次才能收敛，而且不太稳定，即使在 64 位计算机上都会出现溢出。因此，在实际应用中很少有人真正使用，大家只是通过它来了解最大熵模型的算法。

八十年代，Della Pietra在IBM对GIS算法进行了两方面的改进，提出了改进迭代算法IIS（improved iterative scaling）。这使得最大熵模型的训练时间缩短了一到两个数量级。这样最大熵模型才有可能变得实用。即使如此，在当时也只有 IBM 有条件是用最大熵模型。

由于最大熵模型在数学上十分完美，对科学家们有很大的诱惑力，因此不少研究者试图把自己的问题用一个类似最大熵的近似模型去套。谁知这一近似，最大熵模型就变得不完美了，结果可想而知，比打补丁的凑合的方法也好不了多少。于是，不少热心人又放弃了这种方法。第一个在实际信息处理应用中验证了最大熵模型的优势的，是原IBM现微软的研究员Adwait Ratnaparkhi。Ratnaparkhi的聪明之处在于他没有对最大熵模型进行近似，而是找到了几个最适合用最大熵模型、而计算量相对不太大的自然语言处理问题，比如词性标注和句法分析。拉纳帕提成功地将上下文信息、词性（名词、动词和形容词等）、句子成分（主谓宾）通过最大熵模型结合起来，做出了当时世界上最好的词性标识系统和句法分析器。

9. 最大熵模型：金融领域内的应用

最大熵模型在自然语言处理领域内得到了广泛的应用，在金融界，也能见到它的影子。当年最早改进最大熵模型算法的Della Pietra在九十年代初退出了学术界，而到在金融界大显身手。他和很多IBM语音识别的同事一同到了一家当时还不大，但现在是世界上最成功对冲基金公司 ----(Renaissance Technologies。我们知道，决定股票涨落的因素可能有几十甚至上百种，而最大熵方法恰恰能找到一个同时满足成千上万种不同条件的模型。 Della Pietra等科学家在那里，用于最大熵模型和其他一些先进的数学工具对股票预测，获得了巨大的成功。从该基金1988 年创立至今，它的净回报率高达平均每年34%。也就是说，如果1988年你在该基金投入一块钱，今天你能得到200块钱。这个业绩，远远超过股神巴菲特的旗舰公司Berkshire Hathaway（同期，Berkshire Hathaway的总回报是16倍）。

参考文献

1. 吴军《数学之美系列十六（上）-不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型》，http://googlechinablog.com/2006/10/blog-post.html

2. 吴军《数学之美系列十六（下）-不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型》，http://googlechinablog.com/2006/11/blog-post.html

3. Jaynes, E.T., 1957. ”Information Theory and Statistical Mechanics”, Physical Review, vol.106, pp.620-630. http://bayes.wustl.edu/etj/articles/theory.1.pdf

4. Haykin, Simon《神经网络原理》（第10章信息论模型，叶世伟等译，北京：机械工业出版社，2004）

5. 王厚峰. 机器学习课程讲义之六MEM (Maximum Entropy Model).北京大学软件与微电子学院，2007年春季学期

6. Penfield, Paul. Information and Entrop. MIT Open Course, Spring 2003. http://ocw.mit.edu/OcwWeb/Electrical-Engineering-and-Computer-Science/6-050JInformation-and-EntropySpring2003/CourseHome/index.htm

7. Wei, Xiaoliang《最大熵模型与自然语言处理》www.cs.caltech.edu/~weixl/research/read/summary/MaxEnt2.ppt

8. 常宝宝《自然语言处理的最大熵模型》www.icl.pku.cn/WebData_http-dir-listable/ICLseminars/2003spring/最大熵模型.pdf

9. 廖先桃《最大熵理论及其应用》http://ir.hit.edu.cn/phpwebsite/index.php?module=documents&JAS_DocumentManager_op=downloadFile&JAS_File_id=196

【第10天】给定一个字符 c ，要求转换成大写进行输出 | 初识ASCII码执梗《Java入门100练》c语言 java 算法蓝桥杯数据结构
本文已收录于专栏《Java入门一百例》学习指引序、专栏前言一、什么是ASCII？二、【例题2】2、解题思路3、模板代码4、代码解析三、【例题2】2、解题思路3、模板代码4、代码解析四、奇淫巧技五、推荐专栏六、课后习题序、专栏前言本专栏开启，目的在于帮助大家更好的掌握学习Java，特别是一些Java学习者难以在网上找到系统地算法学习资料帮助自身入门算法，同时对于专栏内的内容有任何疑问都可在文章末
数据结构与算法必知基础知识程序员bigsai 文章精选数据结构与算法数据结构算法数据结构与算法
原创公众号：bigsai文章已收录在全网都在关注的数据结构与算法学习仓库欢迎star前言数据结构与算法是程序员内功体现的重要标准之一，且数据结构也应用在各个方面，业界更有程序=数据结构+算法这个等式存在。各个中间件开发者，架构师他们都在努力的优化中间件、项目结构以及算法提高运行效率和降低内存占用，在这里数据结构起到相当重要的作用。此外数据结构也蕴含一些面向对象的思想，故学好掌握数据结构对逻辑思维处
【C++】双指针算法星霜旅人 C++c++算法
我们还有更长的路要走，不过没关系，道路就是生活。前言这是我自己学习蓝桥杯算法的第一篇博客总结。后期我会继续把蓝桥杯算法学习笔记开源至博客上。技巧1.双指针算法，但实际上是利用数组下标来充当指针，并不是直接使用指针。2.cur指针(current)，扫描遍历指针，左边是已经扫描遍历的部分，中间及右边是还未扫描遍历的部分。3.dest指针(destination)，分隔指针，左边是已经排好的序的部分，
C/C++算法编程竞赛基础算法篇：枚举、模拟和递归 BoFeather C/C++算法学习之路 c语言 c++算法
目录前言这个栏目是对我算法学习过程的同步记录，我也希望能够通过这个专栏加深自己对编程的理解以及帮助到更多像我一样想从零学习算法并参加竞赛的同学。在这个专栏的文章中我会结合在编程过程中遇到的各种问题并提出相应的解决方案。当然，如果屏幕前的你有更好的想法或者发现的错误也欢迎交流和指出！不喜勿喷！不喜勿喷！不喜勿喷！那么事不宜迟，我们马上开始吧！一、枚举1.基本介绍2.代码示例二、模拟1.基本介绍2.代
【算法学习之路】4.简单数论（4）零零时算法学习之路算法学习 c++开发语言数据结构数学高精度
简单数论（4）前言三.高精度1.什么是高精度2.解决办法精度乘除法一.精度乘法1.数据的存储2.步骤3.例题：高精度乘法二.精度除法1.例子2.步骤3.例题：高精度除法前言我会将一些常用的算法以及对应的题单给写完，形成一套完整的算法体系，以及大量的各个难度的题目，目前算法也写了几篇，滑动窗口的题单正在更新，其他的也会陆陆续续的更新，希望大家点赞收藏我会尽快更新的！！！三.高精度1.什么是高精度对运
ecc椭圆加密算法c语言,ECC 椭圆曲线加密算法学习————ECDH与ECDSA weixin_39927508 ecc椭圆加密算法c语言
0x00前言之前学习了实数域上的椭圆曲线与有限域$\mathbb{F}_{p}$上的椭圆曲线。详细可以参考ECC椭圆加密算法学习————从实数域到有限域的椭圆曲线。不难发现，在实数域的标量乘法看上去是一个“简单”的问题，但是在有限域$\mathbb{F}_{p}$就显得非常困难。本文主要讨论如何将之前所学的运用于加密问题中。相关代码一些重要的域参数素数$p$椭圆曲线系数$a$与$b$基点(生成元)
算法学习——TEB算法 .小墨迹算法学习算法学习 linux 开发语言 c++
TEB（TimedElasticBand）路径规划算法是一种基于优化的局部路径规划算法，广泛应用于移动机器人、自动驾驶等领域。它通过在机器人的运动轨迹上引入时间信息，结合动力学约束和环境约束，生成平滑且可行的路径。以下是对TEB算法的原理、实现方式、路线生成、约束条件设置以及参数调节的详细说明。1.TEB算法原理1.1核心思想TEB算法的核心思想是将机器人的运动轨迹表示为一个弹性带（Elastic
Python算法学习: 2020年蓝桥杯省赛模拟赛-Python题解普通Gopher Python算法
目录文章目录目录填空题1填空题2填空题3填空题4编程题1凯撒密码加密编程题2反倍数编程题3摆动序列编程题4螺旋矩阵编程题5村庄通电编程题6小明植树填空题1问题描述一个包含有2019个结点的无向连通图，最少包含多少条边？答案提交这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。答案：2018填空题2问题描述将LANQIAO中
力扣每日一题【算法学习day.130】南宫生算法 leetcode 学习算法 java
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.奇偶数位题目链接:2595.奇偶位数-力扣（LeetCode）题面:分析:从右向左遍历每位即可代码:classSolution{publicint[]evenOddBit(intn){int[]ans=newint[2];intind
力扣每日一题【算法学习day.133】南宫生算法 leetcode 学习算法 java
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.设计跳表题目链接:1206.设计跳表-力扣（LeetCode）题面:代码:classSkiplist{int[]arr;publicSkiplist(){arr=newint[20005];}publicbooleansearch(i
【洛谷】P1886 滑动窗口 /【模板】单调队列，经典！ SiMmming 算法算法 c++数据结构
目录题目AC代码详解deque语法一道经典的单调队列模板题！！“如果一个选手比你小还比你强，你就可以退役了。”——单调队列的原理——算法学习笔记(66):单调队列-知乎题目P1886滑动窗口/【模板】单调队列-洛谷【普及/提高-】AC代码#includeusingnamespacestd;intn,m;structNode{intid;//编号intval;//大小};dequeq1;//min,
力扣动态规划-32【算法学习day.126】南宫生算法 #动态规划算法 leetcode 动态规划学习 java
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.完全平方数题目链接:279.完全平方数-力扣（LeetCode）题面:代码:classSolution{privatestaticfinalint[][]memo=newint[101][10001];static{for(int[]
力扣每日一题【算法学习day.128】南宫生算法 #动态规划 leetcode 学习算法 java
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.区间内查询数字的频率题面:2080.区间内查询数字的频率-力扣（LeetCode）题面:分析:缓存每个数字的下标集合，然后通过二分快速算出满足区间的下标个数附上灵神代码:classRangeFreqQuery{privatefinal
用数组实现栈(java) JD_LONG 算法数据结构 java 栈
数据结构与算法学习(java)-栈题目一:用数组实现栈要求:*用数组形式实栈的基本功能,入栈,出栈及显示栈元素功能思路:1.准备一个数组int[]stack;需要变量maxSize表示栈的大小2.入栈(push):需要一个变量(top)来表示栈顶,初始化为-1;当有数据入栈时,top增加,同时将数据传递给stack[top].3.出栈(pop):需要定义变量来接住stack[top],然后top减
Matlab 机器人雅可比矩阵 CodingAlgo 算法
===工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（四）——雅可比矩阵_staubli机器人正逆向运动学实例验证matlab-CSDN博客===matlab求雅可比矩阵_六轴机械臂矢量积法求解雅可比矩阵-CSDN博客===(63封私信/80条消息)MATLAB机器人工具箱中机器人逆解是如何求出来的？-知乎===https://zhuanlan.zhihu.com/p/638
算法学习笔记之数学基础 threesevens 算法与数据结构算法
例1（最小公倍数与最大公约数）计算最小公倍数公式：LCM(A,B)=A*B/GCD(A,B)A与B的最小公倍数等于A*B除以A与B的最大公约数计算最大公约数：辗转相除法原理：设A与B的最大公约数为x，则A是x的倍数，B也是x的倍数，令A=ax，B=bx，A/B取整为c，则A-cB=(a-bc)x。即A与B的余数也是x的倍数 intgcd(inta,intb) { inttemp; whil
算法学习笔记之贪心算法 threesevens 算法与数据结构算法笔记贪心算法
导引（硕鼠的交易）硕鼠准备了M磅猫粮与看守仓库的猫交易奶酪。仓库有N个房间，第i个房间有J[i]磅奶酪并需要F[i]磅猫粮交换，硕鼠可以按比例来交换，不必交换所有的奶酪计算硕鼠最多能得到多少磅奶酪。输入M和N表示猫粮数量和房间数量，随后输入N个房间，每个房间包括奶酪数和猫粮数Input 53 72 43 52 -1-1Output 13.333解法：计算每个房间的奶酪与猫粮之比，比值越大硕鼠收益越
力扣动态规划-28【算法学习day.122】南宫生 #动态规划算法算法 leetcode 动态规划 java 学习
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.执行操作可获得的最大总奖励I题目链接:3180.执行操作可获得的最大总奖励I-力扣（LeetCode）题面:附上灵神代码:importjava.math.BigInteger;classSolution{publicintmaxTot
力扣动态规划-24【算法学习day.118】南宫生算法 #动态规划算法 leetcode 动态规划学习 java
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.和为目标值的最长子序列的长度题目链接:2915.和为目标值的最长子序列的长度-力扣（LeetCode）题面:附上大佬代码:classSolution{publicintlengthOfLongestSubsequence(Listnu
深入理解栈与队列：算法学习者的必备指南 m0_dawn 蓝桥杯算法 python leetcode 数据结构
本文专为算法学习者设计，揭示栈与队列的核心原理及底层实现机制。文末附各语言实现模板和LeetCode练习题。一、基础概念可视化1.1栈（Stack）的直观理解LIFO原则：类似叠盘子，后放入的盘子先被取出核心操作：#Python示例stack=[]stack.append(5)#入栈（Push）top=stack[-1]#查看栈顶（Peek）stack.pop()#出栈（Pop）1.2队列（Que
【算法学习之路】4.简单数论（2）零零时算法学习之路算法学习数据结构笔记经验分享
简单数论（2）前言二.快速幂1.什么是快速幂2.前置知识2.1进制转化2.2短除法2.3普通转换法3.快速幂3.1原理3.2代码4.拓展4.1模运算法则4.2题目前言我会将一些常用的算法以及对应的题单给写完，形成一套完整的算法体系，以及大量的各个难度的题目，目前算法也写了几篇，滑动窗口的题单正在更新，其他的也会陆陆续续的更新，希望大家点赞收藏我会尽快更新的！！！二.快速幂1.什么是快速幂快速幂是一
力扣动态规划-12【算法学习day.106】南宫生算法 #动态规划算法 leetcode 动态规划 java 数据结构
前言###我做这类文章一个重要的目的还是给正在学习的大家提供方向（例如想要掌握基础用法，该刷哪些题？建议灵神的题单和代码随想录）和记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.乘积最大子数组题目链接:152.乘积最大子数组-力扣（LeetCode）题面:代码:classSolution{publicintmaxProd
力扣动态规划-10【算法学习day.104】南宫生算法 #动态规划算法 leetcode 动态规划 java 学习
前言###我做这类文章一个重要的目的还是给正在学习的大家提供方向（例如想要掌握基础用法，该刷哪些题？建议灵神的题单和代码随想录）和记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.环形子数组的最大和题目链接:918.环形子数组的最大和-力扣（LeetCode）题面:附上灵神代码:classSolution{publicin
【算法学习】分治法应用—归并排序 _Huazzi 算法学习笔记算法学习排序算法 C++分治法
归并排序是分治思想的运用。文章目录基本思想：分治之美核心算法✂️分治流程：️过程演示⌛分步实现⌨️完整代码性能分析❓常见问题优化建议基本思想：分治之美将待排序元素分成大小大致相同的2个子集合，分别对2个子集合进行排序，最终将排好序的子集合合并成为所要求的排好序的集合。归并排序（MergeSort）是分治思想的经典应用。其核心理念是：分解：将复杂的大问题分割成简单的小问题解决：逐步解决小问题合并：将
【算法学习】分治法应用—快速排序 _Huazzi 算法学习笔记算法数据结构排序算法
欢迎来到“C语言算法学习”系列！快速排序（QuickSort）是一种非常高效的排序算法，广泛用于实践中。在这篇文章中，我们将详细介绍快速排序的工作原理、C语言实现，并提供一些优化建议、常见问题的解答以及编程技巧。快速排序简介快速排序是分治算法的一种，它的基本思想是：选择一个“分界点”元素，将数组分成两部分，使得左边的所有元素都不大于分界点，右边的所有元素都不小于分界点。然后，递归地对这两部分进行排
【算法学习】归并排序算法思想的应用—求逆序对数量 _Huazzi 算法学习笔记算法排序算法学习 c++分治法
Hey，大家好！今天我们来聊聊一个有趣的话题——如何在归并排序的基础上，高效解决求逆序对数量的问题。如果你对算法感兴趣，或者正在准备算法面试，这篇文章一定会对你有所帮助！题目描述给定一个长度为n的整数数列，请你计算数列中的逆序对的数量。逆序对的定义如下：对于数列的第i个和第j个元素，如果满足ia[j]，则其为一个逆序对；否则不是。输入格式第一行包含整数n，表示数列的长度。第二行包含n个整数，表示整
算法学习019 BFS实现迷踪步 c++算法学习中小学算法思维学习比赛算法题解信奥算法解析小兔子编程信奥算法详解算法宽度优先 BFS C++BFS 广度优先算法 c++迷宫步数 c++迷踪步
C++BFS实现迷踪步一、题目要求1、编程实现有一个n行m列的方格迷宫，用0表示可以通过，用1表示不可以通过，每一步可以向上、下、左、右任意方向移动一格，请计算从左上角(1，1)位置移动到右下角(n，m)位置，最少移动多少步？2、输入输出输入描述：第一行输入矩阵大小n和m
C语言青蛙跳台阶问题共享家9527 c语言
在算法学习中，青蛙跳台阶问题是一个经典的递归和动态规划入门案例。它通过简单的场景，揭示了复杂的算法思想，非常适合初学者理解递归与动态规划的核心概念。一、问题描述一只青蛙要跳上n级台阶，每次它可以跳1级或者2级台阶。那么，青蛙跳上n级台阶总共有多少种不同的跳法呢？二、解题思路递归思路：-对于第n级台阶，青蛙到达它的方式要么是从第n-1级台阶跳1级上来，要么是从第n-2级台阶跳2级上来。-所以，跳上n
Day_1 数据结构与算法&LeetCode入门及攻略 Finger-Von-Frings c++leetcode
数据结构与算法学习目的：我们学习算法和数据结构，是为了学会在编程中从时间复杂度、空间复杂度方面考虑解决方案，训练自己的逻辑思维，从而写出高质量的代码，以此提升自己的编程技能，获取更高的工作回报。数据结构定义：数据结构(DataStructure)指的是带有结构特性的数据元素的集合。学习的目的：为了帮助我们了解和掌握计算机中的数据是以何种方式进行组织、存储的。Q1：何为结构特性？所谓结构特性，指的是
LeetCode 热题 HOT 100 Dong雨力扣hot100 leetcode 算法
点个关注，不迷路！(╯▽╰)好香~~在学习过程中，借助一些优秀的工具可以极大地提升我们的学习效率。例如，使用LeetCode插件，它能够帮助你显示力扣周赛难度分数，让你更好地了解题目的难度，从而合理安排学习计划。算法学习路线推荐基础夯实：先过B站“灵茶山艾府”的“基础算法精讲”专栏，完成每一栏简介里的习题。每日精进：坚持每日一题，保持对算法的敏感度。系统提升：依次完成力扣Hot100、力扣150、
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓