littleqqqqq

增强学习与马尔科夫决策过程

公式及图片正常显示的精美排版版请移步http://lanbing510.info/2015/11/17/Master-Reinforcement-Learning-MDP.html

写在前面

现有的机器学习算法根据模型的学习过程大致可以分为四类：监督式学习，无监督式学习，半监督式学习和增强学习。

① 监督式学习：从标记好的训练数据中进行模型的训练，常用来做分类和回归，例如逻辑回归、反向神经网络；

② 无监督式学习：根据数据的特征直接对数据的结构和数值进行归纳，常用来做聚类，例如周知的K-均值，谱聚类；

③ 半监督式学习：根据部分标记的和部分没有标记的训练数据进行模型的学习，常用来做回归和分类；

④ 增强式学习：作为今天要讨论的主角，是机器学习中最酷的分支之一，其通过不断的试错、反馈进行学习，常用来做序列决策或者控制问题，算法例子有Q-Learning、TD-Learning（Tempora Difference Learning）。

增强学习和人类学习的机制非常相近，在实际应用中也有这很Cool的表现，如直升机自动飞行、各种通过增强学习实现的打败人类最强选手的棋牌博弈机器，包括最近非常火的DeepMind将深度学习和增强学习融合实现的玩Atari游戏的超强程序。下面将结合一个实例，从增强学习的数学本质——马尔科夫决策过程进行阐述。

一个栗子

下面是摘自《人工智能：一种现代方法》中的一个例子：

假设一个智能体处于下图（a）中所示的4x3的环境中。从初始状态开始，它需要每个时间选择一个行动（上、下、左、右）。在智能体到达标有+1或-1的目标状态时与环境的交互终止。如果环境是确定的，很容易得到一个解:[上，上，右，右，右]。可惜智能体的行动不是可靠的（类似现实中对机器人的控制不可能完全精确），环境不一定沿这个解发展。下图（b）是一个环境转移模型的示意，每一步行动以0.8的概率达到预期，0.2的概率会垂直于运动方向移动，撞到（a）图中黑色模块后会无法移动。两个终止状态分别有+1和-1的回报，其他状态有-0.4的回报。现在智能体要解决的是通过增强学习（不断的试错、反馈、学习）找到最优的策略（得到最大的回报）。

上述问题可以看作为一个马尔科夫决策过程，最终的目标是通过一步步决策使整体的回报函数期望最优。下面介绍马尔科夫决策过程。

马尔科夫决策过程

一个马尔科夫决策过程（Markov Decision Processes, MDP）有一个五个关键元素组成 {S,A,{Psa},γ,R} ,其中：

S ：表示状态集合，例如上例中4x3的每个环境 {(i,j)|i=1,2,3,4,j=1,2,3} 。自动直升机系统中的所有可能的位置、方向等。

A ：表示一组动作集合，例如上例中的（上、下、左、右），自动直升机系统中的让飞机向前，向后等。

Psa ：状态转移概率，表示在当前 s∈S 状态下，通过执行动作 a∈A 后转移到其他状态的概率分布。例如上例中， P(1,1)上表示智能体在状态(1,1)执行向上的动作后转移到状态(1,2)，(2,1)的概率分布。

γ∈[0,1) ：阻尼系数，表示的是随着时间的推移回报率的折扣。

R:S×A↦R ：回报函数，有时回报函数是只与 S 有关的函数， R 重写为 R:S↦R 。相当于上例中对每个状态上赋予的回报值。

MDP的动态过程如下：智能体在状态 s0 选择某个动作 a0∈A ，智能体根据概率 Ps0a0 转移到状态 s1 ，然后执行动作 a1 ，…如此下去我们可以得到这样的过程：

s 0 ⟶ a 0 s 1 ⟶ a 1 s 2 ⟶ a 2 s 3 ⟶ a 3 \cdot \cdot \cdot

经过上面的转移路径，我们可以得到相应的回报函数和如下：

R (s 0, a 0) + γ R (s 1, a 1) + γ 2 R (s 2, a 2) + \cdot \cdot \cdot

如果回报函数 R 只与 S 有关，我们上式可重新写作

R (s 0) + γ R (s 1) + γ 2 R (s 2) + \cdot \cdot \cdot

我们的目标是选择一组最佳的动作，使得全部的回报加权和期望最大：

R e w a r d = E [R (s 0) + γ R (s 1) + γ 2 R (s 2) + \cdot \cdot \cdot]

从上式可以发现，在t时刻的回报值是被打了 γt 倍折扣的，注意到 γ<1 ，则越靠后的状态对回报和影响越小，为了得到最大期望回报，智能体将会尽量最先拿最大回报。

下图是上述内容的一个直观示意

下一部分将对上述过程进行进一步数学表示，以方便求解。

进一步数学表示

首先我们来定义策略，一个策略 π 就是一个从状态到动作的映射函数 π:S↦A 。也就是，给定了当前状态 s ，根据策略 π ，也就确定了下一步应该执行的动作 a=π(s) 。

为每一个策略 π 我们顶一个相应的值函数（Value Function）

V π (s) = E [R (s 0) + γ R (s 1) + γ 2 R (s 2) + \cdot \cdot \cdot | s 0 = s, π]

即给定初始状态 s0 和策略 π 后的累积折扣回报期望（Expected Sum Of Discounted Rewards）。

对于一个固定的策略，它的值函数 Vπ 满足贝尔曼等式（Bellman Equations）：

V π (s) = R (s) + γ \sum s' \in S P s π (s) (s') V π (s')

其中 s′ 表示状态 s 执行动作 π(s) 后的下一个可能状态，其服从 Psπ(s) 分布。上式由两部分构成：即时回报 R(s) 及未来累积折扣回报期望 Es′∼Psπ(s)[Vπ(s′)] 。

利用贝尔曼等式能够有效的解出 Vπ （给定的策略 π 的回报值）。尤其，对于一个有限状态的MDP（ |S|<∞ ），对每一个状态 s 我们都能写出这样的等式 Vπ(s) ，求解变为了解一个 |S| 个方程， |S| 个未知数的线性方程组。

当然，我们求解 Vπ 的目的是为找到一个当前状态 s 下最优的行动策略 π 服务的（最优的策略下得到最优的值函数）。定义最优的值函数为：

V * (s) = max π V π (s)

其贝尔曼等式的形式为：

V * (s) = R (s) + max a \in A γ \sum s' \in S P s a (s') V * (s')

也可表示为增强学习中的Q函数形式：

V * (s) = max a Q (s, a)

其中 Q(s,a)≡R(S)+γPsa(s′)V∗(s′) ，表示在 s 状态下执行动作 a 作为第一个动作时的最大累计折扣回报。

对应最优值函数的最优的策略为：

π * (s) = a r g max a \in A \sum s' \in S P s a (s') V * (s')

需要注意的是， π∗ 有一个有趣的特性，即 π∗ 是针对的是所有的状态 s 的，确定了每一个状态 s 的下一个动作 a ，不管初始状态是哪一个状态，通过策略 π∗ 都会取得最大回报。

现在我们有了优化目标的数学表达（最优值函数，最优策略），下一部分讨论两种求解方法（针对有限状态、有限动作的MDP）。

值迭代方法和策略迭代方法

值迭代方法

算法步骤：

1 讲每一个状态 s 的值函数 V(s) 初始化为0

2 循环直至收敛{

对于每一个状态 s ，对 V(s) 做更新

V(s):=R(s)+maxa∈Aγ∑s′V(s′)

}

值迭代方法里面的内循环又有两种策略：同步迭代，异步迭代。同步迭代就是得到 V(s) 后不立即更新，等所有的状态 s 的 V(s) 都完成计算后统一更新。异步迭代就是对每个状态 s 得到新的 V(s) 后立即更新。两种都会使得 V(s) 收敛于 V∗(s) 。求得最优的 V∗(s) 后，可使用公式 π∗(s)=argmaxa∈A∑s′∈SPsa(s′)V∗(s′) 来求出相应的最优策略 π∗ 。

策略迭代方法

于值迭代方法不同，策略迭代法之间关注 π ，使 π 收敛到 π∗ 。

算法步骤：

1 随机初始化话一个 S 到 A 的映射 π

2 循环直至收敛{

2.1 令 V:=Vπ

2.2 对每一个状态s,对 π(s) 做更新

π(s):=argmaxa∈A∑s′Psa(s′)V(s′)

}

其中2.1步即为上述对于一个给定策略 π 利用贝尔曼等式求解 Vπ 的过程（求解 |S| 个方程， |S| 个未知数的线性方程组）。

2.2是根据2.1步的结果，挑选出当前状态 s 下最优的动作 a 来更新 π(s) 。

两者比较

对于规模较小的MDP，策略迭代一般能够更快的收敛；但对于规模较大的MDP（状态多），值迭代更容易些（没有线性方程组的计算）。

MDP中的参数估计

到目前为止，我们讨论的MDP和MDP求解算法都是在已知状态转移概率 Psa 和回报函数 R(s) 的。在许多实际问题中，状态转移概率和回报函数不能显式的得到，本部分讲如何从数据中估计这些参数（通常 S,A,γ 是已知的）。

假设我们已知很多条状态转移路径如下：

s (1) 0 ⟶ a (1) 0 s (1) 1 ⟶ a (1) 1 s (1) 2 ⟶ a (1) 2 s (1) 3 ⟶ a (1) 3 \cdot \cdot \cdot

s (2) 0 ⟶ a (2) 0 s (2) 1 ⟶ a (2) 1 s (2) 2 ⟶ a (2) 2 s (2) 3 ⟶ a (2) 3 \cdot \cdot \cdot

\cdot \cdot \cdot

其中 s(j)i 是 i 时刻第 j 条转移路径对应的状态， aji 是 sji 状态要执行的动作。每条转移路径中的状态数都是有限的，在实际操作中每个转移路径要么进入终结状态，要不达到规定的步数后终结。

当我们获得了很多类似上面的转移路径后（样本），我们可以用最大似然估计来估计状态转移概率。

P s a (s') = # t i m e s t o o k w e a c t i o n a i n s t a t e s a n d g o t t o s ' # t i m e s w e t o o k a c t i o n a i n s t a t e s

上式分子表示在状态 s 通过执行动作 a 后到达状态 s′ 的次数，分母表示在状态 s 我们执行动作的次数。为避免分母为0的情况，当分母为0使，令 Psa(s′)=1|S| 。

对于未知的回报函数，我们令 R(s) 为在状态 s 下观察到的回报均值。

得到状态转移概率和回报函数的估值后，就简化为了前面部分讲述的问题，用第三部分将的值迭代或者策略迭代方法即可解决。例如我们将值迭代和参数估计结合到一块：

算法流程如下：

1 随机初始化话一个 S 到 A 的映射 π

2 循环直至收敛{

2.1 在MDP中执行策略 π 一定次数

2.2 通过2.1得到的样本估计 Psa （和 R ，需要的话）

2.3 使用上一节提到的值迭代方法和估计得到的参数来更新 V

2.4 对于得到的 V 更新得到更优的策略 π

}

其中2.3步，是一个循环迭代的过程。上一节中我们通过将 V 初始化为0然后进行迭代，当嵌套上述过程中后，如果每次都将 V 初始化为0然后迭代更新，速度回很慢。一个加速的方法是将 V 初始化我上次大循环中得到的 V 。

小结

至此我们讨论完了增强学习的数学本质————马尔科夫决策过程（MDP）的数学表示及求解过程（这里的MDP是非确定的MDP，即状态转移函数和回报函数是有概率的,，对于确定性的，求解会更简单些，感兴趣可参考[3]最后一章：增强学习）。全文很大部分是对Andrew Ng讲义[1]的翻译，加上了部分自己的理解。推荐大家根据参考文献进行进一步理解和学习。

参考文献

[1] 机器学习公开课-讲义-马尔科夫决策过程.Andrew Ng

[2] 机器学习公开课-视频-马尔科夫决策过程.Andrew Ng

[3] 人工智能：一种现代方法

[4] 机器学习.Tom M.Mitchell

[5] 看DeepMind如何用Reinforcement learning玩游戏

原文地址：http://blog.csdn.net/lanbing510/article/details/49912739

你可能感兴趣的:(增强学习与马尔科夫决策过程)

Eureka 介绍与原理详解 AllenBright #Eureka eureka 云原生
在微服务架构中，服务发现（ServiceDiscovery）是一个至关重要的组件。随着服务数量的增加，手动管理服务的地址和端口变得不切实际。Eureka是Netflix开源的一款服务发现工具，旨在解决微服务架构中的服务注册与发现问题。本文将详细介绍Eureka的基本概念、工作原理以及如何在微服务架构中使用它。1.什么是Eureka？Eureka是Netflix开源的一个基于REST的服务发现组件，
示例:WPF中绑定枚举到ComboBox的方式 He BianGu WPF wpf
一、目的：在开发过程中，经常会需要把枚举绑定到ComboxBox下拉列表中，其实方法有很多，这里面通过MarkupExtension扩展GetEnumSourceExtension去绑定到列表二、实现定义GetEnumSourceExtension类publicclassGetEnumSourceExtension:System.Windows.Markup.MarkupExtension{pri
MCU与SOC的区别 winds～ ADAS相关单片机嵌入式硬件
自动驾驶中MCU与SoC的区别在自动驾驶系统中，**MCU（微控制单元，MicrocontrollerUnit）和SoC（系统级芯片，SystemonChip）**都是关键的电子元件，但它们在性能、功能和应用领域等方面存在显著区别。一、定义与基本概念1.MCU（微控制单元）组成：MCU是一种集成了处理器核心（通常为微型处理器）、内存（如闪存和RAM）以及输入/输出（I/O）接口的单片集成电路。特点
2025年渗透测试面试题总结-安恒（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全 web安全红蓝攻防
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录安恒1.sqlmap爆出当前数据库库名的参数是什么？2.nmap探测系统类型的参数是？3.nmap的小写-o和-A是做啥的？4.布尔盲注的具体语句是啥？5.宽字节原理6.Python是否存在反序列化漏洞？7.GET与POST传参的区别8.HTTP请求方式9.如何判断C
嵌入式软件工程师为什么要撰写博客？——开启技术进阶与职业发展的双重大门 Electron-er 软件需求嵌入式硬件架构单片机人工智能
目录一、技术沉淀：构建嵌入式知识复利系统知识沉淀的三层架构二、职业发展：量化个人技术品牌价值职业价值评估模型三、社区贡献：推动嵌入式技术生态演进知识传播的涟漪效应四、写作方法论：打造专业级技术博客内容开发五步法可视化增强技术五、数据验证：博客投资回报率分析六、实践指南：从入门到专家的路径规划博客运营路线图关键成功要素结语一、技术沉淀：构建嵌入式知识复利系统在嵌入式开发领域，寄存器操作、RTOS调度
WPF的五种绑定模式 WangPride wpf
WPF的五种绑定模式WPF的绑定模式(mode)是枚举的，枚举值共有5个：1、OneWay(源变就更新目标属性)2、TwoWay(源变就更新目标并且目标变就更新源)3、OneTime(只根据源来设置目标，以后都不会变)4、OneWayToSource(与OneWay相反)5、Default(可以单向或双向，是靠被值定的源或目标是否有get过set来指定的)WPF的逻辑树与视觉树基本概念：与ASP.
深入解析ADC寄存器：从原理到实战配置 Electron-er 嵌入式硬件单片机架构 stm32
目录引言一、ADC寄存器核心作用与分类1.寄存器在ADC中的角色2.寄存器典型分类二、STM32ADC寄存器深度解析1.关键寄存器映射表2.寄存器级ADC配置实战三、TIADS1115配置寄存器详解1.16位配置寄存器结构（I2C从地址0x48）2.**I2C配置代码示例（Arduino平台）**四、寄存器操作中的常见陷阱与解决方案1.典型问题排查表2.**调试技巧**五、寄存器优化设计趋势1.自
深入解析STM32时钟树：从原理到实战配置 Electron-er stm32 单片机嵌入式硬件
目录引言一、STM32时钟树体系架构解析1.1时钟树全景图1.2核心时钟源详解二、时钟信号流向与控制逻辑2.1主时钟路径2.2关键分频系数2.3时钟门控机制三、CubeMX实战配置3.1配置步骤演示3.2代码生成分析四、调试技巧与常见问题4.1时钟诊断方法4.2典型故障排查五、高级应用技巧5.1动态时钟切换5.2时钟安全系统(CSS)5.3超频实践（风险提示）结语引言在嵌入式系统开发中，时钟系统堪
深入解析模拟/数字转换（ADC）：从原理到应用实践 Electron-er 单片机 stm32 嵌入式硬件
目录引言一、ADC的核心概念与技术指标1.ADC的定义与基本原理2.关键性能指标二、主流ADC架构及适用场景1.逐次逼近型（SARADC）2.积分型（双斜ADC）3.流水线型（PipelineADC）4.Σ-Δ型ADC三、ADC在嵌入式开发中的实践1.STM32的ADC配置实例2.抗干扰设计技巧四、ADC的行业应用与前沿趋势1.核心应用领域2.技术发展趋势五、开发避坑指南结语标签：模数转换、嵌入式
PHP火山引擎API签名方法蚊子爱喝水 PHP 火山引擎
一、前置准备在开始签名之前，需要准备以下信息：AccessKeyID（AK）：请求火山引擎OpenAPI的安全凭证之一。SecretAccessKey（SK）：与AK成对使用，用于签名计算。请求参数：包括HTTP请求方法、URI、查询参数、请求头等。二、签名流程(文档地址)火山引擎API签名流程大致分为以下几个步骤：创建规范请求：将请求参数进行规范化处理，形成CanonicalRequest。创建
以STM32为例-通俗语言理解SPI通信协议 Electron-er STM32 stm32 单片机 51单片机物联网嵌入式硬件 iot
文章目录SPI是什么四条“车道”的作用工作模式就像“舞蹈的节奏”通信过程是“一场对话”SPI通信的“厉害之处和用途”SPI是什么想象SPI是一个小小的数据高速公路，专门用于让STM32芯片和其他设备（比如传感器或者存储卡）之间快速地传递信息。这条高速公路有四条“车道”，分别有不同的用途。四条“车道”的作用1.主设备输出/从设备输入线（MOSI）：这就好比是主设备（STM32）的一个“说话通道”。主
strtr和str_replace效率探索 hello_simon php
今天写代码用到字符串规制，就上网查了下strtr与str_replace的效率如何，网上一些地方说strtr比str_replace快四倍。半信半疑，自己就做了下测试。strtr比较怪异，用法这里不提。只做两种这两个函数可以替换用的测试例子。第一种list($usec,$sec)=explode('',microtime());$star=$usec+$sec;$string='paocaiasd
2025版最新如何参加护网行动？零基础入门到精通，收藏这篇就够了！程序媛西米网络安全 web安全网络安全 HVV 护网行动网络安全计算机
1.什么是护网行动护网行动是以公安部牵头的，用以评估企事业单位的网络安全的活动。具体实践中，公安部会组织攻防两方，进攻方会在一个月内对防守方发动网络攻击，检测出防守方（企事业单位）存在的安全漏洞。通过与进攻方的对抗，企事业单位网络、系统以及设备等的安全能力会大大提高。“护网行动”是国家应对网络安全问题所做的重要布局之一。“护网行动”从2016年开始，随着我国对网络安全的重视，涉及单位不断扩大，越来
CES Asia2025新机制引关注，科技创新奖申报火热赛逸展张胜科技
随着2025第七届亚洲消费电子技术贸易展（赛逸展）“展位即门票”机制的推出，科技创新奖的申报工作也正式拉开帷幕。截至目前，已有数十家企业提交了申报材料，涵盖人工智能、物联网、智能硬件等多个热门领域。据了解，CESAsia2025科技创新奖旨在表彰在科技研发和产品创新方面取得卓越成就的企业。此次申报面向所有预订展位的参展企业，评审过程将由行业专家、院士，协会，学者和媒体代表共同参与，确保评选结果的公
对vue VS react的理解向贤前端开发 vue.js react.js 前端
对vueVSreact的理解Vue与React的核心区别在于设计哲学：Vue追求渐进式开发和开箱即用，通过模板语法、响应式系统和官方生态提供低门槛的集成方案。React强调函数式编程和纯JavaScript驱动，以JSX、单向数据流和灵活的生态构建高自由度的视图层。核心差异可总结为：响应式机制、模板vsJSX、API设计、生态策略、性能优化模式。分点论述：1.响应式机制Vue：基于数据劫持（Vue
移远通信Wi-Fi 7模组产品获创新大奖：以前沿技术重新定义无线通信新篇章移远通信 WiFi
近日，2024年信息通信业高质量发展硬核力量榜单发布。全球领先的物联网整体解决方案供应商移远通信凭借其在2024年推出的两款支持Wi-Fi7技术的通信模组FGE576Q和FGE573Q荣获产品创新奖。此次活动由ICT行业领先的全媒体传播与服务平台——C114通信网特别策划举办，聚焦2024年度信息通信业最值得关注的企业、产品和解决方案，激励技术创新与应用，助力物联网技术与各行业融合及规模化应用，并
再添殊荣！移远通信工业智能品牌宝维塔™斩获AI创新应用奖移远通信算力人工智能工业智能
12月24日，2024中国物联网产业大会暨第21届慧聪品牌盛会在深圳圆满落幕。会上，移远通信凭借其工业智能品牌宝维塔™在推动AI技术落地与应用创新方面的卓越贡献，获颁“AI创新应用奖”。作为科技发展的前沿力量，AI技术正深刻改变着各行各业的生产模式和效率，尤其在工业领域，展现出了巨大潜力。宝维塔™是移远通信精心打造的工业智能品牌，专注于将人工智能、边缘计算、机器视觉、深度学习、软件算法平台等前沿技
出海行动派 | 全球服务新征程！Bonree ONE海外版正式发布运维
在云计算、大数据与物联网深度融合的驱动下，全球IT运维行业正经历从被动响应到主动智能的深刻变革。Gartner最新数据显示，可观测性市场规模将从2021年的68亿美元跃升至2027年的111亿美元，复合年增长率达8.3%，标志着企业对应用稳定性与用户体验的极致追求已成为数字化转型的核心命题。与此同时，全球化进程中的文化差异与合规要求，对运维解决方案的本地化适配能力提出了更高挑战。BonreeONE
直播交友带货/线上交友1V1视频直播线下活动组织前端后端小程序数据库负载均衡
直播交友带货是一种结合了直播、社交和电商的新型销售模式。主播通过直播展示商品，与观众进行实时互动，并引导观众购买商品。这种模式下，观众不仅可以观看商品的实时展示，还可以与主播进行互动交流，增加购物的趣味性和互动性。对于主播而言，直播交友带货不仅可以提高商品销售量，还可以增加粉丝数量和粘性。通过实时互动，主播可以更好地了解观众的需求和喜好，从而调整销售策略和商品选择。对于观众而言，直播交友带货提供了
2025年渗透测试面试题总结-阿里巴巴-阿里云安全（二面）（题目+回答）独行soc 2025年渗透测试面试指南科技安全 web安全面试职场和发展红蓝攻防阿里云
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录阿里巴巴-阿里云安全二面一、职业方向与技术偏好1.安全研究vs安全研发的定位二、云安全与身份认证2.云上PKI与身份认证的关注方向三、项目实践与成果3.字节跳动训练营项目四、攻防技术深度解析4.SQL注入攻防方案5.WAF防护原理五、团队协作与效能优化6.分工协作与个
一文搞懂MCU和SoC的核心差异：从架构到应用场景全解析 Electron-er 单片机架构嵌入式硬件
目录引言一、从“芯片大脑”看本质：架构设计的哲学差异1.MCU：单一任务的执行专家2.SoC：系统级集成的超级平台二、实战对比：六大维度拆解差异1.性能指标对比2.开发模式对比三、选型指南：如何选择MCU或SoC？1.选择MCU的场景2.选择SoC的场景四、技术演进：MCU与SoC的融合趋势1.MCU的进化方向2.SoC的突破方向五、开发者避坑指南结语标签：MCUvsSOC、嵌入式系统、芯片选型、
「机器人」扑翼飞行器通过总气动力控制四自由度运动方法 Robot_Starscream 「机器人学」机器人人工智能算法
一、前言在扑翼飞行中，总气动力（TotalAerodynamicForce）是指扑翼在运动过程中受到的所有空气动力作用的合力。它是由以下两种主要力的合成结果：1.升力（Lift,）：垂直于空气流方向的力，用于支持飞行器（或生物）的重量。2.阻力（Drag,）：平行于空气流方向的力，用于抵抗前进的运动。二、总气动力的物理意义总气动力F_{uk}的物理意义在于描述了扑翼在不同运动状态下所受到的气动力合
深入理解Tomcat：Java Web服务器的安装与配置杨凯凡 JavaWeb java tomcat
大家好！今天我们来聊聊JavaWeb开发中最重要的工具之一——ApacheTomcat。Tomcat是一个开源的JavaServlet容器和Web服务器，它是运行JavaWeb应用程序的核心环境。无论是开发、测试还是部署JavaWeb应用，Tomcat都是不可或缺的工具。本文将详细介绍Tomcat的安装、配置以及常见问题的解决方法，帮助你快速上手并深入理解Tomcat的工作原理。准备好了吗？让我们
一文吃透C++数组：概念与操作大揭秘大雨淅淅 C++开发数据库 c++开发语言
目录一、C++数组初印象二、C++数组概念剖析2.1数组定义与本质2.2数组声明与初始化方式2.2.1声明2.2.2初始化2.3数组元素访问三、C++数组操作全解析3.1遍历数组3.1.1for循环遍历3.1.2范围for循环遍历3.2修改数组元素3.3获取数组大小3.4多维数组操作3.4.1二维数组3.4.2.多维数组拓展3.5数组作为函数参数3.5.1传数组名3.5.2函数原型声明四、C++数
责任链模式的C++实现示例香菇滑稽之谈 C++笔记责任链模式 c++开发语言设计模式
核心思想责任链模式是一种行为设计模式，允许多个对象都有机会处理请求，从而避免请求的发送者与接收者之间的耦合。请求沿着处理链传递，直到某个对象处理它为止。解决的问题解耦请求发送者与处理者：请求的发送者无需知道具体由哪个对象处理请求。动态分配责任：可以在运行时动态调整处理链，灵活添加或移除处理者。避免硬编码：避免将请求处理逻辑硬编码在某个类中，提高代码的可扩展性和可维护性。使用场景多级审批流程：如请假
@JsonFormat @DateTimeFormat 注解徐寿春待整理文档 java
@JsonFormat(shape=JsonFormat.Shape.STRING,pattern="yyyy-MM-ddHH:mm:ss",timezone="GMT+8")@DateTimeFormat(pattern="yyyy-MM-ddHH:mm:ss")@JsonFormat注解用于在Java对象与JSON数据之间进行序列化和反序列化操作序列化过程时，转化为对应属性的日期时间格式。○s
策略模式与责任链模式 CV明学习策略模式责任链模式
策略模式策略模式(StrategyPattern)又叫政策模式(PolicyPattern)它是将定义的算法家族，分别分装起来，让它们之间可以互相替换，从而让算法的变化不会影响到使用算法的用户。可以避免多重分支的if。。。else。。。和switch语句属于行为型模式适用场景假如系统中有很多类，而他们的区别仅仅在于他们的行为不同。一个系统需要动态地在几种算法中选择一种。需要屏蔽算法规则。Compa
Websoft9：为开发者打造的高效 Linux 服务器面板 linuxlinux运维运维
Websoft9作为一款以开源应用部署与管理为核心的服务器面板，其平台设计与运行环境深度耦合，形成了“环境即服务”的独特模式。这种关系体现在环境标准化、自动化配置、安全融合及资源管理等多个维度。以下从四个核心层面详细阐述二者的协同机制：一、运行环境标准化：平台能力的基石Websoft9的运行环境并非孤立存在，而是平台功能实现的底层支撑。多语言与框架的预集成•平台内置PHP、Python、Java、
python进程与线程_python进程和线程 weixin_39543758 python进程与线程
python进程和线程概念GIL:全局解释锁，解决了不同线程同时访问统一资源时，数据保护问题。python虽然是多线程，但是因为GIL,实际上是是单线程，由CPU轮询，假线程。(一个线程运行一段时间后会释放GIL,另一个线程获取GIL便会执行，然后再释放)进程：是具有一定独立功能的程序关于某个数据集合上的一次运行活动。进程是系统进行资源分配和调度的一个独立单位。(进程间通信方式：套接字，信号，管道
在线代码编辑器与编辑器插件介绍 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介对于开发人员来说，编编辑器(或称之为IDE)是一个综合性工具，它融合了程序编写、调试、版本控制、性能分析、项目管理等多项功能在内的全套工具集。市场上已经有很多种流行的编辑器供开发者选择。比如：SublimeText、VSCode、Atom、Eclipse、Notepad++等等。虽然每个编辑器都各具特色，但是无论从功能还是性能上都有着它们独有的优势。这些优点主要
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他