花_哥

1、强化学习---马尔可夫决策过程

马尔可夫决策过程

马尔可夫过程
马尔可夫奖励过程(MRP)

值函数
MRP的贝尔曼方程(Bellman equation):
迭代算法求MRP的值函数

马尔可夫决策过程(MDP)

MDP中的Policy
MDP的值函数
贝尔曼期望方程
最优值函数
最优policy

MDP问题中的预测和控制

马尔可夫过程

已知过往的过程为：
$h_t = \{s_1,s_2,s_3,.....s_t\}$
那具备马尔可夫性的状态有如下性质：
$\begin{aligned} p(s_{t+1}|s_{t}) &= p(s_{t+1}|h_t)\\ p(s_{t+1}|s_t,a_t) &= p(s_{t+1}|h_t,a_t) \end{aligned}$
状态转移矩阵为：

马尔可夫奖励过程(MRP)

MRP是马尔可夫链+reward
MRP的定义为：

S是一个有限状态的集合；
P是一个动态转移的概率模型 $P(S_{t+1} = s'|s_t = s)$
R是一个奖励函数 $R(s_{t} = s) = \mathbb{E}[r_t|s_t = s]$
折扣因子 $\gamma\in[0,1]$

如果状态有限，R就是一个向量

MRP的例子：

关于 $r_t$ 和 $R$ 的理解：首先看到 $R$ 是对 $t$ 求期望，故它是一个关于状态的函数，与时间无关。所以 $r$ 是一个随机过程， $r_t$ 是一个随机变量，我们通常说的reward指的是 $R$ 。

值函数

关于回报的定义(return)：从t时刻起，到一个epsiode结束的折扣累积奖励，用 $G_t$ 来表示：
$G_t = R_{t+1} + \gamma R_{t+2} + {\gamma}^2R_{t+3}+.....+{\gamma}^{T-t-1}R_{T}$
注： $R_t$ 是随机变量， $R$ 不是！
对于MRP过程的值函数的定义为:
$\begin{aligned} V_t(s) &= \mathbb{E}[G_t|s_t = s]\\ &= \mathbb{E}[R_{t+1} + \gamma R_{t+2} + {\gamma}^2R_{t+3}+.....+{\gamma}^{T-t-1}R_{T}|s_t = s] \end{aligned}$
由表达式可知， $G_t$ 是一个随机变量， $V_t(s)$ 是一个关于 $t$ 和 $s$ 的二元函数，代表了在当前时刻 $t$ 当前状态 $s$ 下的 $G_t$ 的期望，是一个标量，故它会随着时间和状态都发生改变，值函数的大小也反映了在当前时间点当前状态下的能获得的预期奖励的大小。（这个期望是对 $G_t$ 这个随机变量的分布进行积分。）

MRP的例子：

从上面的例子可以看出，因为 $G_t$ 是一个关于 $t$ 的随机变量，故在不同的时间点，从同一个状态出发的回报(return) $G_t$ 是不同的，并且会随着时间步的长短和 $\gamma$ 的大小发生较大变化。

MRP的贝尔曼方程(Bellman equation):

通过价值函数的定义可以得到以下递推式：
$\gamma \sum_{s'\in S} P(s'|s)V(s')$
证明：先引入一个引理：期望的和等和的期望。
$\begin{aligned} E[X+Y|S] &= \iint(x+y)f(x,y|s)dxdy \\ &=\iint x f(x,y|s)dxdy + \iint yf(x,y|s)dxdy \\ &=\int xf_X(x|s)dx +\int yf_Y(y|s)dy\\ & = E[X|S] + E[Y|S] \end{aligned}$
所以
$\mathbb{E}[R_{t+1} + \gamma R_{t+2} + {\gamma}^2R_{t+3}+.....+{\gamma}^{T-t-1}R_{T}|s_t = s] \\ = \mathbb{E}[R_{t+1}|s_t = s] +\gamma\mathbb{E}[G_{t+1}|s_t = s]$
通过前述可知， $G_t$ 是由 $R_t$ 求和而成，由定义式知 $G_{t+1}$ 在这里并没有马尔可夫性。( $G_t=R_{t+1} + \gamma R_{t+2}....$ )
故
$\mathbb{E}[G_{t+1}|s_t = s] = \mathbb{E}[G_{t+1}] = \sum P(s'|s)\mathbb{E}[G_{t+1}|s_{t+1} = s']$

我们还可以把递推式写成矩阵形式：

通过解上述方程便可得到V向量，但是因为复杂度过高，故一般不采用这样的方法。

迭代算法求MRP的值函数

A、蒙特卡洛算法

（这里t的含义是，当前时刻(迭代了N次以后)的值函数。）
MC方法就是通过采样求平均的方式来用期望的无偏估计平均值来代替期望。

B、迭代求解

根据MRP的贝尔曼方程一直迭代，直到值函数向量趋于稳定。

马尔可夫决策过程(MDP)

$S$ 是有限状态的集合。
$A$ 是有限动作的集合。
$P^a$ 是一个转移模型 = $P(s_{t+1} = s' | s_t = s,a_t = a)$

MDP由(S,A,P,R, $\gamma$ )构成。
在MDP过程中，R不仅与状态有关还与所采取的动作有关。

MDP中的Policy

Policy是在给定状态时的动作的分布。
Policy: $\pi(a|s) = P(a_t = a|s_t=s)$

根据Policy可以让MDP(S,A,P,R, $\gamma$ )和policy $\pi$ )与MRP过程(S, $P^\pi$ , $R^\pi$ , $\gamma$ )等价：
$P^\pi(s'|s) = \sum_{a\in A}\pi(a|s)P(s'|s,a)\\ R^\pi(s) = \sum_{a\in A}\pi(a|s)R(s,a)$
MP/MRP过程与MDP过程的比较示意图：

MDP还会多经历一步在动作分布上对动作的采样，从而来决定下一个状态的转移概率。

MDP的值函数

MDP中的值函数(state-value) $v^\pi(s)$ 表示的是在状态s，policy是 $\pi$ 的预期回报。动作价值(action-value)函数是 $q^\pi(s,a)$ 。
$v^\pi(s) = \mathbb{E}[G_t|s_t = s]\\ q^\pi(s,a) = \mathbb{E}[G_t|s_t = s,A_t = a]$
$v^\pi(s)$ 和 $q^\pi(s,a)$ 之间的关系为：
$v^\pi(s) = \sum_{a\in A} \pi(a|s)q^\pi(s,a)\\ q^\pi(s,a) = R_a^s +\gamma \sum_{s'\in S} P(s'|s,a)v^\pi(s')$

贝尔曼期望方程

$v^\pi(s) = E_\pi[R_{t+1}+\gamma v^\pi(s_{t+1})|s_t = s]\\ q^\pi(s,a) = E_\pi[R_{t+1}+\gamma q^\pi(s_{t+1},A_{t+1})|s_t = s,A_t = a]$
根据之前的MRP的贝尔曼方程可以很容易的得到MDP的贝尔曼方程：
$v^\pi (s) = \sum_{a\in A}\pi(a|s)(R(s,a)+\gamma\sum_{s'\in S}P(s'|s,a)v^\pi(s')) \\ q^\pi(s,a) = R(s,a) +\gamma\sum_{s'\in S}P(s'|s,a)\sum_{a'\in A}\pi(a'|s')q^\pi(s',a')$
再从直观上理解以下上述方程表达的含义：

下图两个练习的代码附在后面：

#练习1
S = list(range(7))
V1 = np.array([0,0,0,0,0,0,0])
V = np.array([999,999,999,999,999,999,999])
R = np.array([5,0,0,0,0,0,10])
epsilon = 10
gamma = 0.5
pro=np.array([[0,0,0,0,0,0,0],[1,0,0,0,0,0,0],[0,1,0,0,0,0,0],[0,0,1,0,0,0,0],
              [0,0,0,1,0,0,0],[0,0,0,0,1,0,0],[0,0,0,0,0,1,0]])
#terminal_state = 0

while np.abs(V1.sum()-V.sum())>0.0001:
    V = V1
    for s in S:
        all_sum = 0
        for s_ in S:
            all_sum = all_sum + pro[s][s_]*V[s_]
        V1[s] = R[s] + gamma*all_sum
print(V)

#练习2
S = list(range(7))
V1 = np.array([0,0,0,0,0,0,0])
V = np.array([999,999,999,999,999,999,999])
R = np.array([5,0,0,0,0,0,10])
epsilon = 10
gamma = 0.5
pro=np.array([[0.5,0.5,0,0,0,0,0],[0.5,0,0.5,0,0,0,0],[0,0.5,0,0.5,0,0,0],[0,0.5,0,0.5,0,0,0],
              [0,0,0,0.5,0,0.5,0],[0,0,0,0,0.5,0,0.5],[0,0,0,0,0,0.5,0.5]])
while np.abs(V1.sum()-V.sum())>0.0001:
    V = V1
    for s in S:
        all_sum = 0
        for s_ in S:
            all_sum = all_sum + pro[s][s_]*V[s_]
        V1[s] = R[s] + gamma*all_sum
print(V)

最优值函数

最优的值函数和动作值函数指的是遍历所有的policy选择能使值函数 $v_\pi(s)$ 或者 $q_\pi(s,a)$ 最大的策略，并将最大值作为最优值函数。
$v_*(s) = \max_{\pi}v_{\pi}(s)\\ q_*(s,a) = \max_{\pi}q_{\pi}(s,a)$
最优值函数展示了MDP的可能的最优表现。

最优policy

定义：如果对于任意状态都有 $v_\pi(s)>= v_{\pi'}(s)$ 那么就有， $\pi>=\pi'$
定理：对于任意的MDP都存在以下性质：

一定存在最优策略 $\pi_*$
最优策略一定能够产生最优值函数 $v_{\pi_*}(s) = v_*(s)$
最优策略一定能产生最优的动作值函数 $q_{\pi_*}(s,a) = q_*(s,a)$

最优策略可以通过最大化动作值函数来获得：
$\pi_{*}(a | s)=\left\{\begin{array}{ll} 1 & \text { if } a=\underset{a \in \mathcal{A}}{\operatorname{argmax}} q_{*}(s, a) \\ 0 & \text { otherwise } \end{array}\right.$
注：对于任意的MDP一定存在一个最优的决定性的policy。

MDP问题中的预测和控制

1、prediction：

输入：MDP $< S, A, P, R, γ >$ 和ploicy $\pi$ 或者写成 $< S, P^{π}, R^{π}, γ >$
输出：价值函数 $v^\pi$

2、control：

输入：MDP $< S, A, P, R, γ >$
输出：最优的值函数 $v^*$ 和最优的policy $\pi^*$

以上两个问题都可以用动态规划来解决。因为原问题可以被递归分解成多个子问题，故若达到全局最优，那在任一子问题上也是最优。

你可能感兴趣的:(1、强化学习---马尔可夫决策过程)

JAVA泛型 TraceChen JAVA java
JAVA泛型Java泛型（generic）是在JDK1.5版本引用的一种新的特性，泛型提供编译时安全检查机制，该机制允许程序员在编译时检查非安全的类型。一、泛型本质泛型本质是数据化类型，即先给类型指定一个参数，然后使用时再指定参数具体的值，那么这个类型可以在使用时候决定，这种参数类型可以用在类、接口、方法中，分别被称为泛型类、泛型接口、泛型方法。 Listlist=newArrayListl
stm32h7关串口中断怎么弄_stm32h7“HardFault_Handler（硬件异常中断）分析” weixin_39926191 stm32h7关串口中断怎么弄
在stm32调试中有时候会进入硬件异常中断HardFault_Handler。SEGGER公司(旗下有大名鼎鼎的emWin图形工具)提供一种硬件异常中断HardFault_Handler定位调试方法。在MDK和IAR开发环境都适用。这里，我们在MDK开发环境上记录一次调试经历。1、硬件异常案例主函数是对按键K1和摇杆OK的接收处理操作，如伪代码1伪代码1intmain(void){//按键初始化函
服务器使用宝塔上传文件时卡住了的解决办法 Frozen-tzy 服务器运维 linux
当我用宝塔向服务器上传文件时，它一直显示上传速度是0，卡住不动了。还有一种情况是上传到一半失败了，这时报了一个磁盘空间不足的错。这时我们来看宝塔面板首页的磁盘空间，一般会看到它是红色的，接近100%，这时我们就需要清理掉服务器中不必要的文件（比如日志、缓存等）我们也可以通过命令来查看磁盘的使用情况：通过SSH登录服务器df-h输出示例FilesystemSizeUsedAvailUse%Mount
使用CSS3实现炫酷的3D翻转卡片效果木木黄木木 css3 3d 前端
使用CSS3实现炫酷的3D翻转卡片效果这里写目录标题使用CSS3实现炫酷的3D翻转卡片效果项目介绍技术要点分析1.3D空间设置2.核心CSS属性3.布局和定位实现难点和解决方案1.3D效果的流畅性2.卡片内容布局3.响应式设计性能优化建议浏览器兼容性总结项目介绍在这个项目中，我们使用纯CSS3技术实现了一个具有3D翻转效果的交互卡片。当用户将鼠标悬停在卡片上时，卡片会沿Y轴优雅地旋转180度，展示
深入理解 C# 反射的使用鲤籽鲲 C#c#开发语言 C#知识捡漏 C#反射
总目录前言反射是.NET框架中一个强大的特性，允许程序在运行时检查和操作类型信息。通过反射，开发者可以动态地创建对象、调用方法、访问属性等，为程序提供了极大的灵活性。本文将详细讲解C#反射的使用方法及其应用场景。一、什么是反射？1.定义反射（Reflection）是指程序在运行时能够检查和操作其自身的类型信息。通过反射，可以获取类型的成员（如方法、属性、事件等）并动态地调用它们。在.NET框架中，
数学建模清风课程笔记——第二章 TOPSIS法 minpengyuanBITer 数学建模数学建模笔记
TOPSIS(TechniqueforOrderPreferencebySimilaritytoIdealSolution)可翻译为逼近理想解排序法，国内简称为优劣解距离法。TOPSIS法是一种常用的综合评价方法，其能充分利用原始数据的信息，其结果能够精确地反映各评价方案之间的差距。评价类问题1TOPSIS法TOPSIS法概念：TOPSIS法是一种常用的综合评价方法，能充分利用原始数据的信息，其结
鸿蒙NEXT开发之开屏广告实现怀男孩 harmonyos harmonyos 华为
1.广告请求服务的实现首先，你需要创建一个广告请求服务来处理广告的加载和展示。你已经在代码中实现了requestAd函数，接下来需要处理广告加载、显示、点击等事件。可以考虑以下结构：1.1创建广告加载函数import{advertising,identifier}from'@kit.AdsKit';import{hilog}from'@kit.PerformanceAnalysisKit';imp
async和 await 的基本使用怀男孩前端 javascript 开发语言
目录1.async/await是什么？2.async/await基本语法3.async函数和await的特点3.1async函数的特点3.2async函数的特点代码演示3.3await的特点4.try/catch捕获错误1.async/await是什么？async/await是一种用于处理异步操作的Promise语法糖。(语法糖:更易读、更简洁或更符合人类思维习惯而设计的一种语法方式)通过使用as
3.ArkTS语法介绍北辰星Charih HarmonyNext harmonyos
一、具体内容ArkTS语法介绍-华为开发者学堂(huawei.com)二、习题整理2.1判断题1.ArkTS中使用const声明常量。正确(True)错误(False)答案：正确(True)2.允许在容器组件内使用if/else条件渲染语句构建不同的子组件。正确(True)错误(False)答案：正确(True)3.@Entry装饰的自定义组件将作为UI页面的入口。在单个UI页面中可以使用多个@E
LeetCode每日一题——30. 串联所有单词的子串 hyk今天写算法了吗 #算法实例 leetcode 算法职场和发展数据结构 python
文章目录题目示例思路题解题目给定一个字符串s和一些长度相同的单词words。找出s中恰好可以由words中所有单词串联形成的子串的起始位置。注意子串要与words中的单词完全匹配，中间不能有其他字符，但不需要考虑words中单词串联的顺序。示例示例1：输入：s=“barfoothefoobarman”,words=[“foo”,“bar”]输出：[0,9]解释：从索引0和9开始的子串分别是“bar
前端面经分享（25/03/18） CreatorRay react 面试前端前端面试 react
北京一家做边缘云服务提供商公司，技术一面，15k-20k，要求3-5年上家公司的项目为什么会选择MQTT进行通信React常用Hook为什么React不能在条件语句里用Hook前端常见的优化策略React如何捕获子组件的错误React给节点加key会有什么效果最近俩家公司都用WebSocket做了什么HTTP各个版本的区别跨域的常见解决方案前端常见布局WebSocket和SSE的区别A页面滚动到一
「Python数据分析」Pandas基础，筛选数据利器：布尔索引奕澄羽邦 python 数据分析 pandas
我们在处理数据的时候，数据筛选是一个重要的过程。利用布尔索引，我们可以选择需要的数据区间。布尔索引，是利用各种不等式，以及与或非操作，来对数据区间进行选择。在pandas中，与操作，对应的是&这个符号，表示选取两个数据集重合的部分。或操作，对应的是|这个符号，表示选择两个数据集中，只要在一个数据集中出现的部分。非操作，对应的是~这个符号，表示选取一个数据集中，相反的部分。我们下面通过具体的例子，来
STM32 SPI总线驱动CH376T实现U盘/TF卡读写全解析—SPI通信、命令集与文件操作（下） | 零基础入门STM32第七十五步触角01010001 STM32入门教程（100步）stm32 驱动开发单片机嵌入式硬件物联网
主题内容教学目的/扩展视频CH376芯片重点课程电路原理，跳线设置，切换U盘和TF卡。手册分析。驱动程序。调用常用函数。会调用现有函数操作U盘即可。师从洋桃电子，杜洋老师文章目录1.引言2.硬件连接3.驱动程序分析3.1SPI通信机制4.CH376命令集详解4.1常用命令表4.2命令使用示例5.初始化程序解析6.数据读写函数实现6.1写数据到文件6.2从文件读取数据7.应用示例：U盘状态检测8.扩
流式编程 JDK8 Stream的简单使用方法介绍桔仔 java jdk stream
JDK8Stream文章目录JDK8Stream概念特点代码简洁多核友好示例foreach方式Stream方式流程操作特性常用操作符具体用法一、流的创建1.1使用Collection下的stream()和parallelStream()方法。1.2使用Arrays中的stream()方法，将数组转成流。1.3使用Stream中的静态方法：of()、iterate()、generate()。1.4使
固态电池行业深度研究报告：技术变革与市场展望萧十一郎@ 知识科普大数据人工智能
目录一、引言1.1研究背景与目的1.2研究方法与数据来源二、固态电池概述2.1定义与分类2.1.1定义2.1.2分类2.2工作原理2.3发展历程三、固态电池技术优势与挑战3.1技术优势3.1.1高安全性3.1.2高能量密度3.1.3长循环寿命3.2技术挑战3.2.1离子电导率低3.2.2固-固界面问题3.2.3锂枝晶生长3.2.4成本高昂四、固态电池材料体系与技术路线4.1固态电解质材料4.1.1
智慧物流数字管理系统设计案例分析 UI设计开发服务商数据分析数据挖掘
你好，宝子们！艾斯视觉团队在此，我们专注于UI设计和前端开发领域10年有余。非常高兴能与您分享我们的经验和见解。如果您觉得有所帮助，请给予我们支持和关注，并随时私信我们，共同探讨进步！谢谢您的鼓励！随着科技的飞速发展，数字化已经成为现代物流业的重要发展趋势。智慧物流数字管理系统旨在通过先进的技术手段，实现物流信息的实时共享、智能分析和优化决策，从而提高物流效率、降低成本并提升客户满意度。本文将以一
编译时报错“LNK2019 无法解析的外部符号”的可能原因及其解决办法烟锁池塘柳0 程序设计与编程语言 c++
在VS2022中运行C++程序的时候，有时候会遇到这样的问题：1>（源文件名称）.obj:errorLNK2019:无法解析的外部符号"public:__cdecl（函数名(参数列表)）"(??0（函数名与乱码）@@QEAA@XZ)，函数main中引用了该符号1>项目路径\x64\Debug\可执行程序名.exe:fatalerrorLNK1120:1个无法解析的外部命令遇到这种问题，可以说是很难
【数学建模】层次分析法(AHP)详解及其应用烟锁池塘柳0 数学建模数学建模
层次分析法(AHP)详解及其应用引言在现实生活和工作中，我们经常面临复杂的决策问题，这些问题通常涉及多个评价准则，且各准则之间可能存在相互影响。如何在这些复杂因素中做出合理的决策？层次分析法(AnalyticHierarchyProcess,AHP)作为一种系统、灵活的多准则决策方法，为我们提供了科学的决策工具。文章目录层次分析法(AHP)详解及其应用引言什么是层次分析法？层次分析法的基本原理层次
【数学建模】模糊综合评价模型详解、模糊集合论简介烟锁池塘柳0 数学建模数学建模
模糊综合评价模型详解文章目录模糊综合评价模型详解1.模糊综合评价模型概述2.模糊综合评价的基本原理2.1基本概念2.2评价步骤3.模糊综合评价的数学模型3.1数学表达3.2模糊合成运算4.模糊综合评价的应用领域5.模糊综合评价的优缺点5.1优点5.2缺点6.模糊综合评价的实现步骤7.模糊综合评价在实际项目中的应用案例8.结论参考资料1.模糊综合评价模型概述模糊综合评价法(FuzzyComprehe
【数学建模】灰色关联分析模型详解与应用烟锁池塘柳0 数学建模数学建模算法
灰色关联分析模型详解与应用文章目录灰色关联分析模型详解与应用引言灰色系统理论简介灰色关联分析基本原理灰色关联分析计算步骤1.确定分析序列2.数据无量纲化处理3.计算关联系数4.计算关联度灰色关联分析应用实例实例：某企业生产效率影响因素分析灰色关联分析在各领域的应用灰色关联分析的Python实现灰色关联分析的局限性结论引言在数据分析领域，我们经常面临样本量少、信息不完全、数据不确定性高的情况。传统的
查看 Linux 系统中安装的 CUDA 版本烟锁池塘柳0 Linux CUDA linux ubuntu
查看Linux系统中安装的CUDA版本的常见方法：文章目录1查看/usr/local/cuda目录2使用nvcc命令3检查libcublas版本注意：nvidia-smi1查看/usr/local/cuda目录通常，CUDA被安装在/usr/local/cuda目录下，所以可以使用ls命令来查看这个目录是否存在，以及查看其中的内容。ls/usr/local/cuda如果这个目录存在，通常它会是一个
数据分析_python进行数据筛选1_行筛选 Monkey*王 python 数据分析 pandas
以titanic的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin\Desktop\train.csv")df=df.head(10)df.index=['a','b','c','d','e','f','g','h','i','g']筛选单行1.利用df[行索
前端面经真题解析10-字节/抖音电商/前端/超详细记录浪里个浪zxf 前端面试前端
文章目录1.自我介绍2.介绍下自己的项目3.看你项目里面用了axios,说下请求拦截和响应拦截怎么做？4.说下项目里面前后端交互过程及设计？5.怎么处理切换分页请求数据的，优化手段？6.说下你爬取别人网站数据的时候，别人如果设置了拦截，你的解决方案是？7.你说下http请求的refer字段？**Origin字段：****Referer字段：****Host字段****区别：**8.看你做了路由懒加
SAP之顾问篇 FF.5电子银行对账单 SAP圣父 SAP
直接上干货一.配置财务会计→银行会计核算→业务往来→支付交易→电子银行对账单→进行电子银行对账单的全局设置1.创建科目符号例:ZS012.对科目符号分配科目给ZS01设置总账科目3.创建过账规则码例:Z0014.定义过账规则给Z001设置借贷方过账代码，借贷方科目5.创建业务类型例:ZT016.对过账规则分配外部事务类型给ZT01设置外部交易码(※2)，设置过账规则:Z0017.对事务类型分配银行
优化Redis AOF重写配置：解决AOF文件过大的终极指南冯·诺依曼的 redis 数据库缓存云计算
核心配置参数解析与优化以下配置参数位于Redis配置文件/etc/redis.conf中，用于控制AOF持久化与重写行为。通过合理调整这些参数，可显著减少AOF文件体积并提升性能。1.appendfsync：AOF文件同步策略默认值：everysec修改建议：appendfsyncno作用：控制AOF日志同步到磁盘的频率。everysec（默认）：每秒同步一次，平衡性能与数据安全。no：由操作系统
Vue.js 中常见的以 $ 开头的实例属性和方法遇见~未来 Vue.js vue.js javascript 前端
1.$data作用：包含Vue实例或组件的响应式数据对象。用法：通过this.$data访问组件的data数据。示例：exportdefault{data(){return{message:'Hello,Vue!'};},created(){console.log(this.$data.message);//输出:Hello,Vue!}};2.$el作用：指向Vue实例或组件的根DOM元素。用法：
详解Springboot的启动流程凭君语未可面试 spring boot 后端 java
在Redis中实现分布式锁1.主入口与SpringApplication.run()2.准备阶段3.创建应用上下文（ApplicationContext）4.Bean定义加载与上下文刷新5.EmbeddedWebServer的启动（针对Web应用）6.ApplicationRunner和CommandLineRunner执行7.应用启动完成总结1.主入口与SpringApplication.run
C#：深入理解Thread.Sleep与Task.Delay 妮妮学代码 c#c#开发语言
1.核心区别概述特性Thread.SleepTask.Delay阻塞类型同步阻塞当前线程异步非阻塞，释放线程适用场景同步代码中的简单延时异步编程中的非阻塞等待资源消耗占用线程资源（线程挂起）不占用线程（通过计时器回调）精度依赖操作系统调度（≈15ms精度）更高精度（≈1ms）取消支持❌不支持✔️支持CancellationToken异常处理无法被中断可响应取消操作并抛出异常2.原理与底层机制(1)
Java泛型 lgily-1225 日常积累 java 开发语言后端
Java泛型是Java5引入的一项重要特性，旨在增强类型安全、减少代码冗余，并支持更灵活的代码设计。以下是对泛型的详细介绍及使用指南：一、泛型核心概念泛型允许在类、接口、方法中使用类型参数（如），使得代码可以处理多种数据类型，而无需重复编写逻辑。解决的问题类型安全：避免运行时ClassCastException。消除强制类型转换：编译器自动处理类型转换。代码复用：同一逻辑可处理不同类型的数据。二、
前端面经分享（25/03/19） CreatorRay 前端面试前端面试
北京一家做协同办公软件出海的公司，技术一面，20k-40k，要求3-5年详细聊了一下上家公司的项目上家公司的项目是不做了吗，离职原因是什么，你觉得公司的这个产品怎么样在做AI类的业务时，作为前端感觉跟常规业务有什么区别详细聊了一下上上家公司的项目细节讲一下项目里用编辑器做了什么事遇到过什么难解决的问题项目里提供的UI自动化的功能是怎么做的聊了一下写博客的事情有没有了解过浏览器底层的东西最近在研究或
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他