KpLn_HJL

cs285-lec5-policy gradient

文章目录

总结
数学推导
- 怎么计算 $J(\theta)$ ？
- 怎么优化 $J(\theta)$ ？
对比policy gradient和supervised learning的maximum likelihood
partial observability
优缺点
- 优点
- 缺点
reduce the variance
- 因果性定理
- 衰减因子 $\gamma$ 降低variance
- 减baseline方式降低variance
on-policy -> off-policy
- on-policy性质
- 推广到off-policy
代码实现
自动调整学习率 $\alpha$
Questions
- Why does policy gradient have high variance?
- How to calculate $\log \pi_\theta(a|s)$ ?

总结

按照RL的算法框架，policy gradient的整体步骤如下：

sample ${ s_i, a_i \}$ from $\pi_\theta(a|s)$ (run it over data)
计算期望： $J(\theta)=E_{\tau \sim p_\theta(\tau)}[\sum_t r(s_t, a_t)]\approx\frac{1}{N}\sum_i \sum_t r(s_{i,t}, s_{i,t})$
$\nabla_\theta J(\theta) \approx \frac{1}{N}\sum_{i = 1}^N \sum_{t=1}^T \nabla_\theta \log \pi_\theta(a_{i,t} | s_{i,t}) \Big( \Big(\sum_{t' = t}^T \gamma^{t'-t}r(s_{i,t'}, a_{i, t'}) \Big) - b)$ , involving causal policy, discount factor $\gamma$ , reduced baseline.
$\theta = \theta + \alpha \nabla_\theta J(\theta)$

Sergey把以上过程认为是一种formalization of trial-and-error

数学推导

总体来看，RL是为了学到policy，2种传统的方法，policy-gradient以及value-based方法。前者是直接对policy建模，valued-based是间接的方法

RL的优化目标为： $\theta^* =\argmax_{\theta}\underbrace{E_{\tau \sim p_\theta(\tau)}[\sum_t r(s_t, a_t)]}_{J(\theta)}$

怎么计算 $J(\theta)$ ？

在实际使用中，可以用多次trajectory的结果对 $E$ 做近似，即：
$J(\theta)=E_{\tau \sim p_\theta(\tau)}[\sum_t r(s_t, a_t)]\approx\frac{1}{N}\sum_i \sum_t r(s_{i,t}, s_{i,t})$

怎么优化 $J(\theta)$ ？

在实际使用的时候，除了计算 $J$ ，还需要优化 $J$ ，所以需要计算 $J$ 对 $\theta$ 的导数

首先把 $J$ 简写一下： $J(\theta) = E_{\tau \sim p_\theta(\tau)}[\underbrace{r(\tau)}_{\sum_{t=1}^Tr(s_t,a_t)}] = \int p_\theta(\tau)r(\tau)d\tau$

对 $J$ 求 $\theta$ 的导数，有： $\nabla_\theta J(\theta)=\int \nabla_\theta p_\theta(\tau)r(\tau)d\tau$ ，这个需要求 $\nabla_\theta p_\theta(\tau)$ ，但是 $p$ 是未知的

对 $p$ 做一下数学变换，有：
$p_\theta(\tau) \nabla_\theta \log p_\theta(\tau) = p_\theta(\tau) \frac{\nabla_\theta p_\theta(\tau)}{p_\theta(\tau)} = \nabla_\theta p_\theta(\tau)$
代入到 $\nabla_\theta J(\theta)$ 中，有：
$\begin{aligned} \nabla_\theta J(\theta) &= \int \nabla_\theta p_\theta(\tau) r(\tau) d\tau \\ &= \int p_\theta(\tau) \nabla_\theta \log p_\theta(\tau) r(\tau) d\tau \\ \end{aligned}$
因为 $p(\tau)$ 对某个数字的积分可以写成期望，所以进一步有：
$\begin{aligned} \nabla_\theta J(\theta) &= \int \nabla_\theta p_\theta(\tau) r(\tau) d\tau \\ &= \int p_\theta(\tau) \nabla_\theta \log p_\theta(\tau) r(\tau) d\tau \\ &= E_{\tau \sim p_\theta(\tau)}[\nabla_\theta \log p_\theta(\tau) r(\tau)] \end{aligned}$

现在 $\log p_\theta(\tau)$ 还是没法计算，考虑到：
$\begin{aligned} p_\theta(\tau) &= p_\theta(s_1, a_1, \dots, s_T, a_T) \\ &= p(s_1) \prod_{t = 1}^T \pi_\theta(a_t | s_t)p(s_{t+1}|s_t, a_t) \end{aligned}$
公示两边同时增加log，有：
$\begin{aligned} \log p_\theta(\tau) &= \log p(s_1) + \sum_{t = 1}^T [\log \pi_\theta(a_t|s_t) + \log p(s_{t+1}|s_t, a_t)] \end{aligned}$

现在可以把 $\log p_\theta(\tau)$ 代入到 $\nabla_\theta J(\theta)$ 中，有：
$\begin{aligned} \nabla_\theta J(\theta) &= E_{\tau \sim p_\theta(\tau)}[\nabla_\theta \log p_\theta(\tau) r(\tau)] \\ &= E_{\tau \sim p_\theta(\tau)}\Bigg[\nabla_\theta \Big[ \underbrace{\log p(s_1)}_{\text{对}\theta\text{的导数为0}} + \sum_{t = 1}^T \big[\log \pi_\theta(a_t|s_t) + \underbrace{\log p(s_{t+1}|s_t, a_t)}_{\text{对}\theta\text{的导数为0}}\big] \Big]r(\tau)\Bigg] \\ &= E_{\tau \sim p_\theta(\tau)}\Bigg[ \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|s_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big) \Bigg] \\ \end{aligned}$
类似求 $J$ 的那样，用多个trajectory的和来近似 $E$ ，即：
$\begin{aligned} \nabla_\theta J(\theta) &= E_{\tau \sim p_\theta(\tau)}[\nabla_\theta \log p_\theta(\tau) r(\tau)] \\ &= E_{\tau \sim p_\theta(\tau)}\Bigg[\nabla_\theta \Big[ \underbrace{\log p(s_1)}_{\text{对}\theta\text{的导数为0}} + \sum_{t = 1}^T \big[\log \pi_\theta(a_t|s_t) + \underbrace{\log p(s_{t+1}|s_t, a_t)}_{\text{对}\theta\text{的导数为0}}\big] \Big]r(\tau)\Bigg] \\ &= E_{\tau \sim p_\theta(\tau)}\Bigg[ \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|s_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big) \Bigg] \\ &\approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|s_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big) \end{aligned}$
这样计算出来 $\nabla_\theta J(\theta)$ 后，更新 $\theta$ 就可以用 $\theta = \theta + \alpha \nabla_\theta J(\theta)$ 了

例如，REINFORCE算法的迭代步骤为：

从 $\pi_\theta(a_t|s_t)$ 中sample $\tau^i$
$\nabla_\theta J(\theta) \approx \sum_i \Big(\sum_t \nabla_\theta\log \pi_\theta(a_t^i|s_t^i) \Big) \Big( \sum_t r(s_t^i, a_t^i) \Big)$
$\theta \leftarrow \theta + \alpha \nabla_\theta J(\theta)$

对比policy gradient和supervised learning的maximum likelihood

supervised learning的log maximum likelihood目标函数为：
$\begin{aligned} \max \nabla_\theta J(\theta) &\approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log P(X|\theta) \Big) \\ &\approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|s_t) \Big) \end{aligned}$

而policy gradient的优化目标为：
$\max \nabla_\theta J(\theta) \approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|s_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big)$
两者的区别在于后面有没有reward

在supervised learning中，因为有label，所以可以保证 $s_t, a_t$ 一定是好的，因此不需要reward，优化必然是要增加 $\log \pi$ 那一部分
但reinforcement learning因为没有label，所以需要reward，在优化时可能就不是要单纯增加 $\log \pi$ 那一部分，而可能是减小

policy gradient的核心在于 $\log \pi_\theta(a_t|s_t)$ 的选取上

partial observability

partial observability的问题是，只能观察到obs而不是states。在RL中，只有假设states满足markov性质，但obs是不一定满足的。

但是因为policy gradient不需要markov property，所以可以用在partial observability的问题上

即，对于partial observation，目标函数同样为：
$\max \nabla_\theta J(\theta) \approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|o_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big)$

优缺点

优点

更好的收敛性，肯定能收敛
可以在连续分布上选择action

缺点

high variance：因为很难give credit to actions that bring more future rewards
inefficiency：on-policy导致每次都需要sample data based on policy

reduce the variance

因果性定理

因果性定理：在t时刻做出的policy，不会影响t时刻以前的reward

RL的目标函数：
$\nabla_\theta J(\theta) \approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|o_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big)$

根据上面这个因果性定理，在 $\nabla_\theta J(\theta)$ 中将 $\sum_{t = 1}^T r(s_t, a_t)$ 替换为policy所在的时刻t及之后的reward，即reward-to-go，有：
$\begin{aligned} \nabla_\theta J(\theta) &\approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|o_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big) \\ &\approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|o_t) \Big) \underbrace{ \Big( \sum_{t' = t}^T r(s_{t'}, a_{t'}) \Big)}_{\text{reward-to-go}, \hat{Q}_{i,t} } \end{aligned}$

替换完之后，因为sum of reward小了，所以期望也小了，进一步的variance也小了

衰减因子 $\gamma$ 降低variance

考虑更远的未来会导致vairance过高（考虑越远，policy越会过拟合），theoretically the discount factor should start at $t = 1$ , that is:
$\begin{aligned} \nabla_\theta J(\theta) &\approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_{i,t}|s_{i,t}) \Big) \Big( \sum_{t=1}^T \gamma^{t-1}r(s_{i,t}, a_{i,t}) \Big) \\ &\approx \frac{1}{N} \sum_{i = 1}^N \sum_{t = 1}^T \gamma^{t-1} \nabla_\theta\log \pi_\theta(a_{i,t}|s_{i,t}) \Big( \sum_{t'=t}^T \gamma^{t'-t}r(s_{i,t'}, a_{i,t'}) \Big) \end{aligned}$

In practice we don’t use this, because it could mean later rewards and steps matter less.

So we will use:
$\nabla_\theta J(\theta) \approx \frac{1}{N} \sum_{i = 1}^N \sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_{i,t}|s_{i,t}) \Big( \sum_{t'=t}^T \gamma^{t'-t}r(s_{i,t'}, a_{i,t'}) \Big)$

减baseline方式降低variance

要降低policy gradient的variance，做法是，减掉1个baseline（减掉1个baseline，可以让reward低于平均值的action得到一个负的梯度，高于平均的得到正的梯度），也即：
$\begin{aligned} \nabla_\theta J(\theta) &\approx \frac{1}{N} \sum_{i = 1}^N \nabla_\theta \log p_\theta(\tau) [r(\tau) - b] \\ b &= \frac{1}{N}\sum_{i = 1}^Nr(\tau) \end{aligned}$
减去1个常数b不会影响expection，同时还能降低variance，因为：
$\begin{aligned} E[\log p_\theta(\tau) b] &= \int p_\theta(\tau) \nabla_\theta \log p_\theta(\tau) b \;d\tau \\ &= \int \nabla_\theta p_\theta(\tau) b \;d\tau \\ &= b \nabla_\theta \int p_\theta(\tau) \;d\tau \\ &= b\nabla_\theta1 \\ &= 0 \end{aligned}$
注：

baseline设置为average reward不是最优，但是效果很不错了已经
上面第一步到第二步的推导，用到了： $p_\theta(\tau) \nabla_\theta \log p_\theta(\tau) = p_\theta(\tau) \frac{\nabla_\theta p_\theta(\tau)}{p_\theta(\tau)} = \nabla_\theta p_\theta(\tau)$
$\int p_\theta(\tau) \;d\tau$ 是条件概率分布的积分，也即1

开始准备最优baseline（实际中不常应用，但还是可以推导一下），把variance写出来：
$Var[x] = E[x^2] - E^2[x]$
将 $J$ 写成期望的形式，有：
$\nabla_\theta J(\theta) = E_{\tau \sim p_\theta(\tau)}[\nabla_\theta \log p_\theta(\tau) (r(\tau) - b)]$
所以方差推导：
$\begin{aligned} Var &= E_{\tau \sim p_\theta(\tau)}[(\underbrace{\nabla_\theta \log p_\theta(\tau)}_{\text{用}g(\tau)\text{代替}} (r(\tau) - b))^2] - \underbrace{E_{\tau \sim p_\theta(\tau)}^2[\nabla_\theta \log p_\theta(\tau) (r(\tau) - b)]}_{\text{期望与b无关, 所以可以直接写成原先的E}} \\ &= E_{\tau \sim p_\theta(\tau)}[g^2(\tau)(r(\tau) - b))^2] - E^2_{\tau \sim p_\theta(\tau)}[g(\tau) r(\tau)] \end{aligned}$
求方差对 $b$ 的梯度，有：
$\begin{aligned} \frac{\partial Var}{\partial b} &= \frac{\partial}{\partial b}E[\underbrace{g^2(\tau)(r^2(\tau)}_{\text{对b的导数为0}} - 2br(\tau) + b^2)] \\ &= -2E[g^2(\tau)r(\tau)] + 2bE[g^2(\tau)] \end{aligned}$
令梯度为0，得到：
$\frac{E[g^2(\tau)r(\tau)]}{E[g^2(\tau)]}$
其实就是reward的期望/平均值，只不过做了个 $E[g^2(\tau)]$ 的增幅，使得b和policy相关了。不同的policy parameter会导致不同的b

Considering actor-cirtic which has low variance, we could use value function as the baseline, if and only if this baseline is state-dependent:
$\nabla_\theta J(\theta) \approx \frac{1}{N}\sum_{i = 1}^N \sum_{t=1}^T \nabla_\theta \log \pi_\theta(a_{i,t} | s_{i,t}) \Big( \Big(\sum_{t' = t}^T \gamma^{t'-t}r(s_{i,t'}, a_{i, t'}) \Big) - \hat{V}^\pi_\phi(s_{i,t}) \Big)$

on-policy -> off-policy

on-policy性质

policy gradient是一种on-policy的算法， $J(\theta)=E_{\tau \sim p_\theta(\tau)}[\sum_t r(s_t, a_t)]$ ，其中 $\tau \sim p_\theta(\tau)$ 表示每次都需要从当前的policy导致的样本分布中sample样本，也即每次都需要从新分布中sample样本。

由于on-policy非常inefficient，所以考虑off-policy的policy gradient

推广到off-policy

如果可以用其他分布得到samples，就可以把on-policy变成off-policy

引入一个IS/importance sample概念

importance sample，对期望做变换，有：
$\begin{aligned} E_{x \sim p(x)}(f(x)) &= \int p(x)f(x) dx \\ &= \int \frac{q(x)}{q(x)} p(x)f(x) dx \\ &= \int q(x) \frac{p(x)}{q(x)} f(x) dx \\ &= E_{x \sim q(x)}[\frac{p(x)}{q(x)}f(x)] \end{aligned}$

同理代入 $J(\theta) = E_{\tau \sim p_\theta(\tau)}[r(\tau)]$ 中，假设我们没有从 $p_\theta(\tau)$ 中sample的 $\tau$ ，但是有从 $\bar{p}_\theta(\tau)$ 中sample出的 $\tau$ ，此时：
$J(\theta) = E_{\tau \sim \bar{p}_\theta(\tau)}[\frac{p_\theta(\tau)}{\bar{p}_\theta(\tau)}r(\tau)]$
对 $\frac{p_\theta(\tau)}{\bar{p}_\theta(\tau)}$ 有：
$\begin{aligned} \frac{p_\theta(\tau)}{\bar{p}_\theta(\tau)} &= \frac{p(s_1) \prod_{t = 1}^T \pi_\theta(a_t | s_t)p(s_{t+1}|s_t, a_t)}{p(s_1) \prod_{t = 1}^T \bar\pi_\theta(a_t | s_t)p(s_{t+1}|s_t, a_t)} \\ &= \frac{\prod_{t = 1}^T \pi_\theta(a_t | s_t)}{\prod_{t = 1}^T \bar\pi_\theta(a_t | s_t)} \end{aligned}$

利用这个性质去预测新的参数 $\theta'$ ，有：
$\begin{aligned} J(\theta') &= E_{\tau \sim p_\theta(\tau)}[\frac{p_{\theta'}(\tau)}{p_\theta(\tau)}r(\tau)] \\ \nabla_{\theta'}J(\theta') &= E_{\tau \sim p_\theta(\tau)}[\frac{\nabla_{\theta'}p_{\theta'}(\tau)}{p_\theta(\tau)}r(\tau)] \\ &= E_{\tau \sim p_\theta(\tau)}[\frac{p_{\theta'}(\tau)}{p_\theta(\tau)}\nabla_{\theta'}\log p_{\theta'}(\tau)r(\tau)] \end{aligned}$
其中：

第2步，是因为只有 $p_{\theta'}(\tau)$ 与 $\theta'$ 有关，所以求导数可以直接把符号放进去
第3步，利用数学变换： $p_\theta(\tau) \nabla_\theta \log p_\theta(\tau) = p_\theta(\tau) \frac{\nabla_\theta p_\theta(\tau)}{p_\theta(\tau)} = \nabla_\theta p_\theta(\tau)$
注意最后这个 $\nabla_{\theta'}J(\theta')$ 的形式，其实和 $\nabla_{\theta}J(\theta)$ 几乎相同，只是前面增加了一个 $\frac{p_{\theta'}(\tau)}{p_\theta(\tau)}$

最终 $\nabla_\theta J(\theta)$ 如下

对on-policy：
$\begin{aligned} \nabla_\theta J(\theta) &= E_{\tau \sim p_\theta(\tau)}[\nabla_\theta \log p_\theta(\tau)r(\tau)] \\ &\approx \frac{1}{N}\sum_{i = 1}^N \sum_{t=1}^T \nabla_\theta \log \pi_\theta(a_{i,t} | s_{i,t}) \hat{Q}_{i,t} \end{aligned}$
其中： $\hat{Q}_{i,t} = \sum_{t' = t}^T r(s_{i,t'}, a_{i, t'})$ ，表示未来的reward之和

类似地，对off-policy:
$\begin{aligned} \nabla_{\theta'} J(\theta') \approx \frac{1}{N}\sum_{i = 1}^N \sum_{t=1}^T \frac{\pi_{\theta'}(a_{i,t}|s_{i,t})}{\pi_{\theta}(a_{i,t}|s_{i,t})}\nabla_{\theta'}\log \pi_{\theta'}(a_{i,t} | s_{i,t}) \hat{Q}_{i,t} \end{aligned}$

代码实现

在实现时，计算 $\nabla_\theta \log \pi_\theta$ 效率太低了，所以做法是，找到一个loss function，使其梯度和 $\nabla_{\theta} J(\theta)$ 相同即可，比如：
$\tilde{J}(\theta) \approx \frac{1}{N}\sum_{i=1}^N \sum_{t=1}^T \underbrace{\log \pi_\theta(a_{i,t}|s_{i,t})}_{\text{cross entropy/squared error}}\hat{Q}_{i,t}$

在代码中实现时，和supervised learning很相似，以下例子以离散的action为例
supervised learning：

'''
Given
actions - (N * T) * Da tensor of actions
states - (N * T) * Ds tensor of states
'''
logits = policy.predictions(states)
negative_likelihoods = tf.nn.softmax_cross_entropy_with_logits(labels=actions, logits=logits)
loss = tf.reduce_mean(negative_likelihoods)
gradients = loss.gradients(loss, variables)

policy gradient:

'''
Given
actions - (N * T) * Da tensor of actions
states - (N * T) * Ds tensor of states
q_values - (N * T) * 1 tensor of estimated state-action values
'''
logits = policy.predictions(states)
negative_likelihodds = tf.nn.softmax_cross_entropy_with_logits(labels=actions, logits=logits)
weighted_negative_likelihoods = tf.multiply(negative_likelihoods, q_values)
loss = tf.reduce_mean(weighted_negative_likelihoods)
gradients = loss.gradients(loss, variables)

注意policy gradient和supervised learning还是不一样的：

gradient有很大的variance
gradient will be noisy
batch_size需要很大
lr不好调参了（adam算法还是能用）

自动调整学习率 $\alpha$

policy gradient也有学习率过大导致梯度下降不稳定、震荡的问题，因此也有自动调整的 $\alpha$ ，可见论文：15-icml-trust region policy optimization

Questions

Why does policy gradient have high variance?

Because policy gradient optimizes on every single sample, the expected value of total rewards is calculated as:
$J(\theta)=E_{\tau \sim p_\theta(\tau)}[\sum_t r(s_t, a_t)]\approx\frac{1}{N}\sum_i \sum_t r(s_{i,t}, s_{i,t})$
And to optimize $J(\theta)$ , we need to calculate $\nabla_\theta J(\theta)$ as:
$\nabla_\theta J(\theta) \approx \frac{1}{N} \sum_{i = 1}^N \Big(\sum_{t = 1}^T \nabla_\theta\log \pi_\theta(a_t|s_t) \Big) \Big( \sum_{t = 1}^T r(s_t, a_t) \Big)$

This method uses every single sample, so usually it has low bias but high variance.

How to calculate $\log \pi_\theta(a|s)$ ?

OpenCV中常用特征提取算法（SURF、ORB、SIFT和AKAZE）用法示例（C++和Python）点云SLAM 图形图像处理 opencv 算法 ORB算法 SIFT算法 SURF算法 AKAZE算法计算机视觉
OpenCV中提供了多种常用的特征提取算法，广泛应用于图像匹配、拼接、SLAM、物体识别等任务。以下是OpenCV中几个主流特征提取算法的用法总结与代码示例，涵盖C++和Python两个版本。常用特征提取算法列表算法特点是否需额外模块SIFT（尺度不变特征）稳定性强、可旋转缩放xfeatures2d模块SURF（加速稳健特征）快速但专利保护xfeatures2d模块ORB（OrientedFAST
CSS 样式设计：背景、字体与边框渐变详解前端呆猿 css 前端
一、CSS背景渐变CSS背景渐变是现代网页设计中常用的技术，可以创建平滑的颜色过渡效果，替代传统的静态背景图像。1.线性渐变(LinearGradient).element{background:linear-gradient(toright,#ff7e5f,#feb47b);}方向参数：toright、toleft、tobottom、totop，或角度如45deg可以添加多个颜色节点：linea
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制王莽v2 机器人神经网络神经网络算法控制器
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制摘要本文研究了在水平面内运动的全驱动自主水下机器人的轨迹跟踪问题。在我们的控制设计中考虑了外部干扰、控制输入非线性和模型不确定性。基于离散时间域的动力学模型，两个神经网络(包括一个临界神经网络和一个作用神经网络)被集成到我们的自适应控制设计中。引入临界神经网络来评价设计的控制器在当前时间步长内的长期性能，并利用作用神经网络来补偿未知动
脱岗离岗逃岗监测识别软件系统平台标检测算法#YOLO
值班脱岗智能监测识别系统是一种利用AI视频智能分析技术的智能化系统，能够对办公工作岗位区域、岗亭、值班室、生产线岗位等进行7*24小时不间断实时监测。该系统的出现，有助于提高工作效率，确保工作秩序的正常运行，同时也能有效避免值班人员脱岗、懈怠等现象的发生。该系统的工作原理是通过高清摄像头捕捉实时画面，然后利用AI视频智能分析技术对画面进行实时分析，识别出是否有人脱岗、懈怠或者有其他异常情况发生。当
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
智界R7智驾功能和性能评价 TheWanderers 智能驾驶智界
一、智驾行车能力标题硬件配置与系统架构感知硬件：Max/Ultra版搭载1个192线激光雷达、3个毫米波雷达（含1个4D成像雷达）、12个超声波雷达、11个高清摄像头（含前向800万像素双目+鱼眼镜头）。Pro版未配备激光雷达，但保留3个毫米波雷达和10个摄像头。核心算法：HUAWEIADS3.0系统，基于端到端架构，整合感知、决策与控制模块，支持全场景目标识别（如非标准障碍物、夜间行人）。算力支
人工智能视频分析系统人员离岗报警设计方案 liuhu21 人工智能云计算运维
一、方案概述近几年安防监控技术不断的进步，特别是在人工智能推出之后。安防监控系统结合人工智能算法做到了许多以前无法做到的事情。就比如我们今天要说的离岗检测报警监控系统。以前我们只能通过人工值守监控室的方式，通过人的判断去观看现场人员在岗情况。如今有了离岗检测监控系统，系统可以自动监测现场人员是否在岗、离岗时间以及离岗人数等等。这样，大大减少了监控室值班人员的工作量，同时相较人工监管提升了工作效率。
睡岗离岗检测算法 Python 燧机科技SuiJi 人工智能 python 算法深度学习神经网络
睡岗离岗检测算法的核心在于实时监控和智能分析，睡岗离岗检测算法通过安装在关键区域的监控摄像头，系统能够捕捉到员工的活动画面。当系统检测到人体位置长时间未发生变化时，将启动睡姿分类器。该分类器能够识别多种睡姿，如趴在桌子上睡、坐在凳子上后仰睡等。一旦识别为睡姿，系统将立即触发告警机制。这可以通过向管理人员发送警报信号，或通过语音提醒员工的方式实现。睡岗离岗检测算法在多种场景下均有广泛应用。该算法能够
微算法科技技术创新，将量子图像LSQb算法与量子加密技术相结合，构建更加安全的量子信息隐藏和传输系统
随着信息技术的发展，数据的安全性变得尤为重要。在传统计算模式下，即便采用复杂的加密算法，也难以完全抵御日益增长的网络攻击威胁。量子计算技术的出现为信息安全带来了新的解决方案。然而，量子图像处理领域仍面临复杂度高、效率低的问题。微算法科技通过将量子图像LSQb算法与量子加密技术相结合，提出了一种全新的信息隐藏和传输方案，旨在构建更加安全高效的数据保护机制。LSQb算法，即量子图像的最小有效量子比特算
5万人流挤地铁如何追踪？陌讯算法实战FPS飙升300%
开篇痛点在智慧城市安防场景中，传统视觉算法常面临“三难困境”：低光照漏检率飙升（夜间误报率超30%）、人群遮挡ID切换混乱（MOTA指标＜50%）、硬件资源吃紧（1080P视频流处理＞200ms）。某省会交警平台曾反馈：“雨雾天车牌识别准确率骤降至65%，追踪目标平均5分钟丢失1次”。技术解析：动态多目标蒸馏网络陌讯视觉算法创新性融合多任务蒸馏架构与时空注意力机制，攻克复杂场景泛化难题。核心公式创
3步实现安防高精度检测：陌讯算法夜间监控落地实战 2501_92474745 目标跟踪人工智能计算机视觉算法目标检测视觉检测
开篇痛点：安防监控系统在实时目标检测中常面临严峻挑战。实测数据显示，传统算法在低光、遮挡或动态场景下，泛化能力不足，导致平均误报率高达15%（数据来源：安防行业报告）。尤其在夜间或拥挤环境下，系统卡顿、漏检频发，不仅降低响应效率，还增加安全隐患。例如，某城市交通监控中心反馈，其开源模型在高密度人流中出现每秒帧率（FPS）骤降至20帧以下，引发报警延迟问题。这些问题根源在于算法鲁棒性和实时性不足，亟
离岗误报率 20%？陌讯时序算法实测降 90% 2501_92474711 算法计算机视觉目标跟踪机器学习人工智能边缘计算
开篇：工业安防中的"隐形漏洞"在制造业车间、变电站等关键场景，离岗检测是保障生产安全的核心环节。传统监控系统依赖人工巡检，存在85%的漏检率；而普通视觉算法在光照变化、人员遮挡场景下，误报率常高达20%以上[实测数据显示]。某汽车零部件厂曾因离岗检测失效导致设备空转2小时，直接损失超12万元。这种"看得见的监控，防不住的风险"困境，凸显了传统视觉方案在复杂工业场景中的局限性。技术解析：从单帧检测到
雨天障碍物漏检？陌讯多模态算法实测 98% 准确率 2501_92474711 算法目标跟踪人工智能计算机视觉
开篇痛点：自动驾驶视觉系统的“暗礁”在自动驾驶感知层，路面障碍物识别堪称“生命线工程”。传统视觉算法在复杂场景下常面临三重困境：雨天水雾导致特征模糊时漏检率高达25%，逆光环境下小目标（如碎石、井盖）检出率不足60%，而追求高精度又会导致帧率跌破20FPS，难以满足实时性要求[1]。某车企实测数据显示，传统YOLOv8在城郊混合路况中，因障碍物识别延迟引发的决策偏差占测试事故的37%，这些问题成为
打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
题解 | #使用join查询找出没有分类的电影id以及名称# 愤怒的小青春 java
58同城java后端一面凉经主流的哈希算法有哪几种？帮闺蜜们找靠谱男票hc多多光彩积云是什么企业，查不到有用信息太抽象了！培训班装公司招聘阿里巴巴前端暑期实习——无语八面挂怎么写自我介绍|自我介绍保姆级教学灵犀互娱客户端一面面经(求过啊)24找运维实习，这简历可行吗拓竹科技测试开发面经（25届暑期实习）分享一波攒了整个秋招的NLP算法岗面经腾讯广告暑期实习面试1、JVM垃圾回收机制2、syncho
【算法题解】部分洛谷题解(下) 日月星辰cmc 算法分析与设计算法
前言本篇为我做过的洛谷题的部分题解，大多是我认为比较具有代表性的或者比较有意思的题目，包含我自己的思考过程和想法。[NOIP2001提高组]一元三次方程求解题目描述有形如：ax3+bx2+cx+d=0ax^3+bx^2+cx+d=0ax3+bx2+cx+d=0这样的一个一元三次方程。给出该方程中各项的系数（a,b,c,da,b,c,da,b,c,d均为实数），并约定该方程存在三个不同实根（根的范围
LeetCode - 3274. Check if Two Chessboard Squares Have the Same Color 阿蒙Armon LeetCode leetcode 算法职场和发展
LeetCode-3274.CheckifTwoChessboardSquaresHavetheSameColor在LeetCode的算法题库中，有许多有趣的题目将实际场景与编程逻辑相结合，LeetCode3274题CheckifTwoChessboardSquaresHavetheSameColor便是其中之一。这道题以国际象棋棋盘为背景，要求我们判断给定的两个方格颜色是否相同。通过解决这道题，
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1024 一元三次方程求解热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：
监控漏检频发？陌讯YOLOv7实时优化方案召回率提升25% 2501_92489016 目标跟踪人工智能计算机视觉算法目标检测视觉检测智慧城市
一、开篇痛点在安防监控领域，传统目标检测模型面临三重困境：实时性差：1080P视频流处理普遍低于20FPS（VGG16仅15FPS）漏检率高：密集场景下小目标召回率常低于60%（COCO-val实测数据）部署成本高：ResNet-101需8GB显存，难以边缘化部署某智慧园区项目显示：夜间误报率高达34%，运维成本激增300%二、技术解析：陌讯SlimYOLO架构创新针对上述痛点，陌讯视觉算法提出三
JAVA刷题记录: 专题十五 BFS解决FloodFill算法用屁屁笑宽度优先算法
733.图像渲染-力扣（LeetCode）classSolution{int[]dx={0,0,-1,1};int[]dy={1,-1,0,0};publicint[][]floodFill(int[][]image,intsr,intsc,intcolor){intprev=image[sr][sc];if(color==prev)returnimage;Queueq=newLinkedList
14.优化算法之BFS解决FloodFill算法1 muyierfly 算法题算法宽度优先深度优先
0.FloodFill简介dfs：深度优先遍历（红色）bfs：宽度优先遍历1.图像渲染算法原理classSolution{int[]dx={0,0,1,-1};int[]dy={1,-1,0,0};publicint[][]floodFill(int[][]image,intsr,intsc,intcolor){intprev=image[sr][sc];//统计刚开始的颜⾊if(prev==co
BFS 解决 FloodFill 算法(C++) lim 鹏哥刷题算法宽度优先 c++
文章目录前言一、概念二、岛屿数量1.题目链接2.算法原理3.代码编写三、被围绕的区域1.题目链接2.算法原理3.代码编写总结前言一、概念BFS就是广度优先遍历，也就是层序遍历。FloodFill是指在数组中找出性质相同的连通块，并根据题目进行操作。二、岛屿数量1.题目链接200.岛屿数量2.算法原理遍历整个矩阵，每找到一块陆地，记录一次。我们怎末知道我们是否已经遍历过这个地方了呢？？方法1：如果遍
BFS-FloodFill 算法解决最短路问题多源解决拓扑排序 penguin_bark #BFS 算法宽度优先 leetcode
文章目录一、FloodFill算法[733.图像渲染](https://leetcode.cn/problems/flood-fill/description/)2.思路3.代码[200.岛屿数量](https://leetcode.cn/problems/number-of-islands/description/)2.思路3.代码[LCR105.岛屿的最大面积](https://leetcod
头盔识别误报率高？陌讯YOLOv7优化方案实测准确率达99%！
开篇痛点：算法失效的致命时刻在智慧交通领域，电动车头盔识别长期面临三大痛点：漏检危机：行人遮挡、雨天反光导致传统算法漏检率高达15%（某头部车企实测数据）误报泛滥：相似物体（背包、安全帽）误识别率超20%实时性缺陷：开源模型在1080P视频流中处理延时＞200ms，无法满足实时预警需求技术解析：陌讯算法三重创新架构graphTDA[双路输入]-->B[多尺度特征融合模块]B-->C[空间注意力机制
「感恩日语」2021-303篇，吸渣体质能学多少学多少
学习感悟，避免成为“吸渣”体质很重要，“环境”能改变人，学会甄别那些“书籍”、那些“文章”（论文）对自己成长有利，而非“奶头乐”系统算法之类推送的让自己无法自拔的内容，个人每天、每周、每月、每年、一生总时间是有限的，缩小到每天，计算一下每天浪费有多少，真正发挥价值时间效力有多少，简单做个记录，会发现很可怕。同时找到了为什么每天进步一点点的重要性，只跟昨天的自己，前天的自己比较一下，很重要，多做对自
监控漏检率 30%？陌讯多模态算法实测优化
破解智慧城市视觉算法困境：陌讯多模态融合技术实战解析在智慧城市建设中，视觉算法作为感知层核心技术，正面临着日益严峻的挑战。传统目标检测算法在暴雨、逆光、遮挡等复杂环境下，漏检率常高达25%-40%，直接导致交通违章误判、异常事件漏报等问题。某新一线城市交管部门曾反馈，现有系统对无牌车的识别准确率不足65%，严重影响执法效率[实测数据来源]。这些痛点的核心在于传统单模态算法难以应对城市环境的动态变化
智慧城管新突破：陌讯动态量化技术实现端侧模型压缩20倍 2501_92487735 目标跟踪人工智能计算机视觉算法目标检测视觉检测边缘计算
开篇痛点深夜暴雨中的违规占道经营检测误报率超60%，光照反射干扰导致传统YOLOv5召回率暴跌——这是某省会城市智慧城管项目的真实困境。当算法工程师面对复杂城市场景时，环境干扰、小目标密集、实时性要求构成三重技术难关。技术解析：陌讯自适应多模态架构传统单阶段检测器在雨天场景失效的核心原因，在于固定感受野难以适应尺度突变目标。陌讯算法引入动态梯度调制机制，通过特征金字塔的跨层权重自适应调整，显著提升
河道污染难溯源？3步搭建陌讯实时目标检测系统 2501_92472966 目标检测人工智能计算机视觉算法视觉检测
开篇痛点「凌晨3点水泵房渗漏报警，运维人员冒雨排查却是一场误判」——这是某水务企业技术总监向我吐槽的真实案例。在智慧水务场景中，传统视觉算法面临三大死穴：水体反光干扰、微小目标漏检、边缘设备算力受限。尤其当暴雨导致水体浑浊时，OpenCV边缘检测的误报率可达35%以上。技术解析：陌讯多模态融合架构为解决复杂环境泛化问题，陌讯视觉算法提出FMT-Net（FusionMultimodalTransfo
力扣 hot100 Day45 qq_51397044 Hot100 leetcode 算法
230.二叉搜索树中第K小的元素给定一个二叉搜索树的根节点root，和一个整数k，请你设计一个算法查找其中第k小的元素（从1开始计数）。//抄的classSolution{public:voidhelper(TreeNode*root,intk,int&count,int&result){if(!root)return;helper(root->left,k,count,result);count
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?