rainbowiridescent

强化学习蘑菇书Easy RL第二、三章学习（马尔可夫决策过程、表格型方法）

马尔可夫决策过程概述

Markov Process(MP)通常来说是未来状态的条件概率分布仅依赖于当前的状态。在离散随机过程里，我们需要把随机变量所有可能取值的集合放到一个状态空间里，在强化学习里，我们直接用状态转移的概率来表示：

$\begin{aligned} p\left(s_{t+1} \mid s_{t}\right) &=p\left(s_{t+1} \mid h_{t}\right) \\ p\left(s_{t+1} \mid s_{t}, a_{t}\right) &=p\left(s_{t+1} \mid h_{t}, a_{t}\right) \end{aligned}$

如上图所示，离散的马尔可夫链有四个状态，而这四个状态就在s1，s2，s3和s4中互相转移。而转移概率就在上图用箭头表示出来了，对于不同的状态采样，我们可以生成许多的轨迹。
简单地，我们可以用一个状态转移矩阵来表示：

$P=\left[\begin{array}{cccc} P\left(s_{1} \mid s_{1}\right) & P\left(s_{2} \mid s_{1}\right) & \ldots & P\left(s_{N} \mid s_{1}\right) \\ P\left(s_{1} \mid s_{2}\right) & P\left(s_{2} \mid s_{2}\right) & \ldots & P\left(s_{N} \mid s_{2}\right) \\ \vdots & \vdots & \ddots & \vdots \\ P\left(s_{1} \mid s_{N}\right) & P\left(s_{2} \mid s_{N}\right) & \ldots & P\left(s_{N} \mid s_{N}\right) \end{array}\right]$

Markov Reward Process

下面这一小节我们来聊一下马尔科夫奖励过程。两个新的概念：
1.回报：

$G_{t}=R_{t+1}+\gamma R_{t+2}+\gamma^{2} R_{t+3}+\gamma^{3} R_{t+4}+\ldots+\gamma^{I^{\prime}-t-1} R_{T}$

越往后得到的奖励，折扣越多。

2.状态价值函数：

$\begin{aligned} V_{t}(s) &=\mathbb{E}\left[G_{t} \mid s_{t}=s\right] \\ &=\mathbb{E}\left[R_{t+1}+\gamma R_{t+2}+\gamma^{2} R_{t+3}+\ldots+\gamma^{T-t-1} R_{T} \mid s_{t}=s\right] \end{aligned}$

状态价值函数被定义成回报的期望，也就是从这个状态开始，可以获得多大的价值。

使用折扣因子的目的：

避免无穷的奖励
不一定完全信任模型，模型带有不确定性
更想要及时获得奖励
（因此，折扣因子通常作为一个强化学习智能体的超参数来调整，通过调整折扣因子，我们可以得到不同动作的智能体）

The use of a reward signal to formalize the idea of a goal is one of the most distinctive features of reinforcement learning.

如下图，状态转移图所示，这里，实心正方形表示对应于一集结束的特殊吸收状态。从S0开始，我们得到奖励序列+1，+1，+1，0，0，0。把这些加起来，无论我们在第一个T奖励（这里T=3）上求和，还是在整个无限序列上求和，我们都会得到相同的回报。

贝尔曼方程

这里比较难，我也理解的时间很长。。。
然后看了祖师爷sutton的书又找了一些例子来补充学习。
首先是先回顾了一下全期望公式，找了个例子来推导证明。

$\mathbb{E}\left[V\left(s_{t+1}\right) \mid s_{t}\right]=\mathbb{E}\left[\mathbb{E}\left[G_{t+1} \mid s_{t+1}\right] \mid s_{t}\right]=E\left[G_{t+1} \mid s_{t}\right]$

以下为推导：

$\begin{aligned} \mathbb{E}\left[\mathbb{E}\left[G_{t+1} \mid s_{t+1}\right] \mid s_{t}\right] &=\mathbb{E}\left[\mathbb{E}\left[g^{\prime} \mid s^{\prime}\right] \mid s\right] \\ &=\mathbb{E}\left[\sum_{g^{\prime}} g^{\prime} p\left(g^{\prime} \mid s^{\prime}\right) \mid s\right] \\ &=\sum_{s^{\prime}} \sum_{g^{\prime}} g^{\prime} p\left(g^{\prime} \mid s^{\prime}, s\right) p\left(s^{\prime} \mid s\right) \\ &=\sum_{s^{\prime}} \sum_{g^{\prime}} \frac{g^{\prime} p\left(g^{\prime} \mid s^{\prime}, s\right) p\left(s^{\prime} \mid s\right) p(s)}{p(s)} \\ &=\sum_{s^{\prime}} \sum_{g^{\prime}} \frac{g^{\prime} p\left(g^{\prime} \mid s^{\prime}, s\right) p\left(s^{\prime}, s\right)}{p(s)} \\ &=\sum_{s^{\prime}} \sum_{g^{\prime}} \frac{g^{\prime} p\left(g^{\prime}, s^{\prime}, s\right)}{p(s)} \\ &=\sum_{s^{\prime}} \sum_{g^{\prime}} g^{\prime} p\left(g^{\prime}, s^{\prime} \mid s\right) \\ &=\sum_{g^{\prime}} \sum_{s^{\prime}} g^{\prime} p\left(g^{\prime}, s^{\prime} \mid s\right) \\ &=\sum_{g^{\prime}} g^{\prime} p\left(g^{\prime} \mid s\right) \\ &=\mathbb{E}\left[g^{\prime} \mid s\right]=\mathbb{E}\left[G_{t+1} \mid s_{t}\right] \end{aligned}$
注：为简化，去掉了t，且都用了小写变量字母表示，具体可参照公式第一行。
若有疑问可自行查看概率论与数理统计书or百度一下。

然后是Bellman方程：

$\begin{aligned} V(s) &=\mathbb{E}\left[G_{t} \mid s_{t}=s\right] \\ &=\mathbb{E}\left[R_{t+1}+\gamma R_{t+2}+\gamma^{2} R_{t+3}+\ldots \mid s_{t}=s\right] \\ &=\mathbb{E}\left[R_{t+1} \mid s_{t}=s\right]+\gamma \mathbb{E}\left[R_{t+2}+\gamma R_{t+3}+\gamma^{2} R_{t+4}+\ldots \mid s_{t}=s\right] \\ &=R(s)+\gamma \mathbb{E}\left[G_{t+1} \mid s_{t}=s\right] \\ &=R(s)+\gamma \mathbb{E}\left[V\left(s_{t+1}\right) \mid s_{t}=s\right] \\ &=R(s)+\gamma \sum_{s^{\prime} \in S} P\left(s^{\prime} \mid s\right) V\left(s^{\prime}\right) \end{aligned}$

Bellman Equation 定义的就是当前状态跟未来状态的一个迭代的关系。
* $V\left(s^{\prime}\right)$ 向量是我们当前的状态，我们需要乘以转移矩阵，然后再加上对应的奖励，得到现在的状态。或者说，在强化学习和动态规划中使用的值函数的一个基本特性是，它们满足特定的递归关系。
当我们要处理的MRP很小量时，对应的复杂度也很小，我们就可以考虑把贝尔曼方程写成矩阵的形式，然后通过求逆矩阵的方式，写出解析解。
但是，如果状态很多的MRP，就不能解出来了。在这种情况下可以采用的方法有：蒙特卡洛法、动态规划法。

马尔可夫决策

当多了decison时，还需要加一个action，也就是说，**你当前的状态以及你采取的动作会决定你在当前可能得到的奖励多少。**另外，已知一个 MDP 和一个 policy $\pi$ 的时候，我们可以把 MDP 转换成 MRP。
这里补充理解进去：
马尔可夫决策过程不是直接通过转移概率决定下一个状态，而是多了一层动作a，简言之，马尔科夫决策多了一层决策性，动作是由智能体决定的。

价值函数的定义：

We call the function vπ the state-value function for policy π，策略π下，该式子描述了状态价值函数。
类似地，我们定义了在策略π下的状态s中采取行动a的值，表示为qπ（s，a），作为从s开始的预期回报，采取行动a，然后遵循策略π：

$q_{\pi}(s, a)=\mathbb{E}_{\pi}\left[G_{t} \mid S_{t}=s, A_{t}=a\right]=\mathbb{E}_{\pi}\left[\sum_{k=0}^{\infty} \gamma^{k} R_{t+k+1} \mid S_{t}=s, A_{t}=a\right]$

补充一下sutton书里的例子（备份图），每个开口圆代表一个状态，每个实心圆代表一个状态-动作对。从状态s（顶部的根节点）开始，agent可以采取图3.4a中所示的三种操作中的任何一种。从每种状态中，环境都可以响应接下来的几个状态之一s0，以及奖励r。Bellman方程对所有可能性进行平均，并根据其发生的概率对每个状态进行加权。开始状态的值必须等于预期下一个状态的（折扣）值，加上沿途预期的奖励。

另外，这些操作将值信息从其后续状态（或状态-动作对）传输回状态（或状态-动作对）。我们在整本书中使用备份图来提供我们讨论的算法的图形摘要。（注意，与转换图不同，备份图的状态节点不一定代表不同的状态；例如，一个状态可能是它自己的后续状态。省略了显式箭头，因为时间在备份图中总是向下流动。）
Q函数在备份图中的分解部分，先略了。。

Prediction & Control

这部分还挺重要的，可以说是MDP中的核心了，我们输入元组与策略以后，输出的是价值函数。
控制的话，输出的应该是一个最佳的价值函数和最佳的策略。（嘎嘎，有点优化的味道了，很喜欢，和专业好像哈哈哈）
要强调的是，这两者的区别就在于，
预测问题是给定一个 policy，我们要确定它的 value function 是多少。
而控制问题是在没有 policy 的前提下，我们要确定最优的 value function 以及对应的决策方案。
实际上，这两者是递进的关系，在强化学习中，我们通过解决预测问题，进而解决控制问题。
我们再来看一个动态的例子，用了斯坦福大学里面的，GridWorld DP Demo ，这个网站模拟了单步更新的过程中，所有格子的一个状态价值的变化过程。
policy evaluation（一步迭代）的结果：

相应代码：

evaluatePolicy: function() {
  // perform a synchronous update of the value function
  var Vnew = zeros(this.ns); // initialize new value function array for each state
  for(var s=0;s < this.ns;s++) {
    var v = 0.0;
    var poss = this.env.allowedActions(s); // fetch all possible actions
    for(var i=0,n=poss.length;i < n;i++) {
      var a = poss[i];
      var prob = this.P[a*this.ns+s]; // probability of taking action under current policy
      var ns = this.env.nextStateDistribution(s,a); // look up the next state
      var rs = this.env.reward(s,a,ns); // get reward for s->a->ns transition
      v += prob * (rs + this.gamma * this.V[ns]);
    }
    Vnew[s] = v;
  }
  this.V = Vnew; // swap
},

我自己试了一下，这是点toggle value iteration时候的结果。。。
这是切换成了价值迭代，后面会再说明。

再说一下控制吧，寻找一个最优的价值函数（max），再寻找最优policy

搜索最佳策略有两种常用的方法：policy iteration 和 value iteration。
策略迭代的核心是策略评估+策略改进，价值迭代主要运用了最优性原理。这里具体的对比与贝尔曼方程不再赘述。
如果是一个 prediction 的问题，即 policy evaluation 的问题，直接就是不停地 run 这个 Bellman Expectation Equation，这样我们就可以去估计出给定的这个策略，然后得到价值函数。
对于 control，
如果采取的算法是 policy iteration，那这里用的是 Bellman Expectation Equation 。把它分成两步，先上它的这个价值函数，再去优化它的策略，然后不停迭代。这里用到的只是 Bellman Expectation Equation。
如果采取的算法是 value iteration，那这里用到的 Bellman Equation 就是 Bellman Optimality Equation，通过 arg max 这个过程，不停地去 arg max 它，最后它就会达到最优的状态。
简单用一个表格总结一下：

问题	算法
预测	迭代策略评估（贝尔曼方程）
控制	策略迭代（贝尔曼期望方程）、价值迭代（贝尔曼最优方程）

本章关键词：马尔可夫性质、马尔可夫链、状态转移矩阵、马尔可夫奖励过程、汇报、贝尔曼方程、动态规划算法、马尔可夫决策中的prediction&control。

啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊这里搞一个分割线。。。。。。
################################################
终于第三章了，内容也太多了。

表格型方法

策略最简单的表示是查找表（look-up table），即表格型策略（tabular policy）。使用查找表的强化学习方法称为表格型方法（tabular method），如蒙特卡洛、Q学习和Sarsa。本章通过最简单的表格型方法来讲解如何使用基于价值的方法求解强化学习问题。

有模型vs免模型

这个点在上一篇博客，强化学习概论里面也提到了，在RL里，可以作为一种简单的分类方式。
环境，是通过概率函数与奖励函数来描述的。如果我们知道环境的状态转移概率和奖励函数，就可以认为这个环境是已知的，因为我们用这两个函数来描述环境。如果环境是已知的，我们其实可以用动态规划算法去计算，某个情形下，概率最大的最佳策略是什么。

很多强化学习的经典算法都是免模型的，也就是环境是未知的。我们处在未知的环境里，也就是这一系列的决策的概率函数和奖励函数是未知的，这就是有模型与免模型的最大的区别。强化学习用价值函数 V来表示状态是好的还是坏的，用 Q 函数来判断在什么状态下采取什么动作能够取得最大奖励，即用 Q 函数来表示状态-动作值。
关于免模型，再说明一下：
当马尔可夫决策过程的模型未知或者模型很大时，我们可以使用免模型强化学习的方法。免模型强化学习方法没有获取环境的状态转移和奖励函数，而是让智能体与环境进行交互，采集大量的轨迹数据，智能体从轨迹中获取信息来改进策略，从而获得更多的奖励。
有一点点类似于上一节中让小船去获取轨迹的例子。。。
在强化学习中，我们最终要求解的就是一张 Q 表格，它的行数是所有状态的数量，一般可以用坐标来表示格子的状态，也可以用 1、2、3、4、5、6、7 来表示不同的位置。Q 表格的列表示上、下、左、右4个动作。最开始的时候，Q 表格会全部初始化为0。智能体会不断和环境交互得到不同的轨迹，当交互的次数足够多的时候，我们就可以估算出每一个状态下，每个动作的平均总奖励，进而更新 Q 表格。Q表格的更新就是接下来要引入的强化概念。

嗯。。。继续了
强化是指我们可以用下一个状态的价值来更新当前状态的价值，其实就是强化学习里面自举的概念。在强化学习里面，我们可以每走一步更新一次 Q 表格，用下一个状态的 Q 值来更新当前状态的 Q 值，这种单步更新的方法被称为时序差分方法。这种方法，是免模型的一种。
可以比较的是巴甫洛夫给小狗的实验，类似于一种延迟奖励。小狗本来不觉得铃声有价值的，经过强化之后，小狗就会慢慢地意识到铃声也是有价值的，它可能带来食物。更重要的是当一种条件反射巩固之后，我们再用另外一种新的刺激和条件反射相结合，还可以形成第二级条件反射，同样地还可以形成第三级条件反射。
我们先初始化，然后开始时序差分方法的更新过程。在训练的过程中，小黄球在不断地试错，在探索中会先迅速地发现有奖励的格子。最开始的时候，有奖励的格子才有价值。当小黄球不断地重复走这些路线的时候，有价值的格子可以慢慢地影响它附近的格子的价值。反复训练之后，有奖励的格子周围的格子的状态就会慢慢被强化。强化就是价值最终收敛到最优的情况之后，小黄球就会自动往价值高的格子走，就可以走到能够拿到奖励的格子。
以下是斯坦福时序差分的网格demo：

// create environment
env = new Gridworld(); 
// create the agent, yay!
var spec = { alpha: 0.01 } // see full options on top of this page
agent = new RL.TDAgent(env, spec); 

setInterval(function(){ // start the learning loop
  var action = agent.act(s); // s is an integer, action is integer
  // execute action in environment and get the reward
  agent.learn(reward); // the agent improves its Q,policy,model, etc.
}, 0);

时序差分，不需要马尔可夫决策过程的转移矩阵和奖励函数。此外，时序差分方法可以从不完整的回合中学习，并且结合了自举的思想。
用一个公式来加深一下理解：

$V\left(s_{t}\right) \leftarrow V\left(s_{t}\right)+\alpha\left(r_{t+1}+\gamma V\left(s_{t+1}\right)-V\left(s_{t}\right)\right)$

对于某个给定的策略pai，我们算出它的价值函数 V。每往前走一步，就做一步自举，用得到的估计回报来更新上一时刻的值。

稍微总结对比一下与蒙特卡洛的优劣势：
MC优势：1.从episode经历里直接学习。2.免模型 3.value为mean return。
MC劣势：1.使用蒙特卡洛方法有episodic马尔可夫过程假设。2.相比于TD学习速度慢。
TD优势：1.从episode经历里直接学习，可以从不完整序列中学习。2.免模型 3.不需要得到最后输出结果，每一步在线学习。4.适合于连续空间强化学习。
TD劣势：用自举抽样每个episode不够准确。本身拟合就不确定了。
下图为n步的时序差分：

粗略地说，蒙特卡洛方法使用（6.3）的估计作为目标，而DP方法使用（6.4）的估计作为目标。蒙特卡洛目标是一个估计值，因为（6.3）中的预期值未知；使用样本回报代替实际预期回报。DP目标是一个估计值，不是因为预期值（假设由环境模型完全提供），而是因为vπ（St+1）未知，而是使用当前估计值v（St+1）。TD目标是一个估计值，有两个原因：它对（6.4）中的预期值进行采样，并使用当前估计值V而不是真实的Vπ。因此，TD方法将蒙特卡洛采样与DP自举相结合。

Sarsa和Q学习

Q学习是异策略的时序差分学习方法，Sarsa 是同策略的时序差分学习方法。
Sarsa算法流程：

简单说一下Q学习，主要是两种策略，target policy和behavior policy，后面的实验cliffwalking也是用Q学习来实现的。
我们的目标策略π，在Q表格上使用greedy的policy，就可以直接生成下一步的所有状态。可以说，这种异策略学习是一种探索机制，学习的效率也比较高，而且也不完全是随机的，不断基于Q表格来改进，所以也体现“强化”的特点。。
嗯。。。Q学习的增量学习公式啥的还没推导完，回头再更新笔记好了。
先把实验做完。

Cliffwalking实验（项目一）

了解了环境以后，我们直接在代码中定义：

import gym #导入gym库
from envs.gridworld_env import CliffWalkingWapper #这一步导入自定义的装饰器
env = gym.make('CliffWalking-v0) #定义环境
env = CliffWalkingWapper(env) #装饰环境

n_states =  env.observation_space.n
n_actions = env.action_space.n
print(f"state_numbers:{n_states},action_numbers:{n_actions}")

结果：

状态数48，这里设置智能体当前所在网格的一个编号，动作数4表示我们有0123这四个数分别对应上下左右四个动作。
然后我们初始化环境来输出一下当前的状态：

state = env.reset()
print(f"initial_state:{state}")

结果如下：

这里表示的就是当前agent在网格编号36，也就是起点。
接下来是学习一下强化学习的基本接口。
一般强化学习的训练模式的steps：
1）初始化环境、智能体
2）对于每个回合，智能体选取动作
3）环境接受动作反馈信息下一个状态和奖励
4）智能体进行policy update（learning）
5）多个回合后，算法收敛，保存模型，用于后续的分析和画图

 '''初始化环境'''  
env = gym.make("CliffWalking-v0")  # 定义环境
env = CliffWalkingWapper(env) #装饰环境
env.seed(1) #设置随机种子
n_states =  env.observation_space.n #状态数
n_actions = env.action_space.n #动作数
agent = QLearning(n_states,n_actions,cfg)
for i_ep in range(cfg.train_eps): #cfg.train_eps表示最大的训练回合数
    enp_reward=0 #记录回合的奖励
    state = env.reset()#重置环境
    while True：
        action = agent.choose_action(state)# 选动作
        next_state,reward,done,_ = env.step(action)
        # 环境根据动作反馈的reward和下一个state
        agent.update(state,action,reward,next_state,done)
        state = next_state #更新
        ep_reword +=reward
        if done:
           break

Q学习的算法具体实现，主要是两件事，一个是选择动作，一个是更新策略，定义一个Qlearning类以后，主要包含两个函数，choose_action()还有update()
我们来看一下这两个函数的定义方式，第一步是动作的选择：

def choose_action(self, state):
        self.sample_count += 1
        self.epsilon = self.epsilon_end + (self.epsilon_start - self.epsilon_end) * \
            math.exp(-1. * self.sample_count / self.epsilon_decay) # epsilon是会递减的，这里选择指数递减
        # e-greedy 策略
        if np.random.uniform(0, 1) > self.epsilon:
            action = np.argmax(self.Q_table[str(state)]) # 选择Q(s,a)最大对应的动作
        else:
            action = np.random.choice(self.n_actions) # 随机选择动作
        return

使用epsilion-greedy策略选择动作，具体怎么弄的，有点像我之前提到的，探索机制，我们输入目前的状态，用if来判断一下这个随机值是不是>self.epsilion（我们设置的），然后选取最大的Q（s，a）对应的动作。
选择完动作后，然后再来看一下qlearning.py中比较重要的另一个函数，策略更新函数。
代码如下：

 def update(self, state, action, reward, next_state, done):
        Q_predict = self.Q_table[str(state)][action] 
        if done: # 终止状态
            Q_target = reward  
        else:
            Q_target = reward + self.gamma * np.max(self.Q_table[str(next_state)]) 
        self.Q_table[str(state)][action] += self.lr * (Q_target - Q_predict)

这里实现的逻辑就是伪代码中的更新公式。
具体的项目代码在github上。。。
附上链接：
https://github.com/datawhalechina/easy-rl/tree/master/codes/QLearning
训练结果：
模型很快收敛

测试30个回合的话，每个回合的奖励都是最优的。

害，没写完。。好多公式细节都没写进去，先这样发布，回头再接着补，
总之，对于小白来说，还有很大的进步空间。。。。
加油啊！！！

Ref：
【1】https://datawhalechina.github.io/easy-rl/#/chapter2/chapter2
【2】https://datawhalechina.github.io/easy-rl/#/chapter3/chapter3
【3】https://zhuanlan.zhihu.com/c_135909947
【4】https://www.zhihu.com/question/62388365
【5】SUTTON R S,BARTO AG.Reinforcement Learning：An introduction (second edition) [M].London: The MIT Press,2018
【6】邱锡鹏.神经网络与深度学习[M].北京：机械工业出版社，2020
【7】https://www.davidsilver.uk/teaching/
【8】王琦等，Easy RL蘑菇书，强化学习教程

2019-06-29 房电孟
敬爱的李老师，智慧的马教授，亲爱的家人们：大家好，我是(侯维山)侯总的人，来自滨州鑫山力机械的房电孟。今天是2019年6月29日，我的日精进第297天,我们互相勉励，携手前行，每天进步一点点，距离成功便不远。图片发自App比学习：不要忘记奋斗，人生的路，无需苛求，只要你迈步，路就会在你脚下延伸；只要你扬帆，便会八面来风。启程了，人的生命才真正开始;启程了，人的智慧才得以发挥。生活时常和我们开着玩笑
时间管理050【反思】用反思三问清空爆满的收件箱嫝嫝
Hi！大家好，我是康康，非常有幸加入易效能天使班学习，为了更好地践行易效能的时间管理系统，以“转述”的形式，通过对叶武滨老师在喜马拉雅上的《叶武滨时间管理100讲》进行分享。今天是第50天，坐标某个小镇此文章开头参照【黄家整理师Helen】一、杂事：放在大脑里面的事1、每天在大脑里面，有许多事情和想法；2、大脑是记不住事的：需要利用优秀的系统来管理想法；3、大脑会非常的焦虑，事情没有完成的时候；二
2023-09-25中原焦点学员李灵芝坚持分享第495天越来越好崔
透过应对问句所进行的重要觉察与练习，将会协助当事人建构对抗与处理困境的希望，动机与觉察，同时也将会帮助当事人离开受害者的位置。而以生存者，应对者的姿态来看待历经生命挑战中的自己。罗马并非一日造成的，问题的产生也并非一日，而就要问题立即消失是不可能的，要学会与问题共处，同时接受生命的限制是一个需要学习以勇气与智慧来承担的历程。自我照顾是人生而具有的本能，在这个过程中要强调自我照顾的能
宝爸一本经典的书
这几天陈娜在广州学习，家里我操持。以前家里陈娜做的事情，现在全部我来做。照顾孩子，买菜做饭，打扫卫生等等。买菜是一件让人头痛的事情，不知道吃什么。一大堆琐碎的事情不想弄，比如凉好的衣服丢在沙发上，不想叠。平时如果我看到沙发上有没叠的衣服，卫生不好，我就会指责陈娜不会打理。现在自己当家两天，做着这些事情有点烦，瞬间就觉得自己平时对陈娜太苛刻。宝妈也不容易。
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
中原焦点团队网初21中24期罗超华坚持分享第1天（2021/08/05星期四）罗超华初21
1.和谁聊就和谁一伙，和孩子聊就和孩子一伙。感受对方的感受。2.影响孩子学习的方面有:情绪，关系，希望感，成就感。3.关注什么强化什么，关注什么得到什么，关注正向得到正向。4.父母的嘴都是开过光的，说啥来啥。你想要啥就说啥。5.我们身边不缺少美，缺少发现美的眼睛。这是一种能力，需要锻炼。6.你给我说说，你是怎么做到的？和孩子去探讨正向的方面，怎么想的？怎么看的？怎么做到的？7.转换视角，转变思维，
保持你成长的正念就好 7855fb52ad83
终身成长咨询者找到我说他很痛苦，她告诉我，她看了终身成长这一本书，她知道固定型思维和成长型思维两种概念，她一直在用成长型思维要求自己，她这几年也在不断地学习和精进自己，但是没有办法去影响他的另一半。举个例子：她每天都会听樊登读书，一开始她听的时候，她老公会说你天天听的都是洗脑的东西……再后来，她老公会说你天天听做不了樊登，你干嘛要听？你也没有能力去带几千万人读书，还不如做好眼前的事情！这个时候，她
Mybatis学习之简介（一） PP东数据库 Java mybatis 学习 oracle
一、MyBatis特性MyBatis是一个半自动的ORM（ObjectRelationMapping）框架。（ORM，对象关系型映射，用于在面向对象编程语言和关系型数据库之间建立映射关系）。MyBatis虽然自动化程度相对较低但是灵活性相对较高。Mybatis简化了与数据库的连接过程，因为其内部封装了JDBC的链接过程，所以无需手动建立和管理连接，这使得开发者能够专注于业务逻辑的实现。Mybati
只因4个字，40多岁的新媒体从业者，报名了第五期剽悍个人品牌特训营要瘦的孙小米
本周，又一位第24期剽悍财富行动营老铁成功付费，入驻第五期剽悍个人品牌特训营。这位老铁是一名新媒体从业者，创办了自己的线上产品，也是某新媒体大咖训练营的常驻分享嘉宾，在社群里分享近300场。今年3月，她报名参加了剽悍财富行动营。她说，这期间的学习，不仅让自己的行动力提升了很多倍、养成诸多好习惯，更让自己明白了“圈子”和“连接”的重要性，于是，还没结营，她就申请报名第五期剽悍个人品牌特训营。她说，终
怎样学习2.0（也就是怎样实现自己的梦想）？希望是终结版 gjf05_05 初学者综合 google 百度
2$*******************************************************************324.怎样学习？41.前期：整体规划与局部规划52.中期：提出问题与解决问题与同行交流！63.后期:笔记（总结）。7******************************8解释1.整体规划:了解怎样实现梦想?9(也就是实现梦想大致应该做些什么？也就是把梦
敏捷史话（六）：也许这个人能拯救你的代码 —— Robert C. Martin 敏捷初级运动员
本文摘自敏捷开发。RobertC.Martin（罗伯特·C·马丁），作为世界级软件开发大师、设计模式和敏捷开发先驱、C++Report杂志前主编，也是敏捷联盟（AgileAlliance）的第一任主席，我们尊称他为“Bob大叔（UncleBob）”。如今，年逾六十的Bob大叔过着典型的“斜杠”生活，他不仅是优秀的程序员、畅销书作家、演讲家，以及视频制作者，还是一名柔术爱好者。多年学习柔术的经历，带
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
数据库学习笔记——14组合查询 Love零O
本课学习如何利用UNION操作符将多条SELECT语句组合成一个结果集。1组合查询多数SQL查询只包含从一个或多个表中返回数据的单条SELECT语句。但是，SQL也允许执行多个查询（多条SELECT语句），并将结果作为一个查询结果集返回。这些组合查询通常称为并（UNION）或复合查询（compoundquery）。主要有两种情况需要使用组合查询：在一个查询中从不同的表返回结构数据；对一个表执行多个
2021-2-25晚间日记潘驴邓小闲_
今天是个蜕变开始日子起床：5:40就寝：10:45天气：晴转多云心情：较愉悦纪念日：无叫我起床的不是闹钟是梦想年度目标及关键点：娶媳妇本月重要成果：加入奕龙公司人际的投入认识新同事，结交新朋友开卷有益-学习/读书喜马拉雅APP听叶武滨老师的时间管理100讲以及家慧库APP有关家庭的学习
Linux 0.01源码深入解析羊迪
本文还有配套的精品资源，点击获取简介：Linux0.01源码代表了Linux操作系统的起点，揭示了其基本架构和内核设计原理。通过源码分析，开发者可以了解早期的进程管理、内存管理、文件系统、设备驱动、中断处理、系统调用等关键概念。此外，源码还展现了如何进行编译和构建，为想要深入理解操作系统和开源精神的开发者提供了一份宝贵的学习资源。1.Linux0.01源码概述Linux操作系统的核心是其内核，而L
可信数据空间（Trusted Data Space）核心能力及行业赋能分析小赖同学啊 test Technology Precious 算法
可信数据空间（TrustedDataSpace）作为新一代数据共享基础设施，通过技术创新和治理框架的结合，为多行业提供安全、可控的数据流通能力。以下是其核心能力及行业赋能分析：一、可信数据空间的六大核心能力能力维度技术实现关键价值数据主权保障基于区块链的分布式身份（DID）属性基加密（ABE）数据所有者保持控制权，实现"数据可用不可见"安全共享计算联邦学习（FL）多方安全计算（MPC）可信执行环境
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
javaweb学习开发代码_HTML-CSS-JS
HTML学习标题(h1~h6)-段落p-换行brDocument当代文学之夜：2024年度长篇五佳作品及文学拉力赛颁奖当代文学之夜：2024年度长篇五佳作品及文学拉力赛颁奖当代文学之夜：2024年度长篇五佳作品及文学拉力赛颁奖当代文学之夜：2024年度长篇五佳作品及文学拉力赛颁奖当代文学之夜：2024年度长篇五佳作品及文学拉力赛颁奖当代文学之夜：2024年度长篇五佳作品及文学拉力赛颁奖《当代》作为
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
TEngine学习
关于静态类中的静态变量赋值：publicstaticclassActorEventDefine{publicstaticreadonlyintScoreChange=RuntimeId.ToRuntimeId("ActorEventDefine.ScoreChange");publicstaticreadonlyintGameOver=RuntimeId.ToRuntimeId("ActorEve
Spring Cloud学习：如何实现Gateway 服务网关限流杨荧 spring cloud 学习 gateway
目录一、SpringCloud介绍二、什么是服务网关三、Gateway的优势和应用场景四、如何实现Gateway服务网关限流一、SpringCloud介绍SpringCloud是一个基于SpringBoot的微服务架构开发工具集，它整合了多种微服务解决方案，为开发者提供了一站式的微服务开发体验。SpringCloud的核心组件包括服务发现、配置管理、消息传递、负载均衡、断路器等，这些组件可以帮助开
5商学习笔记爱英思谭523
【Jocelyn1月25日习得小结:】1.知识划重点(R):快速学习：如何用20小时，快速学习？2.我的理解(I):润总这个快速学习，跟李笑来老师的最小必要知识很类似，都是通过快速掌握入门的知识，完成从0到1的跨越。时间越快，掌握大概知识越多进门就越快。3.我的相关经验或经历(A1):复述其实是帮助自己去理解概念的绝佳方式。自己带课这几年，对于教材中的概念从浅入深的学习和理解，跟我面对无数个不一样
一次XSS漏洞引发的用户信息泄露 —— 在线教育平台真实案例剖析与防御实践
一、引子：一个“学习感言”输入框引发的安全事故在一次大型在线教育平台的开发中，笔者曾亲身经历过一起严重的安全事故。事故的起点很微不足道：一个允许用户提交“学习感言”的输入框。然而，由于缺乏安全意识和输入输出处理的规范，这个字段成为攻击者入侵的跳板，最终导致大量用户信息泄露、信任危机和平台业务受损。这个案例虽然已过去多年，但其中反映的安全盲点依然广泛存在于当前的互联网项目中，特别是在中小团队、快速上
Redis缓存四件套的学习(七) 冷崖 Redis redis 缓存
一、缓存四件套1.1、缓存预热1.1.1、什么是缓存预热缓存预热就是在系统启动前，将数据提前加载到缓存中，这样就可以避免在用户请求的时候，先查询数据库，然后再将数据回写到缓存中1.1.2、如何实现缓存预热什么都不做，只对数据库操作，利用redis回写机制，逐步将数据库的数据同步到缓存中。-------最好晚上部署完成之后，自己人提前做一次，让数据写回缓存，别把这个问题交给用户。通过中间件或程序自行
AI赋能，让办公更智能 enter回车键人工智能
AI赋能：解锁办公智能化新图景当智能化办公成为企业创造新价值的核心引擎，AI技术正以其强大的学习能力与数据处理能力，成为这场办公变革的“隐形推手”。从流程自动化到决策智能化，从单向执行到双向协作，AI正全方位渗透办公场景的每一个环节，让办公更高效、更精准、更具创造力。AI为办公流程注入“自动化基因”，将人类从机械劳动中彻底解放。传统办公中，员工需花费30%以上的时间处理重复性任务：财务人员逐张核对
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
深化学思践悟，激发奋进动能扎实开展主题教育活动，着力提升干部干事创业真本领 62ab9e7a8a7b
在全党开展学习贯彻习近平新时代中国特色社会主义思想主题教育，是推动贯彻党的二十大战略部署的有力举措，是深入推进新时代党的建设新的伟大工程的重大部署。领导干部要牢牢把握“学思想、强党性、重实践、建新功”总要求，聚焦凝心铸魂筑牢根本、锤炼品格强化忠诚、实干担当促进发展、践行宗旨为民造福、廉洁奉公树立新风的目标，以学铸魂、以学增智、以学正风、以学促干，着力为全面建设中国式现代化隆德凝聚力量。习近平总书记
关于线上技术学习的一点学习心得 GuangHui
我是**五期学员,和你分享一下我的学习心得,希望能够帮助到你.这是自己对于学习的思考和想法,因为我还在不断的学习和调整中,所以并不能说自己的所想都是正确的.我想即使我实现了成功的转行,也并不代表我说的我所选择的方式都是适合所有人的.每个人还需结合自己的实际情况,找到适合自己的最佳方法.我们一起努力.一.目标篇因为大数据需要学习的内容很多,所以学习过程中,一定要对进行定位,要做到有所取舍.针对自己的
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR