a635661820

rwthlm分析(五)之LSTM结构

第五篇仍然介绍隐层，这一篇其实是我最初要学习的主要内容——LSTM，LSTM的效果比rnn好，rnn存在的一个问题就是误差梯度会随着往前时刻深度的增加而逐渐减少消失，这样rnn的学习算法BPTT的深度就有了限制。LSTM解决了这样的问题，关于LSTM的结构的扩展也有几个阶段，这篇不会再去详细介绍LSTM了，关于LSTM更详细的介绍可以看看我写的另外一篇博客。仍然和前面一样，自己的认知与理解有限，哪里写的不对的还请看到的朋友指出，再次谢过~

LSTM的实现在lstm.cc里面，在rwthlm工具包里面，这是最核心的实现，也是代码量最大的部分，大概超过1000行代码的实现。首先把lstm.cc的构造函数放上来，其实通过构造函数的初始化分配，就能够把LSTM的网络结构给画出来，代码如下：

LSTM::LSTM(const int input_dimension,
           const int output_dimension,
           const int max_batch_size,
           const int max_sequence_length,
           const bool use_bias)
    : Function(input_dimension,
               output_dimension,
               max_batch_size,
               max_sequence_length),
      sigmoid_(),
      tanh_() {

  //这里的一维数组仍然是前面那种类似的结构
  int size = output_dimension * max_batch_size * max_sequence_length;
  //lstm层的cell的输出
  b_ = FastMalloc(size);
  //保存cec的输入输出
  cec_b_ = FastMalloc(size);
  //cell的输入
  cec_input_b_ = FastMalloc(size);
  //保存输入控制门的输入输出
  input_gate_b_ = FastMalloc(size);
  //保存遗忘控制门的输入输出
  forget_gate_b_ = FastMalloc(size);
  //保存输出控制门的输入输出
  output_gate_b_ = FastMalloc(size);

 //_t_命名类指针都是会变动的,用于表示时间的变化
  b_t_ = b_;
  cec_input_b_t_ = cec_input_b_;
  cec_b_t_ = cec_b_;
  input_gate_b_t_ = input_gate_b_;
  forget_gate_b_t_ = forget_gate_b_;
  output_gate_b_t_ = output_gate_b_;

  //这里不明白为啥要重新赋值,上面定义size时不就初始化为这个了嘛
  size = output_dimension * max_batch_size * max_sequence_length;
  //output gate的误差信号
  cec_epsilon_ = FastMalloc(size);
  delta_ = FastMalloc(size);
  //输入控制门的误差
  input_gate_delta_ = FastMalloc(size);
  //遗忘控制门的误差
  forget_gate_delta_ = FastMalloc(size);
  //输出控制门的误差
  output_gate_delta_ = FastMalloc(size);

  //这里同上
  cec_epsilon_t_ = cec_epsilon_;
  delta_t_ = delta_;
  input_gate_delta_t_ = input_gate_delta_;
  forget_gate_delta_t_ = forget_gate_delta_;
  output_gate_delta_t_ = output_gate_delta_;

  //std::cout << "input_dimension: " << input_dimension << "\toutput_dimension: " << output_dimension << std::endl;
  //假设命令是myExample-i10-M12
  //这里的input_dimension就是10,output_dimension就是12
  size = input_dimension * output_dimension;
  //这里的权值仅仅是输入层到该lstm层的
  weights_ = FastMalloc(size);
  //下面控制门的权重仅仅是输入层到控制门的
  input_gate_weights_ = FastMalloc(size);
  forget_gate_weights_ = FastMalloc(size);
  output_gate_weights_ = FastMalloc(size);
  momentum_weights_ = FastMalloc(size);
  momentum_input_gate_weights_ = FastMalloc(size);
  momentum_forget_gate_weights_ = FastMalloc(size);
  momentum_output_gate_weights_ = FastMalloc(size);

  //这部分权重是循环结构的，即前一时刻lstm层到当前时刻lstm层的连接
  size = output_dimension * output_dimension;
  recurrent_weights_ = FastMalloc(size);
  input_gate_recurrent_weights_ = FastMalloc(size);
  forget_gate_recurrent_weights_ = FastMalloc(size);
  output_gate_recurrent_weights_ = FastMalloc(size);
  momentum_recurrent_weights_ = FastMalloc(size);
  momentum_input_gate_recurrent_weights_ = FastMalloc(size);
  momentum_forget_gate_recurrent_weights_ = FastMalloc(size);
  momentum_output_gate_recurrent_weights_ = FastMalloc(size);

  //从上面的分配来看，容易知道控制门的输入来自于3部分: 1.输入层的输出 2.本层的前一时刻输出 3.来自cec状态的前一时刻输出
  //lstm层的输入自于这两部分：1.输入层的输出 2.本层的前一时刻输出

  //peephole connection,这是从cec到gate的连接
  input_gate_peephole_weights_ = FastMalloc(output_dimension);
  forget_gate_peephole_weights_ = FastMalloc(output_dimension);
  output_gate_peephole_weights_ = FastMalloc(output_dimension);
  momentum_input_gate_peephole_weights_ = FastMalloc(output_dimension);
  momentum_forget_gate_peephole_weights_ = FastMalloc(output_dimension);
  momentum_output_gate_peephole_weights_ = FastMalloc(output_dimension);
  //从这里的分配来看，能够知道lstm层内部的结构：
  //output_dimension的大小即是block的大小，每个block大小包含一个cell，一个cell里面包含一个cec
  //即output_dimension的大小就是cec个数，每个cec与三个gate连接

  //bias的设置
  bias_ = use_bias ? FastMalloc(output_dimension) : nullptr;
  input_gate_bias_ = use_bias ? FastMalloc(output_dimension) : nullptr;
  forget_gate_bias_ = use_bias ? FastMalloc(output_dimension) : nullptr;
  output_gate_bias_ = use_bias ? FastMalloc(output_dimension) : nullptr;
  momentum_bias_ = use_bias ? FastMalloc(output_dimension) : nullptr;
  momentum_input_gate_bias_ = use_bias ?
      FastMalloc(output_dimension) : nullptr;
  momentum_forget_gate_bias_ = use_bias ?
      FastMalloc(output_dimension) : nullptr;
  momentum_output_gate_bias_ = use_bias ?
      FastMalloc(output_dimension) : nullptr;
}

从代码来看，能够得到LSTM网络的结构如下图：

整个LSTM的结构是每个block（图中方框）包含一个cell(从tanh到tanh部分)，每个cell包含一个cec(图中红色圆圈) (PS: 这个图没画全，画了第一个block就已经觉的很复杂了，加上第二个估计会被连接线绕昏头了，而且比较费时，如果觉的不错，就点个赞吧，哈哈，开玩笑:D)

从代码的执行来看，容易知道每个block的输入来自于两部分：

输入层的输出
本层前一时刻block的输出

gate的输入来自于3部分:

输入层的输出
本层的前一时刻block输出
来自cec状态的前一时刻输出(对于input,forget gate而言, 对于output gate，来自于当前时刻cec输出)

cec的输入来自于两部分：

block的输入，以及input gate的输出
cec前一时刻的输出，以及forget的输出

另外LSTM结构的前向计算的顺序很重要，必须按照下面的来：

input gate, forget gate的输入输出
cell的输入
output gate的输入输出
cell的输出(这里也是block的输出)

误差的流向情况就把箭头反过来即可，这里另外提一点，在Felix提出peephole connection时，他的论文里面写到没有误差从cec通过peephole connection流向gate，但是在rwthlm里有点不一样，这里误差是流过去了的，而且peephole weight也会用BPTT学习算法来更新其权值。最后这里的学习算法是FULL BPTT，在之前Felix，Hochreiter所做实验用的LSTM网络学习算法是截断的BPTT + RTRL来进行更新的，我认为FULL BPTT反而还简单些，至少在公式看起来更容易懂吧，看前者的推导时，脑子里面一片茫然，大版大版的数学公式让我眼神恍惚诶。好啦，结合着前面写的，然后下面的lstm.cc的核心实现代码理解起来就比较容易了，带着注释贴上来，本篇完毕。

const Real *LSTM::Evaluate(const Slice &slice, const Real x[]) {
//形参x仍然表示前层的输入
  //start为真表示起始时刻
  const bool start = b_t_ == b_;

//OpenMP提供的并行功能
//下面两个section同时并行
#pragma omp parallel sections
{
//在带有peephole connection的lstm结构中,前向计算的顺序有要求
//1.先必须计算input gate和forget gate的输出
//2.计算cell输入和cec的状态
//3.计算output gate的输出
//4.计算cell的输出
#pragma omp section
  //注意这里start的作用,起始时刻时,gate输入本来是包含peephole前一时刻cec的输出,和前一时刻层的输入两部分的
  //但由于起始时刻，它们-1时刻的输出状态相当于0，这里不做计算
  //只有t>0，即非起始时刻后，才会有前一时刻的输出
  //计算input gate的输出
  EvaluateSubUnit(slice.size(),
                  input_gate_weights_,
                  input_gate_bias_,
                  start ? nullptr : input_gate_recurrent_weights_,
                  start ? nullptr : input_gate_peephole_weights_,
                  x,
                  b_t_ - GetOffset(),
                  cec_b_t_ - GetOffset(),
                  input_gate_b_t_,
                  &sigmoid_);
#pragma omp section
  //计算forget的输出
  EvaluateSubUnit(slice.size(),
                  forget_gate_weights_,
                  forget_gate_bias_,
                  start ? nullptr : forget_gate_recurrent_weights_,
                  start ? nullptr : forget_gate_peephole_weights_,
                  x,
                  b_t_ - GetOffset(),
                  cec_b_t_ - GetOffset(),
                  forget_gate_b_t_,
                  &sigmoid_);
}
  //计算cell的输入，它的输入来自于两部分,一部分是输入层，一部分是前一时刻本层的输出
  EvaluateSubUnit(slice.size(),
                  weights_,
                  bias_,
                  start ? nullptr : recurrent_weights_,
                  nullptr,
                  x,
                  b_t_ - GetOffset(),
                  nullptr,
                  cec_input_b_t_,
                  &tanh_);
  const int size = slice.size() * output_dimension();

  //cec_b_t_ <= cec_input_b_t_ * input_gate_b_t_
  //计算cec的输入
  FastMultiply(input_gate_b_t_, size, cec_input_b_t_, cec_b_t_);
  //非起始时刻执行，这里这样限制的原因是cec的输入来自于cell输入的一部分,还有cec前一状态的输出
  //如果并非起始时刻,是不存在cec前一状态的输出的
  //另外要注意,cec的结构是线性的,即为了保证误差的常数流,激活函数用的是f(x) = x
  //所以计算cec的输入后，自然也是它的输出
  if (!start) {
    //cec_b_t_ <= cec_b_t_ + forget_gate_b_t_*cec_b_(t-1)_ 
    FastMultiplyAdd(forget_gate_b_t_,
                    size,
                    cec_b_t_ - GetOffset(),
                    cec_b_t_);
  }

  //计算output gate的输出
  EvaluateSubUnit(slice.size(),
                  output_gate_weights_,
                  output_gate_bias_,
                  start ? nullptr : output_gate_recurrent_weights_,
                  output_gate_peephole_weights_,
                  x,
                  b_t_ - GetOffset(),
                  cec_b_t_,
                  output_gate_b_t_,
                  &sigmoid_);

  //这里将cec的输出拷贝到b_t_上了
  FastCopy(cec_b_t_, size, b_t_);
  //cec的输出经过tanh函数的压缩
  tanh_.Evaluate(output_dimension(), slice.size(), b_t_);
  //现在b_t_是整个cell的输出
  FastMultiply(b_t_, size, output_gate_b_t_, b_t_);

  const Real *result = b_t_;
  b_t_ += GetOffset();
  cec_input_b_t_ += GetOffset();
  cec_b_t_ += GetOffset();
  input_gate_b_t_ += GetOffset();
  forget_gate_b_t_ += GetOffset();
  output_gate_b_t_ += GetOffset();
  return result;
}

//该函数是计算lstm层的输出
void LSTM::EvaluateSubUnit(const int batch_size,
                           const Real weights[],
                           const Real bias[],
                           const Real recurrent_weights[],
                           const Real peephole_weights[],
                           const Real x[],
                           const Real recurrent_b_t[],
                           const Real cec_b_t[],
                           Real b_t[],
                           ActivationFunction *activation_function) {
  //存在偏置,复制过去,在下次计算时就相当于把偏置加上去了
  if (bias) {
    for (int i = 0; i < batch_size; ++i)
      FastCopy(bias, output_dimension(), b_t + i * output_dimension());
  }
  //b_t <= b_t + weights * x
  //这里计算层的输入
  FastMatrixMatrixMultiply(1.0,
                           weights,
                           false,
                           output_dimension(),
                           input_dimension(),
                           x,
                           false,
                           batch_size,
                           b_t);

  //非起始时刻
  //b_t <= b_t + recurrent_weights * recurrent_b_t
  //这部分层的输入来自上一时刻层的输出乘以recurrent_weights
  if (recurrent_weights) {
    FastMatrixMatrixMultiply(1.0,
                             recurrent_weights,
                             false,
                             output_dimension(),
                             output_dimension(),
                             recurrent_b_t,
                             false,
                             batch_size,
                             b_t);
  }
  //非起始时刻
  if (peephole_weights) {
#pragma omp parallel for
    for (int i = 0; i < batch_size; ++i) {
     //b_t <= b_t + peephole_weights * cec_b_t
     //这里gate的输入来自于cec的部分
      FastMultiplyAdd(peephole_weights,
                      output_dimension(),
                      cec_b_t + i * output_dimension(),
                      b_t + i * output_dimension());
    }
  }
  //上面计算的b_t_都是输入，下面这步后经过了相应激活函数，变成了输出
  activation_function->Evaluate(output_dimension(), batch_size, b_t);
}


void LSTM::ComputeDelta(const Slice &slice, FunctionPointer f) {

  //从时刻t到0
  b_t_ -= GetOffset();
  cec_input_b_t_ -= GetOffset();
  cec_b_t_ -= GetOffset();
  input_gate_b_t_ -= GetOffset();
  forget_gate_b_t_ -= GetOffset();
  output_gate_b_t_ -= GetOffset();

  // cell outputs
  //计算输出层传到lstm层的误差delta_t_
  f->AddDelta(slice, delta_t_);

  //并非句子末尾，如果当前时刻为t，要存在t+1时刻的相关计算
  if (delta_t_ != delta_) {

   //delta_t_ <= delta_t_ + recurrent_weights_ * delta_(t+1)_ 
   //即计算t+1时刻lstm层的误差传到t时刻该层的误差
    FastMatrixMatrixMultiply(1.0,
                             recurrent_weights_,
                             true,
                             output_dimension(),
                             output_dimension(),
                             delta_t_ - GetOffset(),
                             false,
                             slice.size(),
                             delta_t_);

   //delta_t_ <= delta_t_ + input_gate_recurrent_weights_ * input_gate_delta_(t-1)_
   //input gate在t+1时刻的误差传到t时刻该层
    FastMatrixMatrixMultiply(1.0,
                             input_gate_recurrent_weights_,
                             true,
                             output_dimension(),
                             output_dimension(),
                             input_gate_delta_t_ - GetOffset(),
                             false,
                             slice.size(),
                             delta_t_);

   //delta_t_ <= delta_t_ + forget_gate_recurrent_weights_ * forget_gate_delta_(t-1)_
   //forget gate在t+1时刻的误差传到t时刻该层
    FastMatrixMatrixMultiply(1.0,
                             forget_gate_recurrent_weights_,
                             true,
                             output_dimension(),
                             output_dimension(),
                             forget_gate_delta_t_ - GetOffset(),
                             false,
                             slice.size(),
                             delta_t_);

   //delta_t_ <= delta_t_ + output_gate_recurrent_weights_ * output_gate_delta_(t-1)_
   //output gate在t+1时刻的误差传到t时刻该层
    FastMatrixMatrixMultiply(1.0,
                             output_gate_recurrent_weights_,
                             true,
                             output_dimension(),
                             output_dimension(),
                             output_gate_delta_t_ - GetOffset(),
                             false,
                             slice.size(),
                             delta_t_);
  }
  //到这里delta_t_表示到达lstm层的误差，如果记L为目标函数,b为lstm层cell的输出
  //现在delta_t_存放的是∂L/∂b

  // output gates, part I
  const int size = slice.size() * output_dimension();
  //将cec的输出复制到output_gate_delta_t_
  FastCopy(cec_b_t_, size, output_gate_delta_t_);
  //cec的输出经过tanh函数，仍然存放到output_gate_delta_t_
  tanh_.Evaluate(output_dimension(), slice.size(), output_gate_delta_t_);

  // states, part I
  //cec_epsilon_t_ <= output_gate_b_t_ * delta_t_
  //这行语句是计算到达输出控制门那儿的激活函数前的误差
  FastMultiply(output_gate_b_t_, size, delta_t_, cec_epsilon_t_);
  //下面计算的是到达cec的误差，存放在cec_epsilon_t_，这只是流向cec误差的其中一部分
  tanh_.MultiplyDerivative(output_dimension(),
                           slice.size(),
                           output_gate_delta_t_,
                           cec_epsilon_t_);

  // output gates, part II
  //output_gate_delta_t_ <= output_gate_delta_t_ * delta_t_
  //这行语句是计算到达output gate的误差
  FastMultiply(output_gate_delta_t_,
               size,
               delta_t_,
               output_gate_delta_t_);
  //下面计算的是output gate的误差信号，存放在output_gate_delta_t_
  sigmoid_.MultiplyDerivative(output_dimension(),
                              slice.size(),
                              output_gate_b_t_,
                              output_gate_delta_t_);

  // states, part II
#pragma omp parallel for
  for (int i = 0; i < (int) slice.size(); ++i) {
    //cec_epsilon_t_ <= cec_epsilon_t_ + output_gate_peephole_weights_ * output_gate_delta_t_
    //这部分是output gate的误差信号流过来的
    FastMultiplyAdd(output_gate_peephole_weights_,
                    output_dimension(),
                    output_gate_delta_t_ + i * output_dimension(),
                    cec_epsilon_t_ + i * output_dimension());
  }
   //即非最末时刻
  if (delta_t_ != delta_) {
    //cec_epsilon_t_ <= cec_epsilon_t_ + forget_gate_b_(t+1)_ * cec_epsilon_(t+1)_
    //这部分是从cec的t+1时刻那儿流过来的误差
    FastMultiplyAdd(forget_gate_b_t_ + GetOffset(),
                    size,
                    cec_epsilon_t_ - GetOffset(),
                    cec_epsilon_t_);
#pragma omp parallel for
    for (int i = 0; i < (int) slice.size(); ++i) {
      //cec_epsilon_t_ <= cec_epsilon_t_  + input_gate_peephole_weights_ * input_gate_delta_(t+1)_
      //从input gate那儿流过来的误差
      FastMultiplyAdd(input_gate_peephole_weights_,
                      output_dimension(),
                      input_gate_delta_t_ - GetOffset() + i * output_dimension(),
                      cec_epsilon_t_ + i * output_dimension());
      //从forget gate那儿流过来的误差
      FastMultiplyAdd(
          forget_gate_peephole_weights_,
          output_dimension(),
          forget_gate_delta_t_ - GetOffset() + i * output_dimension(),
          cec_epsilon_t_ + i * output_dimension());
    }
  }

  // cells
  //delta_t_ <= input_gate_b_t_ * cec_epsilon_t_
  //下面两句计算cell输入处的误差信号
  FastMultiply(input_gate_b_t_, size, cec_epsilon_t_, delta_t_);
  tanh_.MultiplyDerivative(output_dimension(),
                           slice.size(),
                           cec_input_b_t_,
                           delta_t_);
 //到现在delta_t_表示cell输入处的误差信号

#pragma omp parallel sections
{
#pragma omp section
{
  // forget gates
  if (b_t_ != b_) {
    //forget_gate_delta_t_ <= cec_epsilon_t_ * cec_b_(t-1)_
    //流向forget gate的误差
    FastMultiply(cec_b_t_ - GetOffset(),
                 size,
                 cec_epsilon_t_,
                 forget_gate_delta_t_);
   //计算forget gate的误差信号
    sigmoid_.MultiplyDerivative(output_dimension(),
                                slice.size(),
                                forget_gate_b_t_,
                                forget_gate_delta_t_);
  }
}
#pragma omp section
{
  // input gates
  //input_gate_delta_t_ <= cec_epsilon_t_ * cec_input_b_t_
  //流向input gate的误差
  FastMultiply(cec_epsilon_t_,
               size,
               cec_input_b_t_,
               input_gate_delta_t_);
  //计算input gate的误差信号
  sigmoid_.MultiplyDerivative(output_dimension(),
                              slice.size(),
                              input_gate_b_t_,
                              input_gate_delta_t_);
}
}
}


//计算流向输入层的误差
void LSTM::AddDelta(const Slice &slice, Real delta_t[]) {

  //delta_t <= delta_t + weights_ * delta_t_
  //这里cell输入处的误差信号，流向输入层
  FastMatrixMatrixMultiply(1.0,
                           weights_,
                           true,
                           input_dimension(),
                           output_dimension(),
                           delta_t_,
                           false,
                           slice.size(),
                           delta_t);

  //delta_t <= input_gate_delta_t_ * input_gate_weights_ + delta_t
  //input gate的误差信号流向输入层部分
  FastMatrixMatrixMultiply(1.0,
                           input_gate_weights_,
                           true,
                           input_dimension(),
                           output_dimension(),
                           input_gate_delta_t_,
                           false,
                           slice.size(),
                           delta_t);

  //delta_t <= forget_gate_delta_t_ * forget_gate_weights_ + delta_t
  //forget gate的误差信号流向输入层部分
  FastMatrixMatrixMultiply(1.0,
                           forget_gate_weights_,
                           true,
                           input_dimension(),
                           output_dimension(),
                           forget_gate_delta_t_,
                           false,
                           slice.size(),
                           delta_t);

  //delta_t <= output_gate_delta_t_ * output_gate_weights_ + delta_t
  //output gate的误差信号流向输入层部分
  FastMatrixMatrixMultiply(1.0,
                           output_gate_weights_,
                           true,
                           input_dimension(),
                           output_dimension(),
                           output_gate_delta_t_,
                           false,
                           slice.size(),
                           delta_t);
  //t+1时刻 -> t时刻
  cec_epsilon_t_ += GetOffset();
  delta_t_ += GetOffset();
  input_gate_delta_t_ += GetOffset();
  forget_gate_delta_t_ += GetOffset();
  output_gate_delta_t_ += GetOffset();
}

const Real *LSTM::UpdateWeights(const Slice &slice,
                                const Real learning_rate,
                                const Real x[]) {
 
  const int size = slice.size() * output_dimension();
  //0到末尾时刻
  cec_epsilon_t_ -= GetOffset();
  delta_t_ -= GetOffset();
  input_gate_delta_t_ -= GetOffset();
  forget_gate_delta_t_ -= GetOffset();
  output_gate_delta_t_ -= GetOffset();
#pragma omp parallel sections
{
#pragma omp section
{
  if (bias_) {
    for (size_t i = 0; i < slice.size(); ++i) {
      //momentum_bias_ <= -learning_rate*delta_t_ +  momentum_bias_
      //这是对cell的bias的改变量累加
      FastMultiplyByConstantAdd(-learning_rate,
                                delta_t_ + i * output_dimension(),
                                output_dimension(),
                                momentum_bias_);
    }
  }
}
#pragma omp section
{
  if (input_gate_bias_) {
      //momentum_input_gate_bias_ <= -learning_rate*input_gate_delta_t_ +  momentum_input_gate_bias_
      //这是对input gate的bias改变量累加
    for (size_t i = 0; i < slice.size(); ++i) {
      FastMultiplyByConstantAdd(-learning_rate,
                                input_gate_delta_t_ + i * output_dimension(),
                                output_dimension(),
                                momentum_input_gate_bias_);
    }
  }
}
#pragma omp section
{
//momentum_forget_gate_bias_ <= -learning_rate*forget_gate_delta_t_ +  momentum_forget_gate_bias_
//这是对 forget gate的bias改变量累加
  if (forget_gate_bias_) {
    for (size_t i = 0; i < slice.size(); ++i) {
      FastMultiplyByConstantAdd(-learning_rate,
                                forget_gate_delta_t_ + i * output_dimension(),
                                output_dimension(),
                                momentum_forget_gate_bias_);
    }
  }
}
#pragma omp section
{
//momentum_output_gate_bias_ <= -learning_rate*output_gate_delta_t_ +  momentum_output_gate_bias_
//这是对 output gate的bias改变量累加
  if (output_gate_bias_) {
    for (size_t i = 0; i < slice.size(); ++i) {
      FastMultiplyByConstantAdd(-learning_rate,
                                output_gate_delta_t_ + i * output_dimension(),
                                output_dimension(),
                                momentum_output_gate_bias_);
    }
  }
}

//以上部分是计算各个bias的改变量，但并未真正改变bias
#pragma omp section
{
  //momentum_weights_ <= -learning_rate * delta_t_ * x + momentum_weights_ 
  //这是计算输入层到lstm层权重的改变量
  FastMatrixMatrixMultiply(-learning_rate,
                           delta_t_,
                           false,
                           output_dimension(),
                           slice.size(),
                           x,
                           true,
                           input_dimension(),
                           momentum_weights_);
}
#pragma omp section
{
  //momentum_input_gate_weights_<= -learning_rate * input_gate_delta_t_ * x + momentum_input_gate_weights_
  //这是计算输入层到 input gate 权重的改变量
  FastMatrixMatrixMultiply(-learning_rate,
                           input_gate_delta_t_,
                           false,
                           output_dimension(),
                           slice.size(),
                           x,
                           true,
                           input_dimension(),
                           momentum_input_gate_weights_);
}
#pragma omp section
{

  //momentum_forget_gate_weights_<= -learning_rate * forget_gate_delta_t_ * x + momentum_forget_gate_weights_
  //这是计算输入层到 forget gate 权重的改变量
  FastMatrixMatrixMultiply(-learning_rate,
                           forget_gate_delta_t_,
                           false,
                           output_dimension(),
                           slice.size(),
                           x,
                           true,
                           input_dimension(),
                           momentum_forget_gate_weights_);
}
#pragma omp section
{

  //momentum_output_gate_weights_<= -learning_rate * output_gate_delta_t_ * x + momentum_output_gate_weights_
  //这是计算输入层到 output gate 权重的改变量
  FastMatrixMatrixMultiply(-learning_rate,
                           output_gate_delta_t_,
                           false,
                           output_dimension(),
                           slice.size(),
                           x,
                           true,
                           input_dimension(),
                           momentum_output_gate_weights_);
}

#pragma omp section
{
  //momentum_recurrent_weights_<= -learning_rate * delta_t_ * b_(t-1)_ + momentum_recurrent_weights_
  //这是计算t-1时刻lstm层到 t时刻自身权重的改变量
  if (b_t_ != b_) {
    FastMatrixMatrixMultiply(-learning_rate,
                             delta_t_,
                             false,
                             output_dimension(),
                             slice.size(),
                             b_t_ - GetOffset(),
                             true,
                             output_dimension(),
                             momentum_recurrent_weights_);
  }
}
#pragma omp section
{
  //momentum_input_gate_recurrent_weights_<= -learning_rate * input_gate_delta_t_ * b_(t-1)_ + momentum_input_gate_recurrent_weights_
  //这是计算t-1时刻lstm层到 t时刻 input gate权重的改变量
  if (b_t_ != b_) {
    FastMatrixMatrixMultiply(-learning_rate,
                             input_gate_delta_t_,
                             false,
                             output_dimension(),
                             slice.size(),
                             b_t_ - GetOffset(),
                             true,
                             output_dimension(),
                             momentum_input_gate_recurrent_weights_);
  }
}
#pragma omp section
{
  //momentum_forget_gate_recurrent_weights_<= -learning_rate * forget_gate_delta_t_ * b_(t-1)_ + momentum_forget_gate_recurrent_weights_
  //这是计算t-1时刻lstm层到 t时刻 forget gate权重的改变量
  if (b_t_ != b_) {
    FastMatrixMatrixMultiply(-learning_rate,
                             forget_gate_delta_t_,
                             false,
                             output_dimension(),
                             slice.size(),
                             b_t_ - GetOffset(),
                             true,
                             output_dimension(),
                             momentum_forget_gate_recurrent_weights_);
  }
}
#pragma omp section
{
  //momentum_output_gate_recurrent_weights_<= -learning_rate * output_gate_delta_t_ * b_(t-1)_ + momentum_output_gate_recurrent_weights_
  //这是计算t-1时刻lstm层到 t时刻 output gate权重的改变量
  if (b_t_ != b_) {
    FastMatrixMatrixMultiply(-learning_rate,
                             output_gate_delta_t_,
                             false,
                             output_dimension(),
                             slice.size(),
                             b_t_ - GetOffset(),
                             true,
                             output_dimension(),
                             momentum_output_gate_recurrent_weights_);
  }
}

//注意上面改变分为三部分：1.计算bias的改变量 2.计算输入层到cell各部分的权值改变量 3.计算t-1时刻cell到t时刻cell各部分权重改变量

}

#pragma omp parallel sections
{
#pragma omp section
{
  if (b_t_ != b_) {

    // destroys ..._gate_delta_t_, but this will not be used later anyway
    //input_gate_delta_t_ <= -learning_rate*input_gate_delta_t_
    //下面计算后，就破坏了input gate的误差信号值了，不过后面也不会再使用了。
    FastMultiplyByConstant(input_gate_delta_t_,
                           size,
                           -learning_rate,
                           input_gate_delta_t_);
    for (size_t i = 0; i < slice.size(); ++i) {
      //momentum_input_gate_peephole_weights_ <= momentum_input_gate_peephole_weights_ + input_gate_delta_t_ * cec_b_(t-1)_
      //计算 input gate到cec的权值改变量
      FastMultiplyAdd(input_gate_delta_t_ + i * output_dimension(),
                      output_dimension(),
                      cec_b_t_ - GetOffset() + i * output_dimension(),
                      momentum_input_gate_peephole_weights_);
    }
  }
}
#pragma omp section
{
  if (b_t_ != b_) {
    //forget_gate_delta_t_ <= -learning_rate*forget_gate_delta_t_
    FastMultiplyByConstant(forget_gate_delta_t_,
                           size,
                           -learning_rate,
                           forget_gate_delta_t_);
      //momentum_forget_gate_peephole_weights_ <= momentum_forget_gate_peephole_weights_ + forget_gate_delta_t_ * cec_b_(t-1)_
      //计算 forget gate到cec的权值改变量
    for (size_t i = 0; i < slice.size(); ++i) {
      FastMultiplyAdd(forget_gate_delta_t_ + i * output_dimension(),
                      output_dimension(),
                      cec_b_t_ - GetOffset() + i * output_dimension(),
                      momentum_forget_gate_peephole_weights_);
    }
  }
}
#pragma omp section
{
    //output_gate_delta_t_ <= -learning_rate*output_gate_delta_t_
  FastMultiplyByConstant(output_gate_delta_t_,
                         size,
                         -learning_rate,
                         output_gate_delta_t_);
      //momentum_output_gate_peephole_weights_ <= momentum_output_gate_peephole_weights_ + output_gate_delta_t_ * cec_b_(t-1)_
      //计算 forget gate到cec的权值改变量
  for (size_t i = 0; i < slice.size(); ++i) {
    FastMultiplyAdd(output_gate_delta_t_ + i * output_dimension(),
                    output_dimension(),
                    cec_b_t_ + i * output_dimension(),
                    momentum_output_gate_peephole_weights_);
  }
}
}

  const Real *result = b_t_;
  // let b_t_ point to next time step
  //朝下一个时刻走
  b_t_ += GetOffset();
  cec_input_b_t_ += GetOffset();
  cec_b_t_ += GetOffset();
  input_gate_b_t_ += GetOffset();
  forget_gate_b_t_ += GetOffset();
  output_gate_b_t_ += GetOffset();
  return result;
}

网络运维学习笔记（DeepSeek优化版） 018 HCIA-Datacom综合实验03 技术小齐网络运维学习
文章目录综合实验3实验需求一：A公司网络规划二：B公司网络规划配置一、ip、vlan、vlanif，stp、eth-trunkSW1SW2R1二、ospfSW1R1三、NATR1ISP四、拒绝ping允许httpSW1五、右半部分vlan、dhcp、ospf、NATSW4R2综合实验3实验需求一：A公司网络规划SW1/2/3组成了A公司的交换网络，其中SW1是核心层，SW2/3是接入层。三台交换机
【NLP】 5. Word Analogy Task（词类比任务）与 Intrinsic Metric（内在度量） pen-ai NLP 机器学习自然语言处理 word 人工智能
WordAnalogyTask（词类比任务）定义：WordAnalogyTask是用于评估词向量质量的内在指标（IntrinsicMetric）。该任务基于这样的假设：如果词向量能够捕捉单词之间的语义关系，那么这些关系应该能够在向量空间中保持一定的结构。示例：在一个理想的词向量空间中，单词之间的关系应该满足如下等式：king−man+woman≈queenking−man+woman≈queenk
Manus（一种AI代理或自动化工具）与DeepSeek（一种强大的语言模型或AI能力）结合使用任务自动化和智能决策 zzlyx99 人工智能自动化语言模型
一、Manus与DeepSeek差异十分好奇DeepSeek和Manus究竟谁更厉害些，DeepSeek是知识型大脑，Manus则是全能型执行者。即DeepSeek专注于语言处理、知识整合与专业文本生成。其核心优势在于海量参数支持的深度学习和知识推理能力，例如撰写论文、润色法律合同、解答专业问题等。Manus则更强调从规划到交付的闭环能力。它通过工具链调用（如浏览器、代码编辑器）自主执行复杂任务，
强化学习:时间差分(TD)(SARSA算法和Q-Learning算法)(看不懂算我输专栏)——手把手教你入门强化学习(六) wxchyy 强化学习算法
目录前言前期回顾一、SARSA算法二、Q-Learning算法三、总结总结前言前两期我们介绍了动态规划算法，还有蒙特卡洛算法，不过它们对于状态价值函数的估值都有其缺陷性，像动态规划，需要从最下面向上进行递推，而蒙特克洛则需要一个Episode(回合)结束才能对其进行估值，有没有更直接的方法，智能体能边做动作，边估值一次，不断学习策略？答案是有的。这就是本期需要介绍的算法，时间差分法（TimeDi
VSCode 接入DeepSeek V3大模型，附使用说明猫猫姐大模型 vscode ide deepseek
VSCode接入DeepSeekV3大模型，附使用说明由于近期DeepSeek使用人数激增，服务器压力较大，官网已暂停充值入口，且接口响应也开始不稳定，建议使用第三方部署的DeepSeek，如硅基流动或者使用其他模型/插件，如豆包免费AI插件MarsCode、阿里免费AI插件TONGYILingma或者一步到位，使用完全体的AI编辑器Cursor(收费，每月$20，2周试用)/Trae(完全免费，
DeepSeek+元脑企智大模型一体机（培训交流）互联网之路. deepseek
互联网各领域资料分享专区(不定期更新)：Sheet获取方式：请用手机点击链接进行保存，会自动赠送1TB内存，若链接生效请及时后台留言，谢谢。链接如下（夸克网盘）：夸克网盘分享免责声明：1）所共享的所有内容均来源于网络共享资源，版权归原作者或企业所有，下载的任何资源仅能用于学习和研究目的，请勿用于商业用途，否则后果自负。2）尊重版权，这些资源仅供个人学习和交流使用，请勿用于商业用途。本文档仅做整理。
大规模语言模型从理论到实践开源指令数据集 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践开源指令数据集1.背景介绍大规模语言模型（LargeLanguageModels,LLMs）近年来在自然语言处理（NLP）领域取得了显著的进展。诸如GPT-3、BERT等模型在各种任务中表现出色，从文本生成到翻译，再到问答系统，几乎无所不能。这些模型的成功离不开庞大的训练数据集和复杂的算法架构。然而，如何有效地构建和利用开源指令数据集，仍然是一个值得深入探讨的话题。2.核
使用Python和LangChain创建可调用工具的智能对话机器人：全面指南 m0_57781768 python langchain 机器人
使用Python和LangChain创建可调用工具的智能对话机器人：全面指南在当今技术迅猛发展的时代，人工智能（AI）和自然语言处理（NLP）技术的应用范围越来越广。尤其是对话机器人，它们不仅能与人类进行自然交互，还能通过调用外部API与各种系统对接，为用户提供更加智能和灵活的服务。本文将通过一系列实例和代码演示，向您展示如何利用Python编程语言和LangChain框架，创建能够使用外部工具（
2025年移动端技术探索-DeepSeek这么说轻口味移动端移动端 Android HarmonyOS HarmonyOSNext iOS AI DeepSeek
随着移动互联网的逐步成熟，从增量市场向存量市场过度，对于开发的需求量大减，技术层面和业务层面的的需求量都很乏力。而且随着AI的发展，知识门槛基本消失，技能门槛也在缩短，从移动互联网向AI时代过度期间，更加比拼业务比拼创意，希望用AI重新改造某个行业。移动端方向整个24年最大的需求量是鸿蒙，2024年被称为“原生鸿蒙关键年”，华为联合头部企业（如中国移动、美团、百度等）加速构建独立生态，预计2024
主流开源大模型能力对比矩阵时光旅人01号人工智能开源 python 深度学习 pytorch
模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练ChatGLM-3✅多轮对话支持✅中英双语流畅✅对话记忆优秀⚠️计算资源消耗大⚠️长文本易发散DeepSeek✅代码注释生成✅技术文档规范✅全流程方案生成⚠️逻辑错误较多⚠️数据更新延迟
智能编程新时代：DeepSeek加持下的开发工具革新 inscode_013
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE标题：智能编程新时代：DeepSeek加持下的开发工具革新在当今快速发展的科技领域，编程工具的智能化已经成为不可阻挡的趋势。随着人工智能技术的不断进步，开发者们迎来了前所未有的机遇和挑战。其中，集成DeepSeek模型的AI开发工具，正以其强大的功能和便捷的操作，引领着编程方式的革命性变革。本文将探讨这种创新工具的应用场景
智能编程新时代：DeepSeek加持下的开发利器 inscode_099
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智能编程新时代：DeepSeek加持下的开发利器在当今快速发展的科技时代，编程工具的智能化已经成为不可阻挡的趋势。随着人工智能技术的不断进步，开发者们不再满足于传统的IDE（集成开发环境），而是渴望更加智能、高效的开发工具。在这种背景下，一款集成了DeepSeek-V3模型的AI开发工具应运而生，它不仅能够大幅提升开发效率
智能化编程新时代，DeepSeek加持下的开发革命 ObsidianRaven13
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE标题：智能化编程新时代，DeepSeek加持下的开发革命随着人工智能技术的飞速发展，编程领域正迎来一场前所未有的变革。从传统的手动编码到如今的智能辅助开发，这一过程不仅极大地提升了开发效率，还让编程变得更加简单和高效。在众多新兴工具中，基于DeepSeek模型的智能编程助手正在成为开发者的新宠。今天，我们将探讨这种工具如何
智能化开发新时代：DeepSeek加持下的编程革命 MoonbeamOwl67
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE标题：智能化开发新时代：DeepSeek加持下的编程革命在当今快速发展的科技时代，软件开发已经成为推动社会进步的重要动力。然而，对于许多开发者而言，编写高质量的代码仍然是一项充满挑战的任务。从复杂的算法设计到繁琐的调试过程，每一个环节都需要耗费大量的时间和精力。而随着人工智能技术的迅猛发展，一种全新的编程方式正在悄然改变这
如何用deepseek炒股 Real Man★ python 机器学习人工智能
使用DeepSeek进行炒股的核心思路是利用其强大的数据处理和预测能力，辅助投资决策。以下是具体的应用方法和步骤：一、数据收集与处理获取市场数据股票数据：通过API（如Tushare、YahooFinance）获取历史股价、成交量、财务数据等。新闻与舆情：使用DeepSeek的NLP能力分析新闻、社交媒体和公告，提取市场情绪和事件影响。宏观经济数据：收集GDP、利率、通胀等数据，分析其对股市的影响
DeepSeek结合Python炒股：编写量化交易策略的5个关键技巧财云量化程序化交易量化交易 python炒股自动化 python DeepSeek 股票量化接口股票程序化交易
python炒股(0):申请官方API接口,个人账户无门槛python炒股自动化(1):量化交易接口区别Python炒股自动化(2):取股票实时数据和历史数据Python炒股自动化(3):分析实时数据和历史数据Python炒股自动化(4):通过接口向交易所报单炒股自动化(5):通过接口查单查账炒股自动化：散户也可以申请官方API接口量化交易的核心在于将策略思想转化为可执行的代码，本文结合券商的AP
你的AI客服为何总抓不住客户核心诉求？（附特征优化方案）人工智能
1特征工程的意义nlp任务中，原始文本经数值映射后形成的词向量序列，难充分表达语言深层语义特征。就需引入文本特征增强技术：语义信息补全：突破单词语义局限，捕获词序关联特征模型适配优化：构建符合算法输入规范的矩阵结构评估指标提升：通过特征增强直接影响模型准确率、召回率等核心KPI如电商评论情感分析场景，单纯用词频特征可能导致"这个手机质量差得惊人"和"这个手机质量惊人地差"被判定为相同语义，此时bi
Deepseek 使用攻略隔窗听雨眠人工智能
人工智能飞速发展的时代，新的技术和工具不断涌现，Deepseek便是其中备受瞩目的存在。它以强大的功能和出色的表现，吸引了众多用户的关注。今天，就让我们一起来深入了解一下Deepseek究竟是什么，以及如何使用它。一、什么是DeepseekDeepseek（深度求索）是一家位于杭州的人工智能公司，同时也是一系列大语言模型的统称。它由中国对冲基金高毅资产创立并提供支持，其模型均以开源形式发布。Dee
NLP复习3，手撕多头attention 地大停车第二帅 NLP学习自然语言处理人工智能
importmathimporttorchimportcollectionsimportnumpyasnpimporttorch.nnasnnclassMultiHeadAttention(nn.Module):def__init__(self,heads,d_model,dropout=0.1):super().__init__()#输入的特征维度self.d_model=d_model#每个头
基于 KTransformers的DeepSeek-R1 本地部署方案，成本骤降32倍！爱科技Ai LLM 人工智能
随着DeepSeek-R1模型在全球范围内的流行，越来越多的用户开始在本地尝试部署该模型。然而，高昂的硬件需求和成本让许多公司望而却步。本文将深入探讨DeepSeek-R1部署中的挑战，并介绍一款创新框架KTransformers，它能够显著降低大规模模型部署的成本并提高推理效率，从而帮助更多中小企业有效部署此类高级AI模型。本地部署“成本骤降32倍”，助力R1真正落地「中小企业」中！1.Deep
深度学习 Deep Learning 第2章线性代数 odoo中国 AI编程人工智能深度学习线性代数人工智能
深度学习第2章线性代数线性代数是深度学习的语言。张量操作是神经网络计算的基石，矩阵乘法是前向传播的核心，范数约束模型复杂度，而生成空间理论揭示模型表达能力的本质。本章介绍线性代数的基本内容，为进一步学习深度学习做准备。主要内容2.1标量、向量、矩阵和张量标量：单个数字，用斜体表示，通常赋予小写字母变量名。向量：数字数组，按顺序排列，用粗体小写字母表示，元素通过下标访问。矩阵：二维数字数组，用粗体大
DeepSeek-辅助NS3学习和功能调试 wenxin- 学习 php 开发语言 DeepSeek NS3
文章目录一、前言二、DeepSeek回答**1.MAC层替换导致的兼容性问题****可能原因**：**验证方法**：**2.路由表未正确建立****可能原因**：**验证方法**：**3.LR-WPAN物理层限制****可能原因**：**验证方法**：**4.AODV协议配置错误****可能原因**：**验证方法**：**5.网络层与MAC层地址映射问题****可能原因**：**验证方法**：**
TidyBot++：用于机器人学习开源的完整移动机械手三谷秋水计算机视觉智能体人工智能机器人开源人工智能机器学习深度学习
24年12月来自普林斯顿、斯坦福和dexterity.ai的论文“TidyBot++:AnOpen-SourceHolonomicMobileManipulatorforRobotLearning”。要充分利用模仿学习在移动机械操作方面的最新进展，需要收集大量人工引导的演示。本文提出一种开源设计，用于设计一种廉价、坚固、灵活的移动机械手，该机械手可支撑任意臂，从而实现各种现实世界的家用移动机械操作
程序员必看！DeepSeek全栈开发指南：从代码生成到分布式训练的黑科技解析 AI创享派后端
一、DeepSeek技术新突破：程序员必须掌握的MoE架构实战2025年2月25日，DeepSeek开源了专为MoE模型设计的DeepEP通信库，这项技术革新直接影响了分布式训练和推理效率。该库支持FP8精度与NVLink/RDMA技术，吞吐量提升3倍以上，特别适合处理千亿级参数的分布式任务。对于后端工程师而言，DeepEP的以下特性值得关注：计算-通信重叠机制：通过回调函数实现GPU资源动态分配
DeepSeek：全栈开发者视角下的AI革命者大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能
DeepSeek：全栈开发者视角下的AI革命者写在前面随着人工智能（AI）技术的不断进步，AI已经成为各行各业创新的核心动力。从自动驾驶到智能制造，再到自然语言处理和图像识别，AI正在逐渐渗透并改变着我们的生活和工作方式。DeepSeek，作为AI领域的新兴技术，凭借其独特的技术架构和颠覆性的创新理念，成为了全栈开发者关注的焦点。本文将从全栈开发者的角度出发，详细解析DeepSeek的诞生、技术架
Assembly语言的自然语言处理花韵婷包罗万象 golang 开发语言后端
Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
大语言模型原理与工程实践：大语言模型强化对齐 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：大语言模型强化对齐作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的迅猛发展，大语言模型（LargeLanguageModels，LLMs）如GPT-3、LaMDA等，在自然语言处理（NLP）领域取得了显著的突破。这些模型在问答、翻译、文本生成等方面展现出惊人的能力，但同时也引发了
第20篇：从零开始构建NLP项目之电商用户评论分析：模型训练阶段 Gemini技术窝自然语言处理人工智能深度学习 AIGC 机器学习 nlp langchain
大家好，今天我们继续探讨如何从零开始构建一个NLP项目，特别是电商用户评论分析中的模型训练阶段。模型训练是NLP项目的核心环节，通过合理的调参和优化，可以显著提升模型性能。本文将详细介绍模型训练的步骤，并展示如何使用LangChain库进行模型训练、调参和优化。文章目录项目的背景和目标模型训练的详细步骤安装依赖包流程图1.准备数据2.定义模型3.训练模型4.评估模型5.调参与优化常见错误和注意事项
高效快速教你deepseek如何进行本地部署并且可视化对话 chatgpt
随着最近一个新的人工智能deepseek的爆火，很多大佬都开始了在本地进行deepseek的部署操作，并且离线也可以使用，这里的话我就一步一步带你们部署本地的deepseek,说实话这个人工智能的实力不亚于openai的gpt安装ollama我们需要先安装ollama，安装地址ollama,我们直接点击下载，我们在下载的时候尽量使用我们的谷歌浏览器，有魔法的最好带上魔法，不然安装的时候可能会出问题
NLP-二分类的应用-区分外卖评论好评/差评左岸Jason 算法 python kafka flink elasticsearch
目录一、概念二、二分类实战-划分好评/差评1.处理步骤2.实战代码一、概念文本分类一般可以分为二分类、多分类、多标签分类三种情况。二分类是指将一组文本分成两个类(0或1),比较常见的应用如垃圾邮件分类、电商网站的用户评价数据的正负面分类等,多分类是指将文本分成若干个类中的某一个类,比如说门户网站新闻可以归属到不同的栏目中(如政治、体育、社会、科技、金融等栏目)去。多标签分类指的是可以将文本分成若干
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

rwthlm分析(五)之LSTM结构

你可能感兴趣的:(Deep,learning,NLP)